Természetes nyelvek feldolgozása Natural language processing(NLP)

Slides:



Advertisements
Hasonló előadás
Természetes nyelvek feldolgozása Natural language processing(NLP)
Advertisements

A fogyasztóvédelmi hatóság hatásköre, illetékessége és eljárása a villamosenergia-, földgáz-, víziközmű-, távhő- és hulladékgazdálkodási közszolgáltatás.
A felhasználói interfész A felhasználói interfész az a felület, amellyel a szoftver az ember felé „fordul”; amellyel a felhasználó nap mint nap találkozik.
A képzett szakemberekért SZMBK KERETRENDSZER 2.1. előadás.
MIBŐL VALÓSULHATNAK MEG A HELYI STRATÉGIÁK? REGIONÁLIS PÁLYÁZATI FORRÁSOK.
TÖRTÉNELEM ÉRETTSÉGI A VIZSGA LEÍRÁSA VÁLTOZÁSOK január 1-től.
Szabadtéri rendezvények. A TvMI vonatkozik: OTSZ szerinti szabadtéri rendezvényekre szabadtéri rendezvény: az 1000 főt vagy az 5000 m 2 területet meghaladó,
Útmutató az adatbázis használatához. − 1957 – ODK - Orvostudományi Dokumentációs Központ − 1960-tól: OOKDK - Országos Orvostudományi Könyvtár és Dokumentációs.
2011. évi zárás Készítette: Juhász Ágnes. 1. Zárást megelőző feladatok  Leltározás  Folyószámla egyeztetés (kapcsolt vállalkozásoktól egyenlegkérés)
Számvitel S ZÁMVITEL. Számvitel Hol tartunk… Beszámoló –Mérleg –Eredménykimutatás Értékelés – – – –2004- –Immateriális javak,
Intézmények közötti egyéni átvezetést segítő programok.
Az IKER önértékelő IKER társadalmasítás workshop Budapest, április 12.
1 Az önértékelés mint projekt 6. előadás 1 2 Az előadás tartalmi elemei  A projekt fogalma  A projektek elemei  A projekt szervezete  Projektfázisok.
Hogyan teljesíthetjük a HpT 13§B követelményeit Egy vállalati Compliance Adatbázis terve Dr Lőrincz István Associator Kft.
A korai beavatkozás pszichológiai vonatkozásai rizikó csecsemők (0-3 év) és családjuk ellátásában Készítette: Fadgyas-Székely Orsolya ELTE BGGYK MA levelező.
„ Tágas városom kis lakásra cserélem” Hajléktalanok önálló lakhatásának elősegítése, munkaerő-piaci integrációjának megalapozása TÁMOP /
2. A szoftverek csoportosítása: a. Rendszerszoftverek: A számítógép zavartalan mûködését biztosítják: BIOS (alapvetõ bemeneti/kimeneti rendszer): olyan.
Informatikai rendszerek általános jellemzői 1.Hierarchikus felépítés Rendszer → alrendszer->... → egyedi komponens 2.Az elemi komponensek halmaza absztrakciófüggő.
1. 2 káros tartalmak típusai és előfordulásuk a gyerekek védelmét biztosító szabályok, a felelősség kérdése a korhatár-kategóriák megítélése, a besorolás.
Befolyásolásra törő kommunikáció. Az emberi kommunikáció egyik sajátossága és törekvése a befolyásolás. A befolyásolás tartalmi jellege és megjelenési.
KÉPZŐ- ÉS IPARMŰVÉSZET ISMERETEK ÁGAZATI SZAKMAI ÉRETTSÉGI VIZSGA (középszintű) május-június.
Gazdasági informatika - bevezető
Reflexiók a társadalmi és a nonbusiness marketing fogalmi kérdéseihez
vizuális megismerés – vizuális „nyelv” vizuális kultúra
Összevont munkaközösség vezetői és igazgatótanácsi értekezlet
Adattárház fejlesztés módszertani tapasztalatok a HIFI-ben
2. előadás Viszonyszámok
Kihívások a LEADER program eredményes végrehajtásában
Program utasítássorozat
1. dia A szakdolgozat címe
376/2014 EU RENDELET BEVEZETÉSÉNEK
Adatok importálása, rendezése és szűrése
Kockázat és megbízhatóság
Kompetenciák az osztott tanárképzésben
SZÁMVITEL.
Kommunikáció a könyvvizsgálatban
A pedagógus-életpályamodell, a minősítés rendszere
Colorianne Reinforce-B
Hipotézisvizsgálat.
KOSSUTH LAJOS KÖZOKTATÁSI INTÉZMÉNY OROSHÁZA
Tájékoztató a évi OSAP teljesüléséről
Az Európai Unió gazdasági joga Versenyjog 2
Innovációs képesség és jólét összefüggései
A létminimum-számítás megújítása
Közigazgatási alapvizsga a Probono rendszerben
Rendszerfejlesztés gyakorlat
Miért pont a BME, hogyhogy a VIK?
Felhasználóképzés a kórházban
Számítógépes szimulációval segített tervezés
Kalickás forgórészű aszinkronmotor csillag-delta indítása
Sajben - Kenyeres Márta munkaközösség-vezető
A villamos installáció problémái a tűzvédelem szempontjából
Környezeti Kontrolling
Új pályainformációs eszközök - filmek
Zanáné Haleczky Katalin október 09.
A kutatási projekt címe Név Oktató neve Tanulmányi intézmény neve
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL I. HELYZETFELMÉRŐ SZINT FOLYAMATA 8
I. HELYZETFELMÉRÉSI SZINT FOLYAMATA 3. FEJLESZTÉSI FÁZIS 10. előadás
Együtt Nyírbátorért Helyi Közösség
SQL jogosultság-kezelés
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL I. HELYZETFELMÉRŐ SZINT FOLYAMATA 7
Áramlástan mérés beszámoló előadás
JAVA programozási nyelv NetBeans fejlesztőkörnyezetben I/13. évfolyam
GDPR – Adatvédelmi kihívások a könyvtárakban
LIA Alapítványi Ált. Isk. és Szki. Piliscsabai Tagintézménye
Pszichológia BA műhelymunka és szakdolgozat tájékoztató
A részekre bontás tilalma és annak gyakorlati alkalmazása
AC/DC Találd meg a helyed! Előadó: Fodor Ágnes, a VGYKE elnöke
Üzlezi információelemző specializió
Az operációs rendszer definíciója
Előadás másolata:

Természetes nyelvek feldolgozása Natural language processing(NLP) A természetes nyelvek feldolgozása, megértése az MI fontos kutatási területe az ember-gép kommunikáció emberközelibbé tétele érdekében Nehézségek: a nyelv szavainak, nyelvtani szabályainak alapos ismerete e tudás integrálása a világról szóló más tudással a partner saját céljainak, miénktől eltérő hiedelmeinek figyelembevétele

A nyelvek csoportosítása: Szabályos nyelvek, pl egy programozási nyelv Szövegösszefüggés-nélküli (context free) nyelvek. Chomsky : „Colorless green ideas sleep furiously”. Általános v. természetes nyelvek A természetes nyelvek végtelenek, az összes megengedett mondatot nem tudjuk felírni, de kell egy leírás a mondatok általános struktúrájáról, ami alapján eldönthetjük, hogy egy adott mondat megengedett-e a vizsgált nyelvben vagy sem. Ha van is ilyen eljárásunk, nem biztos, hogy azzal közelebb jutunk a nyelv megértéséhez. Egy intelligens programnak legalább olyan szinten meg kell értenie egy mondatot, hogy értelmesen válaszolni tudjon rá.

A nyelvi elemzés szintjei: szintaktikai: jelzi, hogy a mondat a nyelv része szemantikai: a mondat szintaktikájának megfelelően kombinálva az egyes szavak jelentését az egész mondat nyer egyfajta jelentést pragmatikai: a szövegkörnyezetbe helyezve a mondatot, megtudjuk, hogy értelmezésünk helyes volt-e, vagy attól eltérő jelentésről van szó (pl. „olajra lépett” egy háztartási baleset leírásában illetve a bűnügyi krónikában.) intencionális szint: a beszélő szándékát, elképzeléseit, hitét, célját sem hagyhatjuk figyelmen kívül az árnyalt jelentés megértéséhez

Alkalmazások 1.Természetes nyelvű interfész (NLI) adatbázishozzáférés megkönnyítésére: a felhasználó természetes nyelven feltett kérdését az NLI lekérdező nyelvű kérdéssé alakítja, melyre választ kapunk az adatbázisból, természetes nyelven az NLI jóvoltából. Például: LUNAR(1973):Mi az átlagos modális plagioklász koncentráció a rubídiumot tartalmazó holdminták esetén? típusú kérdésekre képes volt választ adni. Problémák: a kérdések megfelelő megfogalmazásán múlik a siker a párbeszéd kontextusát követnie kellene a programnak („mikor indul az utolsó gép Londonba?…..pontos válasz……….És az azelőtti?… nincs válasz”)

2. Gépi fordítás Jelentős siker az erősen specifikus nyelvi feladatok esetén, például a montreáli egyetemen kifejlesztett TAUM-METEO rendszer, mely időjárásjelentést fordít angolról franciára. Bonyolultabb szöveg esetén is gazdaságos géppel egy nyers fordítást készíttetni, amit majd anyanyelvi lektor korrigál (olcsóbb, mint egy kétnyelvű fordítót megfizetni). Másik lehetőség az eredeti szöveg előeditálása, egyszerűsítése, a nyelvi eszközök redukálása révén, úgy, hogy a gépi fordítás után már ne legyen szükség utólagos korrekcióra. Például nemzetközi piacokra termelő cégek termékeihez adott ismertetők (a Xerox gépkönyveit végre megérthették azok is, akik eredetiben olvasták). MÓDSZEREK Szimbolikus módszer a szókészletre, nyelvtanra vonatkozó lehető legtöbb információ bevitelével Statisztikai módszer: párhuzamos szövegek valószínűségi-statisztikai elemzése alapján keres párokat, szavak helyett kifejezésekre koncentrálva (Giza++ programcsomag)

3. Szövegértelmezés a szükséges információk kiemelése, besorolása, megszűrése adott szövegekből információ-visszakeresés szövegkategorizálás adatok kinyerése szövegekből

A Loebner-verseny Loebner a Turing-teszt gyakorlati megvalósítójának tűzött ki díjat (100000 dollár), azaz az emberrel azonos szintű, attól megkülönböztethetetlen válaszokat adó gép számára. Limitált teszt: 25000 dollár. Bronzérem: az évi verseny győztesének 2000 dollár. Előzmény: Joseph Weizenbaum Eliza nevű programja 1966-ból, mely az ember által begépelt mondatokat manipulálva látszólag intelligens válaszokat adott. A Loebner díj egyik nyertese Ella, akivel társaloghatunk a www.ellaz.com honlapon a Talk to Ella menüpontot kérve (már egy Single session talk is nagy élmény!) Magyar társalgórobotok: Frenezis Beatrix Lafoxka

A NetNLP program használata Általános szabályok : 1. 1 Ha a mondat állítás, ponttal kell lezárni. 1. 2 Ha a mondat kérdés, kérdőjellel kell lezárni. 1. 3 Speciális állítások a parancsok (lásd parancsok). Állításokra vonatkozó szabályok: 2. 1 Individual IS Class. 2. 2 Class IS Class. 2. 3 Individual's Slot IS Filler. 2. 4 Class's Slot IS Filler. Kérdésekre vonatkozó szabályok: 2. 5 IS Individual Class? 2. 6 IS Class Class? 2. 7 IS Individual's Slot Filler? 2. 8 IS Class's Slot Filler? 2. 9 WHAT IS Individual's Slot? 2.10 WHAT IS Class's Slot? Egyéb szabályok: 3. 1 Individual -> Objektum 3. 2 Class -> A Objektum 3. 3 Class -> AN Objektum 3. 4 Slot -> Objektum 3. 5 Filler -> Objektum

Használható parancsok: QUIT. EXIT. CLOSE. - kilépés NEW. - hálózat törlése OPEN. - hálózat feltöltése fájlból SAVE. - hálózat mentése fájlba NETWORK INFORMATION. NETINFO. - hálózatinformáció CLEAR DESKTOP. - a felület tartalmának törlése SAVE HISTORY. - a history mentése szöveges fájlba SAVE COMMANDS. - a parancslista mentése szöveges fájlba HELP. - súgó ABOUT. - névjegy

Lehetséges példamondatok Peter is a boy. A boy is a young.man. Raul is a boy. A young_man is a human_being. Sarah is a girl. A girl is a young_woman. A young woman is a human_being. Sara's hair is brown. Raul's mouth is red. Peter's mouth is pink. Raul's hair is black. Black is a colour. Pink is a colour. Red is a colour. A colour is a feature. A boy's head is big. A human being's life is long. Lehetséges kérdések Is Peter a young man? Is Raul’s head big? What is Peter life?…etc