Természetes nyelvek feldolgozása Natural language processing(NLP)

Slides:



Advertisements
Hasonló előadás
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
Advertisements

Operációs rendszerek Bevezetés.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Az Internet elterjedése Lakossági felhasználás. Internet terjedése.
Internet ismeretek II..
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
K-Chat Dr. Szepesvári Csaba Kutatási Alelnök mindmaker.
A BNO10 formális formális reprezentálása a GALEN alapján
I. Informatikai alapismeretek Dabas, november 18.
Piacképes programozói tudás a középiskolában
WordLearner.com -- Learn or Teach Words in Almost Any Language WordLearner.com online és offline nyelvoktatás mobiltelefonon és interneten Benedek Balázs.
Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.
2012. tavaszi félév Vitéz Gergely. A diasor ismerete nem helyettesíti a tankönyvet, és a példatárat. A diasor ismerete szükséges, de nem elégséges feltétele.
Szemiot i ka.
Út a beszédértéstől a szövegértésen keresztül a matematikai problémák megoldásáig Előadó: Horváth Judit.
Képességszintek.
3. A programozás eszközei, programozás-technikai alapismeretek
Kétértékűség és kontextusfüggőség Kijelentéseink igazak vagy hamisak (mindig az egyik és csak az egyik) Kijelentés: kijelentő mondat (tartalma), amivel.
13.a CAD-CAM informatikus
Logika Érettségi követelmények:
OSI Modell.
Szintaktikai elemzés február 23..
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
MI 2003/5 - 1 Tudásábrázolás (tudásreprezentáció) (know- ledge representation). Mondat. Reprezentá- ciós nyelv. Tudás fogalma (filozófia, pszichológia,
 A nyelv megismerése mint  Kommunikációs eszköz  A tanulás eszköze  Árnyalt és reflexív ismeretek a nyelvről  A társadalom belső kohéziójának.
Rendszer és modell szeptember-december Előadó: Bornemisza Imre egyetemi adjunktus.
A szövegértés diagnosztizálása és fejlesztése
1. előadás. 1.) Szoftverfejlesztés, mint mérnöki tevékenység. Számítási eszközfejlődés. Számítási eszközfejlődés: hazai viszonyok. Mérföldkő: Simula 67.Klasszikus.
1. előadás. 1.) Szoftverfejlesztés, mint mérnöki tevékenység. Számítási eszközfejlődés. Számítási eszközfejlődés: hazai viszonyok. Mérföldkő: Simula 67.Klasszikus.
© Kozsik Tamás Csomagok. © Kozsik Tamás A program tagolása Típusdefiníciók (osztályok, interfészek) Metódusok Blokk utasítások Csomagok.
1 1 1.
Bevezetés a terminológiába. input output Gépi feldolgozás Jelentés- független Jelentés- függő Információfeldolgozás.
A nyelv problémája természetes, és mesterséges nyelvek.
P ROGRAMOZÁS C# - BAN Kivételkezelés. P ÉLDA I. Nullával való osztás miatt kapjuk a hibaüzenetet.
A kontextus hatása a kollokációk megértésére Csiszár Orsolya ELTE Nyelvtudományi Doktori Iskola.
Megoldottuk a számítógép nyelvét... Prószéky Gábor MTA, november 4. MTA, november 4.
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
Funkcionális programozás 2. gyakorlat
Hasznos információk a kétszintű kémia érettségiről
Szemantikus keresők.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Szintaktikai, szemantikai szabályok
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
A nyelv, mint jelrendszer
A szövegértési feladatok összeállítása
A szövegértési feladatok összeállítása
Logika szeminárium Előadó: Máté András docens Demonstrátorok:
Komoróczy Tamás 1 Java programozási nyelv A nyelv alapjai.
A gyakorlatok munkakörnyezete
Gondolkodjunk el ! Zene A változások már léteznek!
Nicsak, ki beszél – már a számítógépek is... Szita István Eötvös Collegium.
Bevezetés Előadó: Blasszauer János Kaposvár, január 14.
Logika szeminárium Előadó: Máté András docens Demonstrátorok:
Kapcsolatok ellenőrzése
A szövegértés diagnosztizálása és fejlesztése
Prof. Dr. Neményi Miklós tudományos és külügyi rektorhelyettes A doktori és publikációs adatbázis kialakításának elvei és megvalósítása Nyugat-magyarországi.
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
A KÖZBESZERZÉSEKET TÁMOGATÓ OBJEKTÍV INFORMATIKAI RENDSZER 1.
A generatív nyelvelmélet
Programok készítése és futtatása. Integrált fejlesztői környezet (IDE) tartalmaz:  szövegszerkesztőt a program forráskódjának szerkesztésére,  fordítóprogramot.
Logika szeminárium Barwise-Etchemendy: Language, Proof and Logic
A nyelvi tudatosság fejlesztése Meixner Iskola, Szakmai nap
Internet és kommunikáció
Az informatika (programozás) oktatásának pedagógiai módszerei
Természetes nyelvek feldolgozása Natural language processing(NLP)
Előadás másolata:

Természetes nyelvek feldolgozása Natural language processing(NLP) A természetes nyelvek feldolgozása, megértése az MI fontos kutatási területe az ember-gép kommunikáció emberközelibbé tétele érdekében Nehézségek: a nyelv szavainak, nyelvtani szabályainak alapos ismerete e tudás integrálása a világról szóló más tudással a partner saját céljainak, miénktől eltérő hiedelmeinek figyelembevétele

A nyelvek csoportosítása: Szabályos nyelvek, pl egy programozási nyelv Szövegösszefüggés-nélküli (context free) nyelvek. Chomsky : „Colorless green ideas sleep furiously”. Általános v. természetes nyelvek A természetes nyelvek végtelenek, az összes megengedett mondatot nem tudjuk felírni, de kell egy leírás a mondatok általános struktúrájáról, ami alapján eldönthetjük, hogy egy adott mondat megengedett-e a vizsgált nyelvben vagy sem. Ha van is ilyen eljárásunk, nem biztos, hogy azzal közelebb jutunk a nyelv megértéséhez. Egy intelligens programnak legalább olyan szinten meg kell értenie egy mondatot, hogy értelmesen válaszolni tudjon rá.

A nyelvi elemzés szintjei: szintaktikai: jelzi, hogy a mondat a nyelv része szemantikai: a mondat szintaktikájának megfelelően kombinálva az egyes szavak jelentését az egész mondat nyer egyfajta jelentést pragmatikai: a szövegkörnyezetbe helyezve a mondatot, megtudjuk, hogy értelmezésünk helyes volt-e, vagy attól eltérő jelentésről van szó (pl. „olajra lépett” egy háztartási baleset leírásában illetve a bűnügyi krónikában.) intencionális szint: a beszélő szándékát, elképzeléseit, hitét, célját sem hagyhatjuk figyelmen kívül az árnyalt jelentés megértéséhez

Alkalmazások 1.Természetes nyelvű interfész (NLI) adatbázishozzáférés megkönnyítésére: a felhasználó természetes nyelven feltett kérdését az NLI lekérdező nyelvű kérdéssé alakítja, melyre választ kapunk az adatbázisból, természetes nyelven az NLI jóvoltából. Például: LUNAR(1973):Mi az átlagos modális plagioklász koncentráció a rubídiumot tartalmazó holdminták esetén? típusú kérdésekre képes volt választ adni. Problémák: a kérdések megfelelő megfogalmazásán múlik a siker a párbeszéd kontextusát követnie kellene a programnak („mikor indul az utolsó gép Londonba?…..pontos válasz……….És az azelőtti?… nincs válasz”)

2. Gépi fordítás Jelentős siker az erősen specifikus nyelvi feladatok esetén, például a montreáli egyetemen kifejlesztett TAUM-METEO rendszer, mely időjárásjelentést fordít angolról franciára. Bonyolultabb szöveg esetén is gazdaságos géppel egy nyers fordítást készíttetni, amit majd anyanyelvi lektor korrigál (olcsóbb, mint egy kétnyelvű fordítót megfizetni). Másik lehetőség az eredeti szöveg előeditálása, egyszerűsítése, a nyelvi eszközök redukálása révén, úgy, hogy a gépi fordítás után már ne legyen szükség utólagos korrekcióra. Például nemzetközi piacokra termelő cégek termékeihez adott ismertetők (a Xerox gépkönyveit végre megérthették azok is, akik eredetiben olvasták). MÓDSZEREK Szimbolikus módszer a szókészletre, nyelvtanra vonatkozó lehető legtöbb információ bevitelével Statisztikai módszer: párhuzamos szövegek valószínűségi-statisztikai elemzése alapján keres párokat, szavak helyett kifejezésekre koncentrálva (Giza++ programcsomag)

3. Szövegértelmezés a szükséges információk kiemelése, besorolása, megszűrése adott szövegekből információ-visszakeresés szövegkategorizálás adatok kinyerése szövegekből

A Loebner-verseny Loebner a Turing-teszt gyakorlati megvalósítójának tűzött ki díjat (100000 dollár), azaz az emberrel azonos szintű, attól megkülönböztethetetlen válaszokat adó gép számára. Limitált teszt: 25000 dollár. Bronzérem: az évi verseny győztesének 2000 dollár. Előzmény: Joseph Weizenbaum Eliza nevű programja 1966-ból, mely az ember által begépelt mondatokat manipulálva látszólag intelligens válaszokat adott. A Loebner díj egyik nyertese Ella, akivel társaloghatunk a www.ellaz.com honlapon a Talk to Ella menüpontot kérve (már egy Single session talk is nagy élmény!) Magyar társalgórobotok: Frenezis Beatrix Lafoxka

A NetNLP program használata Általános szabályok : 1. 1 Ha a mondat állítás, ponttal kell lezárni. 1. 2 Ha a mondat kérdés, kérdőjellel kell lezárni. 1. 3 Speciális állítások a parancsok (lásd parancsok). Állításokra vonatkozó szabályok: 2. 1 Individual IS Class. 2. 2 Class IS Class. 2. 3 Individual's Slot IS Filler. 2. 4 Class's Slot IS Filler. Kérdésekre vonatkozó szabályok: 2. 5 IS Individual Class? 2. 6 IS Class Class? 2. 7 IS Individual's Slot Filler? 2. 8 IS Class's Slot Filler? 2. 9 WHAT IS Individual's Slot? 2.10 WHAT IS Class's Slot? Egyéb szabályok: 3. 1 Individual -> Objektum 3. 2 Class -> A Objektum 3. 3 Class -> AN Objektum 3. 4 Slot -> Objektum 3. 5 Filler -> Objektum

Használható parancsok: QUIT. EXIT. CLOSE. - kilépés NEW. - hálózat törlése OPEN. - hálózat feltöltése fájlból SAVE. - hálózat mentése fájlba NETWORK INFORMATION. NETINFO. - hálózatinformáció CLEAR DESKTOP. - a felület tartalmának törlése SAVE HISTORY. - a history mentése szöveges fájlba SAVE COMMANDS. - a parancslista mentése szöveges fájlba HELP. - súgó ABOUT. - névjegy

Lehetséges példamondatok Peter is a boy. A boy is a young.man. Raul is a boy. A young_man is a human_being. Sarah is a girl. A girl is a young_woman. A young woman is a human_being. Sara's hair is brown. Raul's mouth is red. Peter's mouth is pink. Raul's hair is black. Black is a colour. Pink is a colour. Red is a colour. A colour is a feature. A boy's head is big. A human being's life is long. Lehetséges kérdések Is Peter a young man? Is Raul’s head big? What is Peter life?…etc