Természetes nyelvi interfészek

Slides:



Advertisements
Hasonló előadás
A Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
Advertisements

Valóban azt látjuk, ami a retinára vetül? Dr. Kosztyánné Mátrai Rita Eötvös Loránd Tudományegyetem, Bölcsészettudományi Kar, Informatika Tanszék.
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
INFORMÁCIÓKERESÉS JELENTÉSREPREZENTÁCIÓ ALAPJÁN
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS A BIONIKUS SZEMÜVEGBEN Persa György.
A térkép és a propaganda kapcsolata Bobák Szilvia.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
A BNO10 formális formális reprezentálása a GALEN alapján
WordLearner.com -- Learn or Teach Words in Almost Any Language WordLearner.com online és offline nyelvoktatás mobiltelefonon és interneten Benedek Balázs.
Szerkesztett információszolgáltatás, amely az Európai Unióra, Európa országaira, valamint az állampolgárok, kutatók és egyéb érintettek számára fontos.
1 AIBO Robotfoci Bodor László IAR Bevezetés AIBO RoboCup AIBO RoboCup Célok Célok Rendszer elemei Rendszer elemei Megvalósítás terve Megvalósítás.
4. Kreatív döntéshozatal
Kivonatolás, kérdés megválaszolás, dialógus rendszerek november. 16.
Nyelvtechnológiai problémák március 10. Farkas Richárd PhD hallgató.
Információ kinyerés nov. 2.. Információ kinyerés Information Exctraction (IE) A feladat szempontjából fontos információ automatikus kigyűjtése folyó.
Gépi fordítás november 9. Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING, 2nd editon, 2009 alapján.
Szintaktikai elemzés február 23..
Dokumentum klasszifikáció október 12.. Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum:
Dialógus rendszerek május 10.. Dialógus rendszerek Discourse, dialogue analysis Ember-gép interakció Tutoring Adatbázis keresések Információkinyerés.
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
Miskolci Egyetemi Publikációs Adatbázis Egy új szolgáltatás születése és bevezetésének problémai Kiss Andrea, Miskolci Egytem,
A virtuális technológia alapjai Dr. Horv á th L á szl ó Budapesti Műszaki Főiskola Neumann János Informatikai Kar, Intelligens Mérnöki Rendszerek.
A CAD/CAM modellezés alapjai
1. előadás. 1.) Szoftverfejlesztés, mint mérnöki tevékenység. Számítási eszközfejlődés. Számítási eszközfejlődés: hazai viszonyok. Mérföldkő: Simula 67.Klasszikus.
1. előadás. 1.) Szoftverfejlesztés, mint mérnöki tevékenység. Számítási eszközfejlődés. Számítási eszközfejlődés: hazai viszonyok. Mérföldkő: Simula 67.Klasszikus.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
Bevezetés a terminológiába. input output Gépi feldolgozás Jelentés- független Jelentés- függő Információfeldolgozás.
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
A szövegszerkesztés alapjai
Szemantikus keresők.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Önálló labor munka Csillag Kristóf 2004/2005. tavaszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
Szerkesztett információs szolgáltatás, amely az Európai Unióra, Európa országaira, valamint az állampolgárok, kutatók és egyéb érintettek számára fontos.
Az arcfelismerés és arc detektálás alapjai Matusinka Roland OE-NIK
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
HTML ÉS PHP (Nagyon) rövid áttekintés. ADATBÁZISRENDSZEREK MŰKÖDÉSI SÉMÁJA Felh. interakció DB Connector MySQL ? A gyakorlaton:
Keresés a weben Kulcsszavas keresés: Google (
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.
A OneNote 2007.
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
Keresés fajtái Matching (szabadszavas)
Digitalizált információk rendszerezése. A publikus hozzáférés biztosítása az Internet segítségével. Dokumentumkezelés, információ digitalizálás OMA konferencia.
Chapter 2 Human Information Processing
Szövegfeldolgozás ontológiák segítségével – fogalmak azonosítása Szekeres András Márk.
TÁMOP /1-2F JAVA programozási nyelv NetBeans fejlesztőkörnyezetben I/13. évfolyam Osztályok, objektumok definiálása és alkalmazása. Saját.
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
A Google Drive használata. Mire jó? A Google Drive segítségével a fotókat, videókat, fájlokat és sok más tartalmat egy biztonságos felhőtárhelyen keresztül.
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
április 19. Dokumentumkezelés a gyógyszertörzskönyvezésben április 19. Kovács Lajos CHINOIN.
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
KERESÉS ELEKTRONIKUS KÖNYVTÁRI KATALÓGUSOKBAN Kiss Annamária Semmelweis Egyetem Központi Könyvtár 2013.
Logika szeminárium Barwise-Etchemendy: Language, Proof and Logic
A Robotok miért nem értik az internetet?
A Robotok miért nem értik az internetet?
Digitális tankönyvtár
SZÖM II. Fejlesztési szint folyamata 2. Az önértékelés végrehajtása 5
Nyelvi és képi problémák
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
Előadás másolata:

Természetes nyelvi interfészek

IBM Watson

Beszédtechnológia

Dialógus rendszerek Tutoring Adatbázisban keresés Döntéstámogató rendszerek Navigációs rendszerek Ügyfélszolgálatok (irányítás) Vizsgáztatás

Elvi működés Szöveg Szemantikai reprezentáció MestInt Szemantikai reprezentáció (válasz) elemzés/megértés generálás

Turing teszt

Jelenleg működő rendszerek Lehetséges kérdéssablonok halmaza rögzített ügyfélszolgálatok, tutoring szűk domainen működik! bejövő kérdéshez leghasonlóbb mintakérdés kiválasztása (egyébként „nem értem mire gondolsz”) és az előre megadott válasz (szöveges vagy navigáció) megadása

Jelenleg működő beszélgető ágensek néhány beépített (gyakori) kérdésre válasz próbálják a kérdező szerepét átvenni (ált. eldöntendő kérdések) a válaszok egyszerű elemzésével (bag- of-words) tudnak „reagálni” céljuk általában: beszélgetési/kérdés/válasz sablonok gyűjtése későbbi (gépi) tanuláshoz

Kérdés megválaszolás Question answering (Q&A) Input: egy természetes nyelvi kérdés Output: választ tartalmazó dokumentumok halmaza (ugyanaz, mint IR) Vagy releváns bekezdés… (kivonat?) Vagy a válasz…

Kérdések típusai Tények (nevek, dátumok, helyek stb.) Listák Definíciók Eldöntendő Hogyan? Miért?

Architektúra kulcsszó alapú rendszer (kérdés szavai) Azokat a mondatokat vizsgálja ahol megjelennek ezek a szavak A mondatok rangsorolás (pozíció, sorrend, relevancia) A kérdés átformálása működik ha elég nagy az adathalmaz: Hol született Petőfi? „Petőfi * született”

(egyéb) nyelvtechnológiai alkalmazások Gépi fordítás Dokumentum osztályozás/klaszterezés Információ kinyerés Kivonatolás

Gépi fordítás Teljes szövegek automatikus fordítása forrás nyelvről célnyelvre. Computer Aided Translation (CAT) Miért van rá szükség? Az EU évente 1 milliárd €-t költ fordításra Interneten elérhető információkhoz való hozzáférés (Google Translation)

Nyelvek közti különbségek Lexikai különbségek red vs. vörös, piros

Dokumentum szintű osztályozás/klaszterezés

Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum: szöveg + kép + struktúra (multimodalitás)

Alkalmazási területek 1961 óta! Rendszerezés (hirdető újság, konferencia) SPAM szűrés / hír szűrés CRM irányítás dolgozat javítás  Témaazonosítás

Dokumentum-klaszterezés és címkézés Linguistics Machine Learning Probability therory

Információ kinyerés

Információ visszakeresés vs információ kinyerés

Entitások személyek, szervezetek, helyszínek szemantikai osztály: Ford United States Department of Homeland Security szemantikai osztály: Ford normalizálás: Manchester United és vörös ördögök

Információkinyerés Entitások közti relációk Események

Véleménydetekció vélemény termékekről, ötletekről, témákról különböző aspektusok mentén

Kivonatolás

Kivonatolás Kivonat: rövid, de pontos reprezentánsa a dokumentum tartalmának Rövid? tartalom: legfontosabb tartalomnak át kell jönnie „Olvastam a Háború és Békét… Oroszországról szól…” Woody Alen

A kivonatolás alkalmazásai újságcikkek TV műsor/mozi előzetes tudományos publikációk önéletrajzok sport közvetítések egyetemi jegyzetek 

Kulcsszókinyerés Frázisok halmaza, ami tömören reprezentálja egy dokumentum tartalmát.

Vizuális interfészek

Elvi működés Kép/videó Szemantikai reprezentáció MestInt Szemantikai reprezentáció (válasz) vizualizáció elemzés/megértés generálás

Képfeldolgozás HCI-ben Beviteli eszköz szem, arckifejezés, testtartás stb Személyek azonosítása arcfelismerés, retinaazonosítás stb Személyek/testrészek mozgásának követése videókamerákon

(egyéb) képfeldolgozási alkalmazások Objektumok azonosítása képeken és videókon Környezet jellemzése Objektumok (3D) pozíciójának meghatározása Pl. orvosi képfeldolgozás, rendőrségi alkalmazások Képkeresés

Nyelvi és képi problémák Szinonímák: sok féleképen hivatkozhatunk egy objektumra (fogalomra), pl: álmos-kialvatlan → gyenge fedés Poliszémia: a legtöbb szónak több jelentése van, pl: körte, puska → gyenge pontosság

képi „szinoníma”

szemmozgás követése Mire figyel, mit néz a felhasználó? Megtalálta amit keresett? vizuális keresés pupilla mérete stb.

Arckifejezés elemzés

Testtartás azonosítás/követés

Azonosítás

Objektumok azonosítása és követése https://github.com/teradeep/demo-apps

Generálás