Nyelvi interfészek. IBM Watson https://www.youtube.com/watch?v=seNkjYyG3gI 8:20 ill. 3:00.

Slides:



Advertisements
Hasonló előadás
Hogyan jutunk információkhoz az interneten
Advertisements

Keresőrendszerek.
Keresés a számítógépes katalógusokban
A Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
Kereső program használata Készítette: Berger Nikolett
 A Web, kezdeti időszakában csak a szöveges file-okat kezelte.  Ma teljes körű multimédia szolgáltatásokat nyújt  Filmet,  Zenét,  Képeket nézhet.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Internet ismeretek II..
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
K-Chat Dr. Szepesvári Csaba Kutatási Alelnök mindmaker.
A BNO10 formális formális reprezentálása a GALEN alapján
WordLearner.com -- Learn or Teach Words in Almost Any Language WordLearner.com online és offline nyelvoktatás mobiltelefonon és interneten Benedek Balázs.
Szerkesztett információszolgáltatás, amely az Európai Unióra, Európa országaira, valamint az állampolgárok, kutatók és egyéb érintettek számára fontos.
Út a beszédértéstől a szövegértésen keresztül a matematikai problémák megoldásáig Előadó: Horváth Judit.
Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
ZENEI ADATBÁZISOK. The Music Index Online A Music Index a zenei időszaki kiadványok legátfogóbb bibliográfiai és részben teljes szöveges adatbázisa több.
13.a CAD-CAM informatikus
Böngészők Internet Explorer Mozilla Firefox
Kivonatolás, kérdés megválaszolás, dialógus rendszerek november. 16.
Nyelvtechnológiai problémák március 10. Farkas Richárd PhD hallgató.
Gépi fordítás november 9. Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING, 2nd editon, 2009 alapján.
Szintaktikai elemzés február 23..
Dokumentum klasszifikáció október 12.. Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum:
Dialógus rendszerek május 10.. Dialógus rendszerek Discourse, dialogue analysis Ember-gép interakció Tutoring Adatbázis keresések Információkinyerés.
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
Műszaki tudományok az interneten
A szövegszerkesztés alapjai
Kereső programok használata
Aki keres, az talál? Igen, talál. Ki ezt, ki azt, de egy szót beütve a google keresőbe (pl.) mindig ugyanazt, hacsak nem kerültek fel új honlapok az adott.
Bevezetés a terminológiába. input output Gépi feldolgozás Jelentés- független Jelentés- függő Információfeldolgozás.
Felhasználói kérdőíves felmérés a MEK-ben Moldován István OSZK MEK.
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
A szövegszerkesztés alapjai
Nyelv-ész-gép Új technológiák az információs társadalomban.
Szemantikus keresők.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Önálló labor munka Csillag Kristóf 2004/2005. tavaszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
Hol keressünk tudományos munkákat kutatásunkhoz?.
Egy szövegszerkesztő legegyszerűbb szolgáltatásai
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
HTML ÉS PHP (Nagyon) rövid áttekintés. ADATBÁZISRENDSZEREK MŰKÖDÉSI SÉMÁJA Felh. interakció DB Connector MySQL ? A gyakorlaton:
Keresés a weben Kulcsszavas keresés: Google (
Könyvtár- és informatikai alapismeretek kurzus október 1.
Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.
Pályázatok értékelésének tapasztalatai Hoffmann Miklós független szakértő.
Keresés fajtái Matching (szabadszavas)
Adatkeresés az interneten
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
Könyvtár- és informatikai alapismeretek kurzus október 7.
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
KERESÉS ELEKTRONIKUS KÖNYVTÁRI KATALÓGUSOKBAN Kiss Annamária Semmelweis Egyetem Központi Könyvtár 2013.
Keresési módszerek könyvtári katalógusokban. A könyvtári katalógus funkciója A könyvtár állományában meglévő dokumentumok feltárása Az egyes példány adatainak.
Szakdolgozatok kezelése a MIDRA adatbázisban. 1. lépés Feltöltés Az elkészült, végleges szakdolgozatot a szerző, vagy megbízottja feltölti a MIDRA adatbázisba.
Természetes nyelvi interfészek
Hogyan tájékozódjunk a magyar orvosi szakirodalomban?
Bevezetés a szövegszerkesztésbe
18. óra A Word-ről tanultuk….
Digitális tankönyvtár
Navigáció az Interneten:
Gépi tanulás.
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
AVON CAREER SITE FELÉPÍTÉSE
Előadás másolata:

Nyelvi interfészek

IBM Watson 8:20 ill. 3:00

Beszédtechnológia

Dialógus rendszerek Tutoring Adatbázisban keresés Döntéstámogató rendszerek Navigációs rendszerek Ügyfélszolgálatok (irányítás) Vizsgáztatás

Elvi működés Szöveg Szemantikai reprezentáció MestInt Szemantikai reprezentáció (válasz) Szöveg

Jelenleg működő rendszerek Lehetséges kérdések halmaza rögzített ügyfélszolgálatok, tutoring szűk domainen működik! bejövő kérdéshez leghasonlóbb mintakérdés kiválasztása (egyébként „nem értem mire gondolsz”) és az előre megadott válasz (szöveges vagy navigáció) megadása

Jelenleg működő beszélgető ágensek néhány beépített (gyakori) kérdésre válasz próbálják a kérdező szerepét átvenni (ált. eldöntendő kérdések) a válaszok egyszerű elemzésével (bag- of-words) tudnak „reagálni” céljuk általában: beszélgetési/kérdés/válasz sablonok gyűjtése későbbi (gépi) tanuláshoz

Turing tesztKínai szoba

Kérdés megválaszolás Question answering (Q&A) Input: egy természetes nyelvi kérdés Output: választ tartalmazó dokumentumok halmaza (ugyanaz, mint IR) Vagy releváns bekezdés… (kivonat?) Vagy a válasz… Következő generációs kereső rendszerek? – Ki használ speciális karaktereket? – Ki gépel be kérdést?

Kérdések típusai Tények (nevek, dátumok, helyek stb.) Listák Definíciók Eldöntendő Hogyan? Miért?

Architektúra kulcsszó alapú rendszer (kérdés szavai) Azokat a mondatokat vizsgálja ahol megjelennek ezek a szavak A mondatok rangsorolás (pozíció, sorrend, relevancia) A kérdés átformálása működik ha elég nagy az adathalmaz: Hol született Petőfi? „Petőfi * született”

Egy Q&A rendszer felépítése ( Moldovan – TREC 2004) 1.Kérdés feldolgozás 2.Keresőszavak előállítása 3.Dokumentum szűrés és rangsorolás 4.Válasz feldolgozása

Kérdés feldolgozás Kérdés típus azonosítás – ML: bag-of-words, tulajdonnevek stb. Válasz típusának meghatározása (kérdéstípuson belül) A kérés fókuszának behatárolása Melyik a leghosszabb folyó Európában? általában szabály alapú rendszerrel

Keresőkifejezések előállítása Heurisztikák: – nem gyakori szavak – tulajdonnevek – jelzős főnévi szerkezetek – igék – a kérdés fókusza Szinonimák

Dokumentumok szűrése A kulcsszavaknak egymáshoz közel kell elhelyezkedniük (pl. egymást követő bekezdésekben) Túl gyakori/túl ritka kulcsszavak Rangsorolás: – dokumentum forrása (Wiki, hivatalos) – kérdés szavainak száma – nem illesztett kulcsszavak

Válasz mondat kiválasztása Válasz lokalizálása a dokumentumban (bekezdés/mondat) Nyelvi elemzés Ellenőrzés, hogy a válasz típusának megfelel-e a találat Legjobb válaszok listája(?)

Számítógépes nyelvészeti alkalmazások Gépi fordítás Dokumentum osztályozás/klaszterezés Információ kinyerés Kivonatolás

Gépi fordítás Teljes szövegek automatikus fordítása forrás nyelvről célnyelvre. Computer Aided Translation (CAT) Miért van rá szükség? – Az EU évente 1 milliárd €-t költ fordításra – Interneten elérhető információkhoz való hozzáférés (Google Translation)

Nyelvek közti különbségek Lexikai különbségek – red vs. vörös, piros

Dokumentum szintű osztályozás/klaszterezés

Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum: szöveg + kép + struktúra (multimodalitás) Hogyan definiáljuk előre a kategóriákat?

Alkalmazási területek 1961 óta! Rendszerezés (hirdető újság, konferencia) SPAM szűrés / hír szűrés CRM irányítás dolgozat javítás Témaazonosítás

Dokumentum-klaszterezés és címkézés Linguistics Machine Learning Probability therory

Információ kinyerés

IE vs IR

Entitások személyek, szervezetek, helyszínek United States Department of Homeland Security szemantikai osztály: Ford normalizálás: Manchester United és vörös ördögök

Információkinyerés Entitások közti relációk Események

Véleménydetekció vélemény termékekről, ötletekről, témákról különböző aspektusok mentén

Kivonatolás

Kivonat: rövid, de pontos reprezentánsa a dokumentum tartalmának Rövid? kevesebb, mint az eredeti fele tartalom: legfontosabb tartalomnak át kell jönnie „Olvastam a Háború és Békét… Oroszországról szól…” Woody Alen

A kivonatolás alkalmazásai újságcikkek TV műsor/mozi előzetes tudományos publikációk önéletrajzok sport közvetítések egyetemi jegyzetek

Kulcsszókinyerés Frázisok halmaza, ami tömören reprezentálja egy dokumentum tartalmát.