Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.

Hasonló előadás


Az előadások a következő témára: "2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs."— Előadás másolata:

1 2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs társadalomért

2 2003. november INFOtrend 2003 Miért kell nyelvtechnológia? Információ = (jórészt) nyelvi információ Természetes nyelvi kommunikáció A szöveg az INTERNET alapanyaga A szöveg nem csak karaktersorozat A nyelvi szerkezet nem a felszínen van Intelligens keresés – szemantikus WEB Cél: a szöveg megértése

3 2003. november INFOtrend 2003 Mit nyújt a nyelvtechnológia? Nyelvi erőforrások Korpuszok (nagyméretű szöveges adatbázisok) Lexikai adatbázisok Nyelvelemző algoritmusok Statisztikai vagy szabályalapú rendszerek Reprezentációs szabványok XML annotáció

4 2003. november INFOtrend 2003 Alkalmazási területek Szövegszerkesztés Intelligens keresés Természetes nyelvi lekérdezés Tartalom alapú dokumentumkezelés Információ kinyerés Természetes nyelvi dialógus rendszerek Gépi fordítás

5 2003. november INFOtrend 2003 Korpusznyelvészeti Osztály 1997-ben alakult Nyelvi erőforrások fejlesztése Magyar Nemzeti Szövegtár Angol-magyar párhuzamos korpusz Értelmező Kéziszótár XML változat Igei vonzatszótár és lexikai adatbázis Morfológiai adatbázis Gyakorisági adatbázis

6 2003. november INFOtrend 2003 EU Projektek MULTEXT-EAST Párhuzamos korpusz angol  6 Kelet-Eu nyelv CONCEDE Szabványos lexikai adatbázis fejlesztés MATCHPAD Systran gépi fordító rendszer magyarra TELRI Infrastruktúrális networking projekt

7 2003. november INFOtrend 2003 Hazai támogatású projektek Magyar Nemzeti Szövegtár 150 millió szavas nyelvileg elemzett korpusz Információkinyerés rövid hírekből NKFP 02/017 pályázat Mondatszintaxis gépi tanulása IKTA pályázat Intelligens szótár és lexikai adatbázis ITEM pályázat

8 2003. november INFOtrend 2003 Eredmények Morfoszintaktikai elemző és egyértelműsítő technológiai láncsor Igei vonzatkeret szótár Gyakorisági adatbázis (MNSZ alapján) Felszíni szintaktikai elemző Angol-magyar, magyar-francia gépi fordító prototípus Nyílt tokenosztály elemző rendszer

9 2003. november INFOtrend 2003 Folyó munkálatok Magyar nyelvi szintaktikai elemző Szemantikai annotáló rendszer Felső szintű ontológia Komplex lexikai adatbázis Tartalomra épülő dokumentumosztályozás Angol-magyar párhuzamos korpusz WORDNET magyar változat

10 2003. november INFOtrend 2003 Partnereink MorphoLogic Kft Szegedi Tudományegyetem Informatikai Tanszékcsoport Akadémiai Kiadó BME Média Oktató és Kutató Központ Neumann János Digitális Könyvtár és Multimédia Központ


Letölteni ppt "2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs."

Hasonló előadás


Google Hirdetések