Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.

Hasonló előadás


Az előadások a következő témára: "2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs."— Előadás másolata:

1 2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály varadi@nytud.hu Nyelvi technológiákkal az információs társadalomért

2 2003. november 27-29. INFOtrend 2003 Miért kell nyelvtechnológia? Információ = (jórészt) nyelvi információ Természetes nyelvi kommunikáció A szöveg az INTERNET alapanyaga A szöveg nem csak karaktersorozat A nyelvi szerkezet nem a felszínen van Intelligens keresés – szemantikus WEB Cél: a szöveg megértése

3 2003. november 27-29. INFOtrend 2003 Mit nyújt a nyelvtechnológia? Nyelvi erőforrások Korpuszok (nagyméretű szöveges adatbázisok) Lexikai adatbázisok Nyelvelemző algoritmusok Statisztikai vagy szabályalapú rendszerek Reprezentációs szabványok XML annotáció

4 2003. november 27-29. INFOtrend 2003 Alkalmazási területek Szövegszerkesztés Intelligens keresés Természetes nyelvi lekérdezés Tartalom alapú dokumentumkezelés Információ kinyerés Természetes nyelvi dialógus rendszerek Gépi fordítás

5 2003. november 27-29. INFOtrend 2003 Korpusznyelvészeti Osztály 1997-ben alakult Nyelvi erőforrások fejlesztése Magyar Nemzeti Szövegtár Angol-magyar párhuzamos korpusz Értelmező Kéziszótár XML változat Igei vonzatszótár és lexikai adatbázis Morfológiai adatbázis Gyakorisági adatbázis

6 2003. november 27-29. INFOtrend 2003 EU Projektek MULTEXT-EAST Párhuzamos korpusz angol  6 Kelet-Eu nyelv CONCEDE Szabványos lexikai adatbázis fejlesztés MATCHPAD Systran gépi fordító rendszer magyarra TELRI Infrastruktúrális networking projekt

7 2003. november 27-29. INFOtrend 2003 Hazai támogatású projektek Magyar Nemzeti Szövegtár 150 millió szavas nyelvileg elemzett korpusz Információkinyerés rövid hírekből 2001-2003 NKFP 02/017 pályázat Mondatszintaxis gépi tanulása 2002-2004 IKTA pályázat Intelligens szótár és lexikai adatbázis 2003-2004 ITEM pályázat

8 2003. november 27-29. INFOtrend 2003 Eredmények Morfoszintaktikai elemző és egyértelműsítő technológiai láncsor Igei vonzatkeret szótár Gyakorisági adatbázis (MNSZ alapján) Felszíni szintaktikai elemző Angol-magyar, magyar-francia gépi fordító prototípus Nyílt tokenosztály elemző rendszer

9 2003. november 27-29. INFOtrend 2003 Folyó munkálatok Magyar nyelvi szintaktikai elemző Szemantikai annotáló rendszer Felső szintű ontológia Komplex lexikai adatbázis Tartalomra épülő dokumentumosztályozás Angol-magyar párhuzamos korpusz WORDNET magyar változat

10 2003. november 27-29. INFOtrend 2003 Partnereink MorphoLogic Kft Szegedi Tudományegyetem Informatikai Tanszékcsoport Akadémiai Kiadó BME Média Oktató és Kutató Központ Neumann János Digitális Könyvtár és Multimédia Központ


Letölteni ppt "2003. november 27-29. INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs."

Hasonló előadás


Google Hirdetések