Nyelv-ész-gép Új technológiák az információs társadalomban
iTranslate4 online gépi fordítás minden európai nyelvre Tihanyi László MTA Nyelvtudományi Intézet, MorphoLogic MTA Székház, október 7.
iTranslate4 projekt: Internet Translators for all European Languages weboldal: I translate for Europe, itranslate4.eu európai fordítóprogram-készítő cégek összefogása egy soknyelvű online fordítóoldal létrehozására Pályázati keret CIP ICT-PSP (Információs és Kommunikációs Technológiák) gépi fordítás a többnyelvű internet számára prototípuson alapuló, integráló, nem fejlesztési projekt Költségvetés 3,94 millió euró, támogatás mértéke 50% Futamidő 2 év, 2010 március február év fejlesztés, 1 év terjesztés 2/11
Koordinátor MTA Nyelvtudományi Intézet Partnerek MorphoLogic (Magyarország) SkyCode (Bulgária) Sunda (Finnország) SYSTRAN (Franciaország) PROMT (Németország) Linguatec (Németország) pwn.pl (Lengyelország) Trident MT (Lettország) Amebis (Szlovénia) pwn.pl Sunda SYSTRAN Trident MT SkyCode Linguatec PROMT MTA Nyelvtudományi Intézet és MorphoLogic 3/11 Koordinátor MTA Nyelvtudományi Intézet Partnerek MorphoLogic (Magyarország) SkyCode (Bulgária) Sunda (Finnország) SYSTRAN (Franciaország) PROMT (Németország) Linguatec (Németország) pwn.pl (Lengyelország) Trident MT (Lettország) Amebis (Szlovénia)
Konzorcium összeállítása Európa vezető fordítóprogram-gyártó cégei • felmérés: összehasonlító tesztfordítások 25 nyelven • meghívás: a legjobbak bármely nyelvpáron valamennyi meghívott csatlakozott Szolgáltatók összetétele • 9 konzorciumi partner • 3 új partner • 2 szabadon beépíthető fordító (Google és Microsoft) továbbiak csatlakozására számítunk 4/11
A projekt célkitűzései • megoldás minden nyelvre • minden on-line fordító csatlakoztatása • rangsorolt fordítások • optimális közvetítő nyelv (nem csak angol) • felhasználói közösség • fenntartható üzleti modell kialakítása Google Translate - Európai alternatíva • egy nyelv - több fordító (rangsorolva) • jobb minőségű fordítás: - nyelvpárok megfelelő nyelvészeti leírással: pl. angol-német - közvetlen megoldások: pl. orosz-lengyel - statisztikai módszerrel nehezen kezelhető nyelvek: magyar - nyelvcsaládba eső közvetítőnyelv: bolgár-lengyel • emberi segítség (ingyenes és fizetős) 5/11
Nyelvi lefedettség • pályázatban vállalt: 41 nyelv • induláskor tervezett: 63 nyelv Nyelvtípusok • 23 hivatalos uniós nyelv • egyéb európai nemzeti nyelvek: horvát, norvég, stb. • kisebbségi nyelvek: katalán, baszk, stb. • egyéb, Európában is beszélt nyelvek: arab, kínai, stb. Megoldások • 63 nyelv: 63*62=3906 nyelvpár • 229 nyelvpár közvetlen megoldással, többiek közvetítő nyelvvel • 421 nyelvi modul, En-De, En-Fr, En-Es: irányokban hét fordító 6/11
Fordítási szolgáltatások Prototípus: • szövegek • weblapok • lefordított keresés • chat üzenetek • hírek Kiegészítők • on-line helyesírás-ellenőrzés • nyelvfelismerés • virtuális billentyűzet támogatás 7/11
Minősítendő nyelvek a fordítások sorrendjének meghatározása egynél több szolgáltatónál • kiértékelendő nyelvpárok száma: 90 • kiértékelendő nyelvi modulok száma: 282 Minősítési eljárások • emberi fordításokkal történő automatikus összevetés • emberek által végzett szervezett tesztelés • a fordításokra érkező felhasználói értékelés végeredmény: a különböző eljárások összegzésével 8/11
Fordítói közösség támogatása • lehetőség jobb fordítás kérésére • fordítási javaslatok adminisztrálása és jutalmazása • felhasználói fórum moderálása Szolgáltatói közösség támogatása • egységes programozói felület (API) • szabad csatlakozás lehetősége • publicitás, linkek a szolgáltatói oldalakra • minőségi tesztek • felhasználói visszajelzések, logok 9/11
Fejlesztési lehetőségek • fordítóprogramok képességének harmonizációja • kombinált fordítás különböző fordításokból Jövőkép • jelentős forgalmú • valamennyi fordítóprogramot integráló • fenntartható automatikus fordító szolgáltatás 10/11
További információ: itranslate4.eu itranslate4.hu itranslate4.de itranslate4.fr itranslate4.es itranslate4.it... Köszönöm a figyelmet! 11/11