Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, 2003.11.04. A gépi ferdítéstől a gépifordításig.

Slides:



Advertisements
Hasonló előadás
A nyelvek eredete, nyelvtípusok
Advertisements

Ó- és középmagyar morfológiai elemző Novák Attila.
A korpusz alapú szótár alapja: a korpusz
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
Miből tanítsak? A taneszköz-választás kérdései a 6-10 évesek nyelvoktatásában Kuti Zsuzsa Oktatási Minisztérium.
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
Egynyelvűség, többnyelvűség, szótárak, fordítás Prószéky Gábor MorphoLogic Nyelvi áttörés.
INFORMÁCIÓKERESÉS JELENTÉSREPREZENTÁCIÓ ALAPJÁN
Nyelv-ész-gép Új technológiák az információs társadalomban.
K-Chat Dr. Szepesvári Csaba Kutatási Alelnök mindmaker.
A Magyar Nemzeti Szövegtár
HÁNY SZÓ VAN A MAGYAR NYELVBEN?
Technical University of Budapest
Korpuszmunkálatok Pintér Tibor MTA Nyelvtudományi Intézet Gramma Nyelvi Iroda.
Tetten ért szavak a Magyar Nemzeti Szövegtárban
Az idegen nyelvekről a NAT-BAN
Gépi fordítás november 9. Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING, 2nd editon, 2009 alapján.
Szintaktikai elemzés február 23..
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Gépi fordítás április 19.. Gépi fordítás Machine Translation (MT) Teljes szövegek automatikus fordításra forrás nyelvről célnyelvre. Computer Aided.
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
Az adatbázisok használata során szerzett tapasztalataink
Kimeneti követelmények a 8. osztály végén
TANTÁRGY-ORIENTÁLT IDEGEN NYELV OKTATÁS Istvánffy Miklós Általános Iskola.
Készítette: Horváth Viktória Pozsgai Dia Tóth Kata Karlik Ágnes
Bagaméri Zsuzsanna, BME Nyelvvizsgaközpont
A nyelv problémája természetes, és mesterséges nyelvek.
Kettőnél több csoport vizsgálata és kísérlet tervezés Makara B. Gábor MTA KOKI.
A többnyelvűség pszicholingvisztikai kérdései
Magyar nyelvtanulók angol lexikai hangsúlyának akusztikai vizsgálata Nagy Judit SZTE Nyelvtudományi Doktori Iskola Angol Alkalmazott Nyelvészeti Program.
A Magyar Nemzeti Szövegtár
Hány szó van a magyarban?
2006. február 20. MANYE Korpuszok 1 Kiss Gábor - Sass Bálint A Magyar Nemzeti Szövegtár MNSZ.
Megoldottuk a számítógép nyelvét... Prószéky Gábor MTA, november 4. MTA, november 4.
Idegennyelvű korpuszok Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály
2006. február 20. Párhuzamos korpuszok Tartalom definíció és terminológia alkalmazási lehetőségek gyakorlati nehézségek publikus és ingyenes korpuszok.
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály XML-alapú komplex korpusz-lekérdezés.
Hogyan tanítsuk meg a számítógépet magyarul? Számítógép és nyelv Varasdi Károly MTA Nyelvtudományi Intézet
A szöveg lekérdezése A NooJ rendszer alapjai
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
Nyelv-ész-gép Új technológiák az információs társadalomban.
Prószéky Gábor MorphoLogic DAT-2006, november 21. Prószéky Gábor MorphoLogic
FELVÉTELI 2008 Berzsenyi Dániel Gimnázium ISKOLÁNKRÓL …  2008-ban ünnepeljük iskolánk alapításának 150. évfordulóját  ‘Minőségi nevelési-oktatási.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
A szövegértési feladatok összeállítása
1 NYESZE KONFERENCIA NYESZE KONFERENCIA ÁLTALÁNOS NYELVI ÉS SZAKNYELVI VIZSGÁK, VIZSGAANYAGOK Varga György
Nyelvi visszacsatolás karakter-, kézírás- és beszédfelismerő rendszerek számára OM, november 21.
Gyermekvilág régen és ma
Fontos szempontok a glosszárium (MultiTerm adatbázis) elkészítéséhez
de français BEMUTATÁS Csűry István DE Francia Tanszék.
Jó gyakorlatok listája Dobó István Gimnázium 2012.
UDOVECZ GÁBOR Balkán: együttműködés vagy verseny a mezőgazdaságban?
Bevezetés Előadó: Blasszauer János Kaposvár, január 14.
A szövegértés diagnosztizálása és fejlesztése
1 Üzleti szakfordító és tolmács SZAKIRÁNY Nyelvi és Készségfejlesztési Tanszék Vogelné Takács Gabriella tanszékvezető
1 Übersetzungswerkstatt. Ein praxisorientiertes Übungsbuch Szerzők: Csatár Péter, Farkas Orsolya, Iványi Zsuzsanna, Molnár Anna, Barna János (Debreceni.
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
A Nyelv- és Beszédtechnológiai Platform egy éve Váradi Tamás MTA Nyelvtudományi Intézet Nyelvi áttörés A nyelv- és beszédtechnológia mint húzóágazat.
Le cratère le plus gros de la planète Est comme celui de la guerre des étoiles mais lui est réel et il se trouve en Russie !
Webes tartalmakban alkalmazható szteganográfiai módszerek vizsgálata
1075 BUDAPEST, WESSELÉNYI U. 38. Budapesti Gazdasági Szakképzési Centrum II. Rákóczi Ferenc Közgazdasági Szakközépiskolája REFERENCI A INTÉZMÉNY.
A nyelvi tudatosság fejlesztése Meixner Iskola, Szakmai nap
A MorphoLogic gépi fordítórendszere
Tájékoztató a fordító és tolmács mesterszakról
3. osztályban.
Előadás másolata:

Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig

Miért (és mikor) érdemes géppel fordítani?  Túl sok a fordítandó szöveg  A gyorsaság fontosabb a pontosságnál  A költségek csökkentése

A fordítás folyamata FORRÁS SZÖVEG CÉL SZÖVEG MEGÉRTÉS / INTERPRETÁLÁS

Alapvető megközelítések  Szabályalapú Direkt transzfer Közvetítő nyelvet használó fordítás Transzferalapú fordítás  Korpuszalapú Statisztikai Példa-alapú  Hibrid rendszerek

DIREKT TRANSZFER “szó szerinti fordítás” FORRÁSNYELVI SZÖVEG CÉLNYELVI SZÖVEG szótárak, nyelvtani szabályok

KÖZVETÍTŐ NYELVET HASZNÁLÓ RENDSZER FORRÁS- NYELVI SZÖVEG CÉLNYELVI SZÖVEG KÖZVETÍTŐ NYELV TUDÁS- TÁR célnyelvi szótár forrásnyelvi szótár

TRANSZFERALAPÚ RENDSZER FORRÁS- NYELVI SZÖVEG CÉL- NYELVI SZÖVEG ELEMZETT SZÖVEG FORDÍTOTT SZÖVEG forrásnyelvi szótár +nyelvtan célnyelvi szótár +nyelvtan forrás  cél transzfer szótár + nyelvtan

Egy példa a direkt transzfer használatára MAGYAR  FRANCIA Movladi Udugov, a csecsen gerillák volt szóvivője azt mondta, Movladi Udugov, le tchéchène guérillas était porte-parole ce a dit, hogy az este egy orosz gépkocsioszlopot támadott meg a csapatuk. que ce soir un russe convoi a attaqué plus le groupe.

A legfeltűnőbb hiányosságok: volt szóvivője  était porte-parole támadott meg  a attaqué plus [a csecsen gerillák]  [le tchéchène guérillas] [szóvivője] [porte-parole] [orosz gépkocsioszlopot] [russe convoi] [támadott meg]  [a attaqué] [csapatuk] [groupe]

TÖBBÉRTELMŰSÉG

A többértelműség feloldása szabályokkal

A többértelműség feloldása magyarfrancia volt.FN  volt.FNh volt.IG,Me3  était.IG,Me3 volt.MIB  ancien.MN

MONDATTANI SZEREPEK I. [orosz gépkocsioszlopot] [támadott meg] [csapatuk] tárgy alany [russe convoi] [a attaqué] [groupe] [(leur) groupe] [a attaqué] [(un) convoi russe]

MONDATTANI SZEREPEK II. Birtokos szerkezet: [ a csecsen gerillák volt szóvivője ] [ le porte-parole ancien guérillas tchéch è ne ] des

Eredmény Movladi Udugov, a csecsen gerillák volt szóvivője azt mondta, Movladi Udugov, le porte-parole ancien des guérillas tchéchène ce a dit, hogy az este egy orosz gépkocsioszlopot támadott meg a csapatuk que ce soir leur groupe a attaqué un convoi russe.

A MATCHPAD PROJEKTUM  EU által finanszírozott pályázat,  Systran SA – MTA Nyelvtudományi Intézet  nyelvpárok: angol  magyar magyar  francia

Eredmények  prototípus szavas magyar szókincsre alaktani elemzés egyértelműsítés magyar nyelvtani szabályok magyar-francia szótár magyar-francia transzfer szabályok  A további fejlesztés anyagi támogatásra vár...

KÖSZÖNÖM A FIGYELMET!