Szintaktikai elemzés 2010. február 23..

Slides:



Advertisements
Hasonló előadás
GRIN: Gráf alapú RDF index
Advertisements

Ó- és középmagyar morfológiai elemző Novák Attila.
A mondatelemzés modern útjai
Összefoglalás Hardver,szoftver,perifériák Memóriák fajtái
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
A mondat szintagmatikus szerkezete
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS A BIONIKUS SZEMÜVEGBEN Persa György.
Szemiot i ka.
Az alany az a mondatrész, amelyről megállapítunk valamit.
Kötelező alapkérdések
Budapesti Műszaki és Gazdaságtudományi Egyetem Elektronikus Eszközök Tanszéke A programozás alapjai 1. (VIEEA100) 9. előadás.
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Címkézett hálózatok modellezése
Nyelvtechnológiai problémák március 10. Farkas Richárd PhD hallgató.
Korpuszok, szegmentálás és szófaji elemzés
A kétnyelvűség kialakulása és fejlődése
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
A számítógépes nyelvfeldolgozás alapjai
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Korpuszok és adatbázisok
Rangsorolás tanulása ápr. 24..
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
Szófajok rendszere.
Microsoft Excel 2010 Gyakoriság.
Papp Róbert, Blaskovics Viktor, Hantos Norbert
Programozó matematikus szak 2003/2004-es tanév II. félév
Programozó matematikus szak 2003/2004-es tanév II. félév
A digitális számítás elmélete
Koreferencia-annotáló eszköz fejlesztése hálózati környezetben Oltványi Gábor József Oltványi Gábor József diplomaterv bemutató PPKE-ITK, Témavezető:
A nyelv problémája természetes, és mesterséges nyelvek.
4. Gyires Béla Informatikai Nap Debreceni Egyetem Informatikai Kar Új eredmények a Chomsky-féle (formális) nyelvtípusokkal kapcsolatban Dr. Nagy Benedek.
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig.
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
Dijkstra-algoritmus ismertetése
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
3.2. A program készítés folyamata Adatelemzés, adatszerkezetek felépítése Típus, változó, konstans fogalma, szerepe, deklarációja.
Logika 2. Klasszikus logika Miskolci Egyetem Állam- és Jogtudományi Kar Jogelméleti és Jogszociológiai Tanszék február 17.
Kötvényárazási hibák intelligens javítóalgoritmusának tervezése és fejlesztése GELLÉN ÁGNES IUFQ58.
Nyelvtechnológia Ladányi Enikő
Nyelvi nevelés 5-8. évfolyam 1. rész: A koncepció Molnár Cecília alapján aug
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS Programozás II. 4. Gyakorlat Függvény paraméterek, dinamikus.
Klasszikus héber nyelv 4.: Szintaxis
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS Persa György.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Algoritmusok és adatszerkezetek
Információelmélet 8. 1 Eszterházy Károly Főiskola, Eger Médiainformatika intézet Információs Társadalom Oktató-
A generatív nyelvelmélet
LL(1)-elemzés ● az LL(1)-elemzők már jobbak az előzőeknél, bár nem fedik le a programozási nyelvek szükségleteit ● alapötlet: a levezetés következő lépéséhez.
PÉNZÜGYI ELEMZÉS 1. előadás PhDr. Antalík Imre SJE GTK szeptember 21.
Mesterséges intelligencia
Precedencia-nyelvtanok
Számítógépes algoritmusok
Leíró nyelvtan - adatbázisból
LL(1)-elemzés az LL(1)-elemzők már jobbak az előzőeknél, bár nem fedik le a programozási nyelvek szükségleteit alapötlet: a levezetés következő lépéséhez.
A nyelvi tudatosság fejlesztése Meixner Iskola, Szakmai nap
A mesterséges neuronhálók alapjai
Adatbázisrendszerek elméleti alapjai 9. előadás
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
Algoritmusok és Adatszerkezetek I.
Absztrakt problémák Q  I  S, az absztrakt probléma kétváltozós reláció az esetek (I) és a megoldások (S) halmazán Példa: legrövidebb út Eset: gráf és.
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

Szintaktikai elemzés 2010. február 23.

Szófaji egyértelműsítés A morfológiai elemző előállítja az egyes szavak összes lehetséges elemzését. Ezután az egész mondatot figyelembe véve kiválasztjuk a lehetséges elemzések közül a megfelelőt. Part of Speech Tagger (POS) – szófaji egyérteműsítő

Szintaktikai elemzés A mondat egységeinek azonosítása, a közöttük lévő szintaktikai kapcsolatok feltárása. Megközelítések: alany, állítmány, tárgy … konstituens fa (constituency parsing) függőségi nyelvtan (dependency parsing)

Alkalmazás Információ kinyerés, gépi fordítás Nyelvtani ellenőrzés A Kis Hal bt.-t felvásárolta a Nagy Hal kft. A Kis Hal bt. felvásárolta a Nagy Hal kft.-t. Nyelvtani ellenőrzés

Nyelvtan „Egy nyelv elemei, szerkezete, törvényszerűségei” 3 évesen tökéletes az anyanyelven Implicit! Iskolai nyelvtan?

Konstituens fa Szavak csoportjai (eredeti sorrendben) egységeket alkotnak Az egységek osztályokba sorolhatóak amelyek külső és belső szempontokból jól definiáltan viselkednek. Például főnévi csoportok: én, a város, a piros labda, a tegnapelőtt vásárolt nagy kerek piros labda

Konstituens fa S: mondat VP: igei csoport NP: főnévi csoport Egy példa a Szeged TreeBank-ből

Strukturális többértelműség VP NP Láttam a lányt távcsővel.

Strukturális többértelműség VP NP NP Láttam a lányt távcsővel.

Környezetfüggetlen nyelvtanok (CFG) Terminálisok: szavak Nemterminálisok: konstituensek Szabályok: baloldal egyetlen nemterminális

Szintaktikai elemzés Adott szabályok egy halmaza S a gyökér Minden szót fedjen le és csak azokat Top-Down vs. Bottom-Up

Bottom-Up elemzés S NP VP Det N V NP Det N a dog has a bone

PCFG Minden szabályhoz egy valószínűség (baloldalak feletti eloszlások) Treebankből becsülhető Strukturális többértelműség?

Shift Reduce elemzés Bottom – Up, backtrack nélkül Verem segítségével dolgozik, O(n) Shift: Leválasztja a mondat legbaloldalibb elemét, és a verembe teszi. Reduce: A veremben lévő elemekre próbál szabályt illeszteni.

Shift Reduce elemzés →| Step Action Stack Input 0 (start) the dog barked 1 shift the dog barked 2 reduce d dog barked 3 shift dog d barked 4 reduce n d barked 5 reduce np barked 6 shift barked np 7 reduce v np 8 reduce vp np 9 reduce s

Shift Reduce tanulás Tanító halmaz alapján: reduce szabályok generálása szabályok közötti sorrend felállítása (mohó, valószínűségi) akciók (S/R) alkalmazásának tanulása

Megkötések ’hány -t’ – fitty ’hány -rA’ – szem ‘hány -nAk’ !?

Fej azonosítása 18

Függőségi nyelvtan Irányított, bináris kapcsolat szavak közt Minden szóhoz pontosan egy bemenő él (fa) Kiindulási pont a főige Eltérés a konstituens fától: Nincsenek frázisok, nem csak az egymást követő szavak közti kapcsolatokat vizsgálja.

Függőségi nyelvtan Különösen alkalmas szabad szórendű nyelvek kezelésére!

Dependecia elemző tanulása Tranzakció-alapú Minden lépésben egy új él felvétele Osztályozási probléma: egyedek: szópárok jellemzők: szavak, POS kódok akció: új él behúzása vagy semmi Gráf-alapú Jósági függvény Legjobb gráf megtalálása

Gráf-alapú dependencia elemzés Jósági függvény Él szintű jósági értékek aggregáltja Él szintű érték: gyerek és szülő, szavak és POS kódok Paramétereinek megtanulása a tanító adatbázisból Legjobb gráf megtalálása Maximális feszítő fa Dinamikus programozás

Konstituens vs. függőségi nyelvtan Főige: robbed alany: the burglar robbed tárgya: the appartament

Konstituens vs. függőségi nyelvtan Melyiket? Alkalmazás-orientáltan… függőségi nyelvtan könnyebben gépi tanulható szemantikához közelebb áll a függőségi

Szintaktikai elemzés jóságának mérése Konstituens elemzés Minden konstituenst hasonlítunk (címkézve vagy anélkül) Egyes szavak őseinek sorozatát hasonlítjuk Dependencia elemzés minden szóra ős és/vagy reláció típusának eltalálása

Hol tart a világ? Korpuszok Elemzők Konstituens alapú korpuszok (Penn TreeBank, Szeged TreeBank) Ezek átalakítása dependenciára Magyarra is folyamatban Elemzők Nyelvtől, jelölés mélységétől függ ~75-85% (CoNLL 2007)