Szintaktikai elemzés 2007. március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),

Slides:



Advertisements
Hasonló előadás
ÉRDEKES PONTOK KINYERÉSE DIGITÁLIS KÉPEKEN. BEVEZETÉS  ALAPPROBLÉMA  Jellemzőpontok detektálása mindkét képen  Kinyert pontok megfeleltetése  Megfeleltetések.
Advertisements

GRIN: Gráf alapú RDF index
MINŐSÉGMENEDZSMENT 6. előadás
Ó- és középmagyar morfológiai elemző Novák Attila.
A mondatelemzés modern útjai
I. előadás.
Összefoglalás Hardver,szoftver,perifériák Memóriák fajtái
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS A BIONIKUS SZEMÜVEGBEN Persa György.
Az alany az a mondatrész, amelyről megállapítunk valamit.
Kötelező alapkérdések
Budapesti Műszaki és Gazdaságtudományi Egyetem Elektronikus Eszközök Tanszéke A programozás alapjai 1. (VIEEA100) 9. előadás.
SAS Enterprise Miner 2. gyakorlat
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Nyelvtechnológiai problémák március 10. Farkas Richárd PhD hallgató.
Korpuszok, szegmentálás és szófaji elemzés
Szintaktikai elemzés február 23..
Dokumentum klasszifikáció október 12.. Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum:
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
A számítógépes nyelvfeldolgozás alapjai
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Rangsorolás tanulása ápr. 24..
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Előadó: Prof. Dr. Besenyei Lajos
Programozó matematikus szak 2003/2004-es tanév II. félév
A digitális számítás elmélete
A digitális számítás elmélete
Célkeresztben az érettségi! A legjobb és leghatékonyabb eszközt akarjuk Kevesebb hibalehetőség, barátságos hibaüzenetek Kiváló fejlesztőeszköz Gyorsan.
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
A nyelv problémája természetes, és mesterséges nyelvek.
4. Gyires Béla Informatikai Nap Debreceni Egyetem Informatikai Kar Új eredmények a Chomsky-féle (formális) nyelvtípusokkal kapcsolatban Dr. Nagy Benedek.
Az Alakfelismerés és gépi tanulás ELEMEI
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig.
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
Dijkstra-algoritmus ismertetése
Algoritmusok II. Gyakorlat 3. Feladat Pup Márton.
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
1.4. Fordítás, szerkesztés, az objektumkönyvtár használata.
3.2. A program készítés folyamata Adatelemzés, adatszerkezetek felépítése Típus, változó, konstans fogalma, szerepe, deklarációja.
1 Mössbauer-spektrumok illesztése: vonalalak A kibocsátott  -sugárzás energiaspektruma Lorentz-görbe alakú: I : sugárzás intenzitása  : frekvencia 
Nyelvtechnológia Ladányi Enikő
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1.
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
Programozás III KOLLEKCIÓK.
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
Szeged, április 16. CACAO projekt katalógusok, digitális könyvtárak lekérdezése saját nyelven Moldován István Országos.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS Persa György.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1. Egyetemi konzulens: dr. Dobrowiecki Tadeusz (BME MIT)
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Gráf szélességi bejárása. Cél Az algoritmus célja az, hogy bejárjuk egy véges gráf összes csúcsát és kiírjuk őket a kezdőcsúcstól való távolságuk szerint.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.
Gépi tanulási módszerek
PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
Információelmélet 8. 1 Eszterházy Károly Főiskola, Eger Médiainformatika intézet Információs Társadalom Oktató-
HÁLÓZAT Maximális folyam, minimális vágás
A generatív nyelvelmélet
A Dijkstra algoritmus.
Mesterséges intelligencia
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
Leíró nyelvtan - adatbázisból
A mesterséges neuronhálók alapjai
Absztrakt problémák Q  I  S, az absztrakt probléma kétváltozós reláció az esetek (I) és a megoldások (S) halmazán Példa: legrövidebb út Eset: gráf és.
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

Szintaktikai elemzés március 1.

Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz), találjuk meg a szabályosságokat ami alapján korábban nem látott egyedeket be tudjuk az adott osztályokba.

Gépi tanulás Legfontosabb részfeladatok: egyed-jellemzők megtalálása megfelelő tanuló módszer kiválasztása, hangolása kiértékelés és visszacsatolás

Jellemzők Cél minden olyan jellemző összegyűjtése ami segítheti a predikciót (manuális) Tartsuk szem előtt a problémát! Típusai: diszkrét: értékek véges halmaza, nincs rendezés folytonos

Tanuló algoritmus

Kiértékelés és visszacsatolás Kiértékelési metrika: a jelölés jóságának (gold standard címkékhez viszonyított) leképezése egyetlen értékre. Feladatonként más és más metrika: „Hány spam-et jelöltünk spamnek” Visszacsatolás: elemzzük a hibáinkat! Lehetőségek: új jellemzők felvétele, paraméterek hangolása, stb.

Például egyedek: ek osztályok: SPAM vagy HAM adott egy tanuló adatbázis és ismeretlenelemek egy halmaza (teszt) feladat: tesztegyedek osztályba sorolása jellemzők: projekt munka tanuló algoritmus: J48 (C4.5) döntési fa kiértékelés (program) visszacsatolás…

A tanuló adatbázis mérete

POS tagger gépi tanulással jellemzők: első X morfológiai kódja a kérdéses szónak és a környező szavak (+/- 3 szó) lehetséges kódjai Másik lehetőség: iteratív javítás (rule induction) 1. minden szó kapjon véletlen kódot 2. Jellemzők: szó lehetséges kódja és szomszédok „jelölt” kódjai

Szintaktikai elemzés A mondat egységeinek azonosítása, a közöttük lévő szintaktikai kapcsolatok feltárása. Megközelítések: alany, állítmány, tárgy … szintaxis fa (syntactic parsing) Függőségi nyelvtan (dependency parsing)

Szintaxis fa S: mondat VP: igei csoport NP: főnévi csoport Egy példa a Szeged TreeBank-ből

Szintaxis fa Főige: robbed alany: the burglar robbed tárgya: the appartament

Strukturális többértelműség Láttam a lányt távcsővel. S VP NP

Strukturális többértelműség Láttam a lányt távcsővel. S VP NP

Szintaxis fa Haszna: gépi fordítás információ kinyerés … Megjegyzés: ~környezetfüggetlen nyelvtan (CFG), amit tényleg alkalmazásokban használnak: PCFG Másfajta megközelítés: zárójelezés (bracketing) ((A kutya)(nagyon ugatott).)

Top - Down elemzés a doghas a bone DetN S NPVP DetN VNP

Bottom-Up elemzés adoghasabone S DetNV N NP VP

Shift Reduce elemzés Bottom – Up, backtrack nélkül Verem segítségével dolgozik, O(n) Shift: Leválasztja a mondat legbaloldalibb elemét, és a verembe teszi. Reduce: A veremben lévő elemekre próbál szabályt illeszteni.

Shift Reduce elemzés →| StepActionStackInput 0(start)the dog barked 1shiftthedog barked 2reduceddog barked 3shiftdog dbarked 4reducen dbarked 5reducenpbarked 6shiftbarked np 7reducev np 8reducevp np 9reduce s

Shift Reduce tanulás Tanító halmaz alapján: reduce szabályok generálása szabályok közötti sorrend felállítása (maximum likelyhood) akciók (S/R) alkalmazásának tanulása

Függőségi nyelvtan Irányított, bináris kapcsolat szavak közt Kiindulási pont a főige Eltérés a szintaktikai fától: Nincsenek frázisok (szavak komponensei) Nem csak az egymást követő szavak közti kapcsolatokat vizsgálja

Függőségi nyelvtan Különösen alkalmas szabad szórendű nyelvek kezelésére!