Felügyelet nélküli jelentés- egyértelműsítési módszerek összehasonlítása Papp Gyula PPKE-ITK.

Slides:



Advertisements
Hasonló előadás
Közvetlen költségek elemzése
Advertisements

1 XVIII. Országos Postás Konferencia A január 1-jén hatályba lépő postatörvény a nemzetközi összehasonlításban Dr. Sümegi Péter Hatósági Kapcsolatok.
1 Nem fizethető ki az osztalék előleg devizában,
Tisztességtelen Devizahitelek?
Dixon Próbadb.Valószínűségi szint (p%) n10%5%1%7.3?4321 7? ,890,940,99pH7,07,27,3 4 0,68 0,770,89n=4 r 10 = (7,3-7,3)/(7,3-7,0) = 0 r 10 =(x 1 -x.
Diákversenyek 15 éve, a kezdetektől napjainkig Diák Menedzsment Bajnokság, 15. születésnap.
Modellezés a számvitelben
Egyetemisták a pénzügyi kultúráért
M IKOR MENNYIT KERESEL ?. J ÁRMŰ ÜZEMELTETÉS KÖLTSÉGÉNEK ÖSSZEHASONLÍTÁSA 2x96+18=210 óra x 53900/40 = 1350 Ft 168 óra x 3500 Ft.
Lízingpiac Magyarországon Előadók: Komlós Tamás Gombás Péter.
Tisztelt Hölgyeim és Uraim! Budapest, Előadó: Dr. Mihalik József
Hiteltörlesztési konstrukciók
1 „ Gazdasági kihívások 2009-ben ” Dr. Hegedűs Miklós Ügyvezető GKI Energiakutató és Tanácsadó Kft. Dunagáz szakmai napok, Dobogókő Április 15.
MÉRLEG ESZKÖZÖK FORRÁSOK F E ESZKÖZÖK Bázis Tárgy FORRÁSOK Bázis Tárgy
Képességszintek.
TK TK TK TK TK TK 1. Üzemép. 1. Műsz. ber. 2. Anyagok 2. Beftlen. t. „T1” Ny. Ny. Ny. Ny. Ny. Ny ESZKÖZÖK NYITÁSA:
SZÖVEGSZERKESZTÉS Boríték készítése.
30. Feladat – 6-7-es Minden Kft. A feladatok az alábbiak: Könyvelje le a január havi gazdasági eseményeket számlasorosan költséghely- költségviselő elszámolást.
Az új történelem érettségiről és eredményeiről augusztus Kaposi József.
A tételek eljuttatása az iskolákba
Példa Ft kölcsön esetében: Tehát azonos futamidő alatt és azonos összeg esetében a havi részlet nem növekvő hanem csökkenő összeggel!
Szintaktikai elemzés február 23..
A számítógépes nyelvfeldolgozás alapjai
GOOGLE 1998 szeptember Ma: az IN-es keresés 75%-a Webes keresés Képkeresés Usenet csoportokban Könyvtárban (hierarchikus katalógus) Egyéb szolgáltatások.
A diákat készítette: Matthew Will
Szállodagazdálkodás és vezetés I
Szállodagazdálkodás és vezetés I
1. IS2PRI2 02/96 B.Könyv SIKER A KÖNYVELÉSHEZ. 2. IS2PRI2 02/96 Mi a B.Könyv KönyvelésMérlegEredményAdóAnalitikaForintDevizaKönyvelésMérlegEredményAdóAnalitikaForintDeviza.
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Lineáris függvények.
Sárgarépa piaca hasonlóságelemzéssel Gazdaság- és Társadalomtudományi kar Gazdasági és vidékfejlesztési agrármérnök I. évfolyam Fekete AlexanderKozma Richárd.
100-as szög méreteinek gyakorisága (n = 100) db mm.
A villamosenergia-ellátás forrásoldalának alakulása
NOVÁK TAMÁS Nemzetközi Gazdaságtan
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
Merre tovább? Tapasztalatok a kétszintű latin nyelvi érettségiről.
A jelentés.
Pénz és Egység „vadászat” 3 családtag nevén történő befizetés 2 db Ft 1 db Ft összesen: Ft A JOG-ok kézi elhelyezése!
Algoritmusok II. Gyakorlat 3. Feladat Pup Márton.
A évi demográfiai adatok értékelése
Anyagok 3. feladat 168. oldal.
41. feladat Könyvviteltan szemináriumi és gyakorló feladatok Budapesti Corvinus Egyetem, Számvitel tanszék 2007/2008. tanév.
41. feladat Könyvviteltan szemináriumi és gyakorló feladatok Budapesti Corvinus Egyetem, Számvitel tanszék 2007/2008. tanév.
Kötelezettségek 7-8. feladat kidolgozása
Logikai szita Izsó Tímea 9.B.
Poszt-szocialista országok eredményei PISA 2003 Cs L M Szl x olvasás matematika.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Kormányszóvivői tájékoztató Az Európai Unió Strukturális Alapjainak magyarországi teljesítménye dr. Baráth Etele európai ügyekért felelős tárca nélküli.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
1 Szóródás Példák. 2 Szóródás munkatábla Árak nagysága (eЄ) xixi fifi didi
Kötvényárazási hibák intelligens javítóalgoritmusának tervezése és fejlesztése GELLÉN ÁGNES IUFQ58.
Százalék számítás - 1. feladat
= ) 12) ) 14) ) a) b)
Ki az aki meg van elégedve az anyagi helyzetével? Ki az aki nincs megelégedve az anyagi helyzetével? Ki az aki szeretne az anyagi helyzetén változtatni?
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
SPSS Predictive Applications Cseh Zoltán Budapest április 20.
HALLGATÓI ELÉGEDETTSÉGI VIZSGÁLATOK A WJLF-EN A es tanév eredményei.
1 Szélességi Bejárás Györgyi Tamás – GYTNAAI.ELTE 2007 Március 22 Algoritmusok És Adatszerkezetek 2 Gráfalgoritmus S b a d e f h g c.
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
Kvantitatív módszerek
Adatbányászati módszerek a weblogfájlok elemzésében
Kiugró adatok szűrése Dixon Próba db. Valószínűségi szint (p%) n 10%
HUF (210*180) HUF (210*180) HUF (140 CHF) HUF (210 CHF) Kamatrész Tőkerész HUF (140*180) 180 HUF fölötti rész [(240-
Devizahitel  A devizahitel olyan hitel, ahol mind a hitel folyósítása, mind pedig a törlesztése az adott devizában történik.
Hiteltörlesztési konstrukciók
Algoritmusok és adatszerkezetek
Otthonvédelmi akcióterv Árfolyamrögzítés augusztus 12.
Mesterséges intelligencia
Előadás másolata:

Felügyelet nélküli jelentés- egyértelműsítési módszerek összehasonlítása Papp Gyula PPKE-ITK

Tartalom  Bevezetés  Korpuszalapú jelentés-reprezentáció ◦ gráfokkal ◦ vektorokkal  Felügyelet nélküli jelentés-egyértelműsítés  Gráf- és vektoralapú módszerek összehasonlítása  Eredmények

Bevezetés  Hosszútávú cél: nagyobb szövegegységek jelentés-reprezentációja korpuszbeli szó-együttelőfordulások alapján  Mire lehet hasznos a korpusz? ◦ „You shall know a word by the company it keeps” (Firth, 1957) ◦ „Meanings of words are largely determined by their distributional patterns” (Harris, 1968) ◦ „Words that occur in similar contexts will have similar meanings” (Miller és Charles, 1991)  A szavak jellemző együtt-előfordulásai meghatározzák a szövegegység jelentését

Gráfalapú jelentés-reprezentáció  „Drágulnak a részletek, de még mindig jobban megéri a devizás, mint a forintalapú hitel.” forintalapú hitel törlesztés részlet euro kamat f orint svájci frank árfolyam THM deviza

Vektoralapú jelentés-reprezentáció  „Drágulnak a részletek, de még mindig jobban megéri a devizás, mint a forintalapú hitel.” árfolyamhitelbankdevizaforint részlet+hitelbank+euroárfolyam+forintpénznem+deviza 1000

Mitől jó a reprezentáció?  Mitől jó a reprezentáció? ◦ azonos jelentés – azonos ábrázolás ◦ hasonló jelentés – hasonló ábrázolás ◦ eltérő jelentés – eltérő ábrázolás  Az előző reprezentációk jók voltak??? ◦ az ábrázolások összehasonlíthatóak ◦ probléma: a jelentéseket nem tudjuk összehasonlítani!

„Drágulnak a részletek, de még mindig jobban megéri a devizás, mint a forintalapú hitel.” „A forint sokat vesztett értékéből az euróhoz képest.” euro f orint svájci frank árfolyam deviza érték forintalapú hitel törlesztés részlet euro kamat f orint svájci frank árfolyam THM deviza

„A postás kézbesíti a levelet.” „A levél feladója rossz címet írt rá a borítékra.” „A növények levelei zöldek.” levél1 levél2 feladó címzett postás boríték posta levél címzett postás kézbesít posta levél zöld fa növény virág gyökér levél

Felügyelet nélküli JEÉ  Van sok, a célszót tartalmazó környezetünk, de ezek nincsenek jelentésekkel címkézve  Milyen információhoz juthatunk csupán a környezetet használva?  Hipotézis: egy szó adott jelentéssel hasonló szavakkal fordul elő egy környezetben ◦ pl. a levél szó:  posta, feladó, postás, címzett, kézbesít, …  fa, növény, virág, ősz, hullik, … ◦ a célszó környezetét vizsgálva sok esetben elkülöníthetők a különböző „jelentések” (használati esetek) ◦ az elkülönített használati esetekhez hozzárendelhetők a megfelelő jelentések  a posta, … sorhoz a levél1  a fa, … sorhoz a levél2

levél1levél2 postás postazöld növényfakézbesítfeladó címzettfotoszintézis Gráfalapú JEÉ postás posta zöld növény fakézbesít feladócímzett fotoszintézis 0,1 0,2 0,30,1 0,8 0,1

postás posta zöld növény fa kézbesít feladó címzett fotoszintézis 0,1 0,2 0,30,1 0,8 0,1 Alkalmazás „A zöld autóból kiszálló postás adta át a levelet.” 1- 0,1 - 0,8 = 0,1 pont 1 pont <

Vektoralapú JEÉ  A célszóval jellemzően együtt előforduló jegyek meghatározása ◦ statisztikai módszerrel (ami a véletlennél gyakrabban fordul elő a célszóval azonos környezetben) ◦ a jegyek lehetnek szavak vagy együtt előforduló szópárok ◦ például a levél szónál a jegyek lehetnek:  fa, posta, feladó, növény, postás, címzett, virág, kézbesít, ősz, hullik

Vektoralapú JEÉ  Az egyes környezetekre vektorok készítése a bennük szereplő jegyek alapján növénycímpostásőszfa … 1.„A postás viszi a levelet a borítékon feltüntetett címre.” 2.„Ősszel a fákról lehullanak a levelek.” 3.…

Vektoralapú JEÉ  Hasonló vektorok csoportosítása ◦ klaszterezési algoritmus segítségével ◦ csoportok „középpontjainak” meghatározása

Vektoralapú JEÉ  Középpontokhoz jelentések hozzárendelése levél1 levél2

Összehasonlítás  A korpuszt egészében csak a jegyek kiválasztására használják  Bekezdésenként ábrázolják a korpuszt, majd ezeket csoportosítják  Hatékony futási idő  Jobb eredmények  Az egész korpuszra építenek kapcsolat- rendszert  Az így előállt gráfot bontják csoportokra  Hosszabb futási idő  Kevésbé jó eredmények Vektoralapú módszerek Gráfalapú módszerek

Kísérlet  20 angol főnév – 20 korpusz  Korpuszok bekezdései: ◦ tartalmazzák az aktuális célszót ◦ BNC-ből címkézetlenek (3000db/szó) ◦ Senseval-2 adatokból címkézettek ( db/szó)  Gráfalapú és vektoralapú algoritmusok

Eredmények SZÓMFSGRÁFVEKTOR art 0.440,46 authority 0.390,410,52 bar 0.430,560,59 chair 0.850,800,82 channel 0.300,490,64 child 0.590,650,63 church 0.570,700,71 circuit 0.270,360,63 day 0.630,630,62 facility 0.520,610,68 feeling 0.630,63 holiday 0.890,840,78 feeling 0.710,600,67 material 0.420,500,54 mouth 0.480,530,59 nation 0.850,770,74 nature 0.480,500,53 post 0.390,410,52 sense 0.330,450,43 stress 0.550,550,56 Átlag 0,509 0,5510,603

Köszönöm a figyelmet!

Webes keresés – találat? …..………. Az elsőbbségi levél olyan külön jelzéssel ellátott postai küldemény..…… ….címzett…… ……….boríték ……….…bélyeg …..….. A postás kézbesíti a levelet. ……………… A levél (fillum) a növények hajtás- tengelyének….. ….A növények levelei……… ……..levél…… ………….……l evél………… ……levelek… …

Gépi fordítás „The postman delivers the letters.” „The postman delivers the leaves.” „A postás kézbesíti a leveleket.” vagy

Vektoralapú JEÉ  Hasonló vektorok csoportosítása ◦ klaszterezési algoritmus segítségével ◦ csoportok „középpontjainak” meghatározása

Mérhetőség  Hogyan tudnánk mérhetővé tenni a reprezentáció minőségét? ◦ alkalmazzuk a reprezentációkat többjelentésű szavak jelentéseinek az elkülönítésére ◦ kiindulás: célszót tartalmazó bekezdések ◦ a kiindulási bekezdésekre elkészítjük a reprezentációt ◦ a hasonló reprezentációkat csoportokba szedjük ◦ a csoportokat megfeleltetjük a célszó egyes jelentéseinek ◦ mérési eredmény: milyen arányban sikerült eltalálni a tényleges jelentést (ehhez a célszó jelentéseivel címkézett környezetekre is szükség van)  Jelentés-egyértelműsítés (JEÉ)

Alkalmazások  Gépi fordítás  Webes keresés