Szövegfeldolgozás ontológiák segítségével – fogalmak azonosítása Szekeres András Márk.

Slides:



Advertisements
Hasonló előadás
Hogyan jutunk információkhoz az interneten
Advertisements

Készítette: Kosztyán Zsolt Tibor
Programozási tételek, és „négyzetes” rendezések
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Hirdetésfeladás, vásárlás az interneten, aukciós oldalak.
Néhány fontos terület a Kreatív Ipar fejlődéséhez
Internet ismeretek II..
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
A felnőttképzés jövőképe (Érdemes-e intézményi stratégiát alkotni?) Akkreditált Felnőttképzési Intézmények Országos Egyesülete – országos konferencia (2008.
INFORMÁCIÓKERESÉS JELENTÉSREPREZENTÁCIÓ ALAPJÁN
Tengeralattjáró győzelmi hírek elmaradása – kilövés
Az információszerzés.
A BNO10 formális formális reprezentálása a GALEN alapján
Elsősegély-oktatás az iskolákban, vagy a klubokban
Érvek, érvelés.
Szemiot i ka.
Út a beszédértéstől a szövegértésen keresztül a matematikai problémák megoldásáig Előadó: Horváth Judit.
Képességszintek.
Online gazdasági informatika szótár fejlesztése OGIL Dr. Pitlik László, Pásztor Márta, Popovics Attila, Bunkóczi László, Pető István Szent István Egyetem,
Logika Miskolci Egyetem Állam- és Jogtudományi Kar
Készítette: Cselényi Szandra Nóra
Az informatika alapjai
Boole- féle algebra Készítette: Halász Rita I. István Szakképző Iskola szeptember 19.
Logika Érettségi követelmények:
Szintaktikai elemzés február 23..
A számítógépes nyelvfeldolgozás alapjai
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
Kimeneti követelmények a 8. osztály végén
Embléma, logotípia, piktogram, címer.
A digitális számítás elmélete
A digitális számítás elmélete
Az érvelés.
Halmazelmélet és matematikai logika
Bevezetés az orvosi kódrendszerekhez 2. előadás Semmelweis Egyetem Egészségügyi szervező szak II. évf
A nyelv problémája természetes, és mesterséges nyelvek.
FoglalkoztaTárs - Társ a foglalkoztatásban október 24. Baktalórántháza Észak-alföldi regionális szakmai műhelymunka Kék Pont Alapítvány.
Szakértők és rendszerek
Idegennyelvű korpuszok Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
Gondolatok az EVH Tájékoztatási Központjának második éves munkaprogramjához, kiemelten kezelve a Leader-t Haris Martinos, EVH Tájékoztatási Központ csapatvezetője.
1. Bevezetés a tárgy célja: azoknak az eszközöknek és módszereknek a megismertetése és begyakoroltatása, melyek az érvelések megértéséhez, elemzéséhez,
Scenáriók készítése Dr. Kollár József Magyar Coachszövetség Közhasznú Alapítvány.
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Naturalista filozófia Avagy milyen állásponton lehetünk azzal kapcsolatban, hogy hogyan épül fel a világ? Sipos Péter Budapest, 2007 október 10.
A metafizika és a természettudomány. Különböző érzékszervi ingereket érzünk, melyeket alkalmi mondatokkal fejezhetünk ki. Pl.: a tej látványára a „Tej.
„Házasodj meg, meg fogod bánni; ne házasodj meg, azt is meg fogod bánni; házasodj vagy ne házasodj, mindkettőt meg fogod bánni; vagy megházasodsz, vagy.
Logika szeminárium Előadó: Máté András docens Demonstrátorok:
Logika Miskolci Egyetem Állam- és Jogtudományi Kar Jogelméleti és Jogszociológiai Tanszék.
Rendszám Felismerő Rendszer Fajt Péter Vácz István
1 A Nyelvi Tesztelés és Értékelés Európai Egyesülete (EALTA)
Az irodalomtudomány alapjai
Általában a kétszintű informatika érettségiről. Források, ahol utána nézhetünk részletesebben:
Nicsak, ki beszél – már a számítógépek is... Szita István Eötvös Collegium.
Logika szeminárium Előadó: Máté András docens Demonstrátorok:
A szövegértés diagnosztizálása és fejlesztése
Visegrád, Könyvvizsgálat, Minőség-ellenőrzés és
Zámbó Imre, ismertebb nevén Zámbó Jimmy (Budapest, január 20. – Budapest, január 2.) A magyar zenészvilág egy része, és főként rajongói.
Gyakorló óra 5/12.
Információelmélet 8. 1 Eszterházy Károly Főiskola, Eger Médiainformatika intézet Információs Társadalom Oktató-
Wikipédia Készítette: Csaplár Dominik Wikipédia A Wikipédia többnyelvű, nyílt tartalmú, a nyílt közösség által fejlesztett webes világenciklopédia. A.
Természetes nyelvi interfészek
Analitikus fa készítése Ruzsa programmal
Logika szeminárium Barwise-Etchemendy: Language, Proof and Logic
Egy sakk feladat megoldása algoritmussal
Elméleti probléma: vajon minden következtetés helyességét el tudjuk dönteni analitikus fával (véges sok lépésben)? Ha megengedünk végtelen sok premisszás.
Informatikai gyakorlatok 11. évfolyam
Szervezeti tanulás: elméleti keretek i.
Előadás másolata:

Szövegfeldolgozás ontológiák segítségével – fogalmak azonosítása Szekeres András Márk

Ontológia fogalmainak azonosítása Minden ontológia alapú szövegfeldolgozás egyik kulcslépése. Minden ontológia alapú szövegfeldolgozás egyik kulcslépése. Keresés „szemantikusabbá” tétele Keresés „szemantikusabbá” tétele Ontológia (vagy Topicmap) alapú keresés, kategorizálás Ontológia (vagy Topicmap) alapú keresés, kategorizálás Szövegből logikai állítások kinyerése Szövegből logikai állítások kinyerése Ragozott szóalakok szótövezését megoldottnak tekintjük. (A projektben a szószablyát alkalmazzuk). Ragozott szóalakok szótövezését megoldottnak tekintjük. (A projektben a szószablyát alkalmazzuk).

Referenciális többértleműség Továbbra is probléma, hogy az ontológia fogalma más szóként szerepel a szövegben. Továbbra is probléma, hogy az ontológia fogalma más szóként szerepel a szövegben. Utalószavak. Szintaktikai elemző feladata, hogy ha fel nem is oldja (van amikor emberi olvasó se képes erre), de legalább jelölteket adjon. A „referenciális többértelműség” az irodalomban csak erre vonatkozik, én kiterjesztve használom. Utalószavak. Szintaktikai elemző feladata, hogy ha fel nem is oldja (van amikor emberi olvasó se képes erre), de legalább jelölteket adjon. A „referenciális többértelműség” az irodalomban csak erre vonatkozik, én kiterjesztve használom. Szinonímák. Szinoníma szótárakkal felismerhetőek. Szinonímák. Szinoníma szótárakkal felismerhetőek. Van egy harmadik eset is, ennek egy példája „Feltettem a rízst főni. Leültem TVzni, és nem vettem észre, hogy odaégett az étel”. Ezzel fogunk foglalkozni, nevezzük Asszociatív referenciának. Van egy harmadik eset is, ennek egy példája „Feltettem a rízst főni. Leültem TVzni, és nem vettem észre, hogy odaégett az étel”. Ezzel fogunk foglalkozni, nevezzük Asszociatív referenciának.

Asszociatív referencia Ez az eset vizsgálata szinte teljesen elhanyagolt, pedig rendkívül gyakori, az emberi beszéd alapvető jellemzőjének tűnik. Ez az eset vizsgálata szinte teljesen elhanyagolt, pedig rendkívül gyakori, az emberi beszéd alapvető jellemzőjének tűnik. Egy (újságcikkek kis corpusára kiterjedő) vizsgálatom alapján a mondatok 90%-ban van ilyen fajta referencia. Orvosi zárójelentések (úgyszintén kis corpusára kiterjedő) vizsgálatom alapján a szinoníma vagy asszociatív referencia a mondatok 40%-ban van. Egy (újságcikkek kis corpusára kiterjedő) vizsgálatom alapján a mondatok 90%-ban van ilyen fajta referencia. Orvosi zárójelentések (úgyszintén kis corpusára kiterjedő) vizsgálatom alapján a szinoníma vagy asszociatív referencia a mondatok 40%-ban van. Leggyakrabban a referált fogalmat egy általánosabb kategória helyettesít. A projekt során ezzel a jelenséggel foglalkozunk, de a későbbiekben ki tervezzük terjeszteni az algoritmust más esetekre is. Leggyakrabban a referált fogalmat egy általánosabb kategória helyettesít. A projekt során ezzel a jelenséggel foglalkozunk, de a későbbiekben ki tervezzük terjeszteni az algoritmust más esetekre is.

Eljárás Egy, az ontológiában megtalált szóhoz érve generáljuk az alatta levő fogalmakat, ez a jelöltek halmaza. Egy, az ontológiában megtalált szóhoz érve generáljuk az alatta levő fogalmakat, ez a jelöltek halmaza. A jelölteket a szövegkörnyezet (más, már beazonosított fogalmak) alapján súlyozzuk (relációk mentén milyen távol vannak egymástól). A jelölteket a szövegkörnyezet (más, már beazonosított fogalmak) alapján súlyozzuk (relációk mentén milyen távol vannak egymástól). Példa: „A hallócsont ép, nyálkahártya egészséges”. Itt a nyálkahártya valójában a „dobüregi nyálkahártyára” vonatkozik, amely a kontextusból ki is derül (a hallócsont located-in relációban van a dobüreggel, a dobüregi nyálkahártya is). Példa: „A hallócsont ép, nyálkahártya egészséges”. Itt a nyálkahártya valójában a „dobüregi nyálkahártyára” vonatkozik, amely a kontextusból ki is derül (a hallócsont located-in relációban van a dobüreggel, a dobüregi nyálkahártya is).

MTIs alkalmazás Az MTI híradatbázisan több demo alkalmazást tervezünk: a hírek kategorizálását és egy szemantikus(abb) keresést. Az MTI híradatbázisan több demo alkalmazást tervezünk: a hírek kategorizálását és egy szemantikus(abb) keresést. „Meghalt Zámbó Jimmy kedd délelőtt a Honvéd Kórházban - közölte Katona István főorvos a helyszínen tartózkodó újságírókkal. A népszerű előadóművész reggel hat óra tájban saját fegyverével lőtte fejbe magát, a mentők életveszélyes állapotban, koponyasérüléssel szállították a Honvéd Kórházba. Az énekes - az eddigi ismeretek szerint – fegyverviselési engedéllyel rendelkezett.” „Meghalt Zámbó Jimmy kedd délelőtt a Honvéd Kórházban - közölte Katona István főorvos a helyszínen tartózkodó újságírókkal. A népszerű előadóművész reggel hat óra tájban saját fegyverével lőtte fejbe magát, a mentők életveszélyes állapotban, koponyasérüléssel szállították a Honvéd Kórházba. Az énekes - az eddigi ismeretek szerint – fegyverviselési engedéllyel rendelkezett.” A fenti szövegben egyszer szerepel „Zámbó Jimmy” és „Katona István”. Hagyományos kereső szerint a cikk ugyanannyira szól mindkettőjükről. Azonban az algoritmusunkat használva kiderül, hogy Zámbó Jimmy háromszor is szerepel, asszociatív referenciával. Ezeknek a referenciáknak a felismerése nagy mértékben növeli a keresés és/vagy kategorizálás hatékonyságát. A fenti szövegben egyszer szerepel „Zámbó Jimmy” és „Katona István”. Hagyományos kereső szerint a cikk ugyanannyira szól mindkettőjükről. Azonban az algoritmusunkat használva kiderül, hogy Zámbó Jimmy háromszor is szerepel, asszociatív referenciával. Ezeknek a referenciáknak a felismerése nagy mértékben növeli a keresés és/vagy kategorizálás hatékonyságát.

Ontológia készítés A megközelítés egyben ontológiák ellenőrzésére is alkalmas. A megközelítés egyben ontológiák ellenőrzésére is alkalmas. Az ontoclean-nel megjelent az első komoly, elméleti alapokon nyugvó módszertan (amely azonban még mindig csak Arisztotelészig jutott, az informatika számára releváns episztemológia, ontológia és nyelv- filozófia több ezer éves irodalmában.) Az ontoclean-nel megjelent az első komoly, elméleti alapokon nyugvó módszertan (amely azonban még mindig csak Arisztotelészig jutott, az informatika számára releváns episztemológia, ontológia és nyelv- filozófia több ezer éves irodalmában.) A nyelvfeldolgozás szempontjából az ontológiáknak a nyelvet kell leírniuk. Ez és ehhez hasonló alkalmazások visszajelzést adnak arra, hogy mennyire jól sikerült ez. Kísérleti ellenőrzésee az ontológiák helyességének. A nyelvfeldolgozás szempontjából az ontológiáknak a nyelvet kell leírniuk. Ez és ehhez hasonló alkalmazások visszajelzést adnak arra, hogy mennyire jól sikerült ez. Kísérleti ellenőrzésee az ontológiák helyességének.