Annotációs eszközök Korpuszok a nyelvészeti kutatásban – 2018. szeptember 28.

Slides:



Advertisements
Hasonló előadás
Ó- és középmagyar morfológiai elemző Novák Attila.
Advertisements

A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR KUTATÓK ÉJSZAKÁJA SZEPTEMBER 24. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS, OFFLINE.
A BNO10 formális formális reprezentálása a GALEN alapján
Számítógépes szövegelemzés IT3-BT, május 11.
 W3C Magyar Iroda Megnyitó, szept. 24. A CORES projekt bemutatása Micsik András MTA SZTAKI Elosztott Rendszerek Osztály.
Az Office 2007 tanári szemmel Farkas Csaba. Az Access 2007 újdonságai.
MI 2003/ Néhány probléma: - Hogyan fordítanánk angolra? - Hogyan érthetnénk meg egy rövid törénetet? - Miként lehetne kigyűjteni az MTI hírekből.
Weben publikált térképek a földrajzi kutatásokban Ádám Eszter Geográfus MSc hallgató.
ELTE Egyetemi Könyvtári Szolgálat Egyetemi Könyvtár Használati útmutató az új WEBOPAC katalógushoz.
Korpuszok, szegmentálás és szófaji elemzés
Szintaktikai elemzés február 23..
Dokumentum klasszifikáció október 12.. Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum:
A számítógépes nyelvfeldolgozás alapjai
A számítógépes nyelvfeldolgozás alapjai
Korpuszok és adatbázisok
Számítógépes Nyelvészet – nyelvi adatbázisok és használatuk
Korpuszok és adatbázisok A számítógépes nyelvfeldolgozás alapjai A számítógépes nyelvfeldolgozás alapjai – február 14.
Információ kinyerés november 21.. Információ kinyerés Information Exctraction (IE) A feladat szempontjából fontos információ automatikus kigyűjtése.
Annotáció, annotációs útmutató
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
A Magyar Antikvakorpusz fejlesztése. A nyers korpusz főbb adatai A felölelt periódus: 1527–1576 A szövegek száma: 103 (több mint 43 szerzőtől, 9 műfajból,
Koreferencia-annotáló eszköz fejlesztése hálózati környezetben Oltványi Gábor József Oltványi Gábor József diplomaterv bemutató PPKE-ITK, Témavezető:
Instant alkalmazások SharePoint platformon. A fejlesztés és a testre szabás határai elmosódtak. A testre szabást végző legtöbbször nem programozó A.
A nyelv problémája természetes, és mesterséges nyelvek.
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
Microsoft Access Menük és eszköztárak.
Microsoft BI technológiák az eszközmenedzsment szolgálatában
Hálózati és Internet ismeretek
Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor?
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
Idegennyelvű korpuszok Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály
Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály XML-alapú komplex korpusz-lekérdezés.
A szöveg lekérdezése A NooJ rendszer alapjai
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
Szemantikus keresők.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
ALGORITMUSOK.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
o Minden elektronikus formában érhető el o A munkafolyamatok egy része automatizálható, így a szolgáltatások gyorsabbak és hatékonyabbak lehetnek o A.
Egy magyar WordNet felé Miháltz Márton, Dr. Prószéky Gábor MorphoLogic.
11. tétel Adatbázis táblái közti kapcsolatok optimalizálása
Jegyzetelő Alkalmazás Táblagépekre Farkas Tamás /7 OE-NIK Farkas Tamás.
Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor?
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
Oktatóprogram CINAHL keresés
Korpuszok létrehozása
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
CALDERONI FORRÁSKEZELŐ RENDSZER A Calderoni Program során fejlesztésre kerülő rendszer vázlatos bemutatása.
Az Access 2007 újdonságai. Eltérések már indításkor is Indításkor új felületet kapunk Új adatbázis: sablonok segítségével is Mintapéldánk Árucikkek.accdb,
Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.
Cél – a biztonsági szempontokat is figyelembe vevő betekintés a vállalati adatokba a szervezet összes munkatársa számára, hogy optimális döntéseket hozhassanak,
Rétegmentesítés megvalósítása XML segítségével Kovács Máté.
Moodle tesztkérdések létrehozása különféle módokon dr
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
A generatív nyelvelmélet
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
A szoftver mint komplex rendszer A fejlesztési módszertanok általános céljai: Összetett problémák kezelhetővé tétele A fejlesztési és megtérülési jellemzők.
Webáruház rendszerek Reisz Péter G-3S
6. Automatikus korpuszépítés és a benne való keresés
HunTéka – több mint könyvtári rendszer
Közgyűjteményi megoldások
Szabályozások.
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
Java Code Coverage Library
ELTE Egyetemi Könyvtári Szolgálat Egyetemi Könyvtár
Előadás másolata:

Annotációs eszközök Korpuszok a nyelvészeti kutatásban – 2018. szeptember 28.

Excel Táblázatos adatok Néhány annotálandó kategória Szótárszerkesztés, szemantikai jegyek, kulcsszavazás… + Egyszerű kezelni + Könnyen elérhető + Szűrés, statisztika elérhető Nem mindig átlátható Nincs GUI

TextAnnotator Nyers szöveg (txt) Többféle (hierarchikus) annotációs réteg Token és frázis szint is Bizonytalanság, többszavas kifejezések, tulajdonnevek, véleménydetekció, CV-k… + Egyszerű kezelni + Ingyen elérhető + Áttekinthető annotáció (GUI) Testre szabás kell (minimális kódolás) Az annotáció kigyűjtése (kódolás)

MMAX Token, frázis és szöveg szintű annotáció Egy elemhez többféle választási lehetőség Hierarchikus jelölés Szavak közti relációk jelölhetők Szófaji egyértelműsítés, szintaxis, koreferencia… + Sokrétű feladatra egy felület + Ingyen elérhető XML-formátum (előelemzés, konvertálás) Az annotáció kigyűjtése (kódolás)

VisDic Synset szintű annotáció Szavak hálóba kapcsolása Wordnet építése, ontológiák kezelése… + Egyszerű kezelni (GUI) + Ingyen elérhető + Célfeladat sajátságaira van szabva + Keresést is támogat + Többnyelvű keresés / adatszerkesztés XML-formátum (konvertálás) Kisebb működési problémák (bugok)

SenseTagger Token, frázis és szöveg szintű annotáció Egy elemhez többféle választási lehetőség Kontextus megjeleníthető Jelentés-egyértelműsítés, véleménykinyerés… + Egyszerűen kezelhető (GUI) + Ingyen elérhető XML-formátum (előelemzés, konvertálás) Az annotáció kigyűjtése (kódolás)

TrEd Mondatszintű annotáció Perl Függőségi fák (dependencia) + Egyszerűen kezelhető (GUI) + Átlátható ágrajzok + Könnyen mozgatható csomópontok + Ingyen elérhető fs formátum (konvertálás, fs2conll, conll2fs)

Saját projektek Milyen szövegek? Mennyi szöveg? Szövegek forrása (web, MEK…) Mi az annotációs feladat? Mik az annotálandó kategóriák? Mi az annotálás szintje? Milyen eszköz lenne jó a célra?