Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Annotáció, annotációs útmutató Korpuszok a nyelvészeti kutatásban – 2013. október 24.

Hasonló előadás


Az előadások a következő témára: "Annotáció, annotációs útmutató Korpuszok a nyelvészeti kutatásban – 2013. október 24."— Előadás másolata:

1 Annotáció, annotációs útmutató Korpuszok a nyelvészeti kutatásban – október 24.

2 Tervezés Mit szeretnénk pontosan annotálni? Pontos (nyelvészeti) definíció Érthető legyen mások (nem nyelvészek) számára is Mit NEM szeretnénk annotálni? Határok meghúzása

3 Cél megfogalmazása Miért akarjuk ezt jelölni? Mire lesz jó? Nyelvészeti felhasználás? Elméleti? Alkalmazott? Számítógépes alkalmazás? Mindegyik?

4 Szövegek kiválasztása Forrás, mennyiség, tematika a felhasználás függvénye Van-e elegendő hozzáférhető anyag?

5 Technikai háttér kiválasztása Miben annotálunk? Feladatfüggő! Nyers szövegben kell szövegrészeket jelölni (pl. tulajdonnévi annotáció): „színező” (TextAnnotator) Több lehetőség közül kell választani (pl. szófaji egyértelműsítés): rádiógombos felület (Tagging Assistant) Szintaktikai fák készítése: speciális szerkesztőfelület (TrEd)

6 Próbaannotáció Kezdjünk el dolgozni a szöveg egy részén még az éles annotáció előtt A kezdeti nehézségek gyorsan előbukkannak… Nem várt nehéz esetek Új kategóriák felbukkannak Technikai gondok -> ki kell javítani / újra kell definiálni a feladatot

7 Annotációs útmutató Mi a feladat? Mi az eszköz, amiben dolgozunk? Milyen lépései vannak a jelölésnek? –Technikai oldalról –Nyelvi oldalról (lehet pl. hierarchikus jelölés: alkategóriákat is jelölünk) Hogyan határozzuk meg, hogy jelölünk-e? (nyelvi tesztek) Példák

8 A próbaannotációból sok példát lehet meríteni Írjuk bele az útmutatóba Segít az annotátoroknak Rendszeresen előforduló kétértelmű esetekben foglaljunk egyértelműen állást (birtokos szerkezet névelője?) Negatív példák is fontosak: mit NEM kell jelölni (ami esetleg annak tűnik, de mégsem az…)

9 Annotátorok Hány kell? Kik annotáljanak? Mennyire kell nyelvészeti / nyelvi tudás? Nyelvészek Laikusok Crowdsourcing / Mechanical Turk Mennyiség vs. minőség… Ha gyorsan kell sok (nem nyelvi) adat, jó lehet…

10 Annotátorok - 2 Elég-e a szimpla annotáció? Egyetértési arány Mennyit annotáljanak duplán? Mi lesz az etalon? –Eltérések kézi egyértelműsítése –Többségi jelölés –Annotációk metszete –Annotációk uniója

11 Annotáció végén Korpuszfájlok összeillesztése Technikai simítások Korpuszdokumentáció készítése (cikk, readme) A korpusz publikálása Hozzáférhetőség –Ingyenes (kutatási, oktatási célra) –Fizetős Licencek


Letölteni ppt "Annotáció, annotációs útmutató Korpuszok a nyelvészeti kutatásban – 2013. október 24."

Hasonló előadás


Google Hirdetések