BEA, GABI, Tini bea Bencsik-Marton Melánia Beszédadatbázisok és annotálás 2017/18 őszi félév
BEA kialakulása és tartalma A beszédkutatás új feladatai szükségessé tették egy modern technológián alapuló, a minőségi hangrögzítés minden kritériumát teljesítő, elsősorban fonetikai megalapozottságú és célú, többfunkciós korpusz létrehozását 2007 őszén indult a fejlesztés, 2008-ban megkezdődtek a beszédfelvételek 15 próbafelvétel → felvételi protokoll véglegesítése Spontán beszédet tartalmazó adatbázis, de tartalmaz felolvasásokat és ismétléseket is Narratíva, véleménykifejtés, tartalomösszegzés, mondatok utánmondása, felolvasás, háromfős társalgás
BEA adatközlői Eddig 417 felvétel Egynyelvű, budapesti felnőttek 20-70 év közötti az életkoruk Nemek, iskolázottság és életkor szerint arányosan oszlanak meg a felvételek Ép hallók Fonetikai Laboratórium csendesített helységében A felvételek mellett rögzítésre kerül a beszélők életkora, esetleges beszédhibája, iskolai végzettsége, foglalkozása, termete, súlya és, hogy dohányzik-e Kb. 60 perces felvételek
BEA lejegyzése Írásos tükröztetés: helyesírásban, központozás nélkül, jelezve a későbbi feldolgozás szempontjából fontosnak ítélt adatokat (megakadásjelenségek, fiziológiás hangadások) Először Word, aztán Transcriber, majd Praat
BEA hozzáférhetősége Az adatbázis használathoz regisztráció, az ehhez tartozó etikai nyilatkozat (felhasználási feltételek) elfogadása, továbbá egy, a kutatási tervre vonatkozó dokumentum elküldése szükséges. A kutatási terv leírása tartalmazza a kutató(k) nevét és affiliációját, e-mail címét, a tervezett kutatás rövid absztraktszerű leírását, illetve hallgatók esetében a témavezető nevét és e-mail címét. A regisztráció után az egyes hanganyagokhoz és lejegyzésekhez egyenként lehet hozzáférést kérni (egy alkalommal legfeljebb 10 fájlhoz).
Keresés a BEA-ban
GABI kialakulása, fejlesztése, felvételi protokoll 2007-ben merült fel az ötlet, hogy egy magyar nyelvű, sok beszélővel, széles életkori spektrumot lefedő gyermekbeszéd-adatbázist kellene létrehozni 2011-ben próbafelvételek 2013 gyermeknyelvi kutatócsoport alakult, melynek célja az adatbázis létrehozása Jelenleg fejlesztés alatt áll Fonetikailag megalapozott, többfunkciós spontánbeszéd-adatbázis Köznyelvet beszélő gyermekek beszédének rögzítése 3-18 éves gyermekek/fiatalok (terv: életkoronként 50-50 felvétel, összesen 900 felvétel elkészítése)
Egynyelvű gyermekek (próbaként készültek kétnyelvű gyermekekkel is felvételek) Kb. 30-40 perces felvételek Felvételi protokoll a BEA protokollja alapján (átalakítva két korcsoport szerint) A hanganyagok rögzítése a gyermekek természetes környezetében történik (óvoda, iskola, otthon) 405 felvétel, ebből 40 annotált Célja: hogy képet kapjunk a beszédtervezés sajátosságairól az anyanyelv-elsajátítás későbbi szakaszaiban is, illetve a beszéd akusztikai jellemzőinek életkori változásairól
GABI hozzáférhetősége Nincs weboldala Bóna Juditnak írt ímélben lehet kérni felvételeket Cserébe részt kell venni a GABI fejlesztésében
Tini BEA Szükség volt egy olyan adatbázis létrehozására, mely segítséget nyújt a tizenévesek beszédének vizsgálatához (kevésbé kutatott téma) BEA adatbázis kiegészítése 2013-ban indult Alkalmas fonetikai, alkalmazott fonetikai és pszicholingvisztikai kutatásokra A hangfelvételek a BEA protokollja szerint készülnek Társalgás helyett „zsebszöveg”, 2 diák vesz részt a beszélgetésben, így az adatközlők a BEA-val ellentétben párosával érkeznek a felvételre A felvételeket az MTA Fonetikai Osztályán található zajszigetelt szobában készítik 10 fiú, 8 lány, egynyelvű, köznyelvet beszélő budapesti középiskolások (16-17 évesek) 18 felvétel Hozzáférhetősége: Ugyanaz, mint a BEA-nál, csak keresni nem lehet benne, csak személyesen elkérni a felvételeket
Szakirodalom Bóna Judit – Imre Angéla – Markó Alexandra – Váradi Viola – Gósy Mária: GABI – Gyermeknyelvi Beszédadatbázis és Információtár. Beszédkutatás 2014. 246-251. Gyarmathy Dorottya – Neuberger Tilda: Egy hiánypótló adatbázis a Tini BEA. Beszédkutatás 2015. 209-221. Gósy Mária 2008. Magyar spontánbeszéd-adatbázis – BEA. Beszédkutatás 2008. 194–207. Gósy Mária – Gyarmathy Dorottya – Horváth Viktória – Gráczi Tekla Etelka – Beke András – Neuberger Tilda – Nikléczy Péter 2012. BEA:Beszélt nyelvi adatbázis. In Gósy Mária (szerk.): Beszéd, adatbázis, kutatások. Akadémiai Kiadó, Budapest, 9– 24. Gyarmathy Dorottya – Neuberger Tilda 2011. A BEA-adatbázis alkalmazásfüggőlejegyzései. Beszédkutatás 2011.109−120.
Köszönöm a figyelmet!