Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
BEA, GABI, Tini bea Bencsik-Marton Melánia
Beszédadatbázisok és annotálás 2017/18 őszi félév
2
BEA kialakulása és tartalma
A beszédkutatás új feladatai szükségessé tették egy modern technológián alapuló, a minőségi hangrögzítés minden kritériumát teljesítő, elsősorban fonetikai megalapozottságú és célú, többfunkciós korpusz létrehozását 2007 őszén indult a fejlesztés, 2008-ban megkezdődtek a beszédfelvételek 15 próbafelvétel → felvételi protokoll véglegesítése Spontán beszédet tartalmazó adatbázis, de tartalmaz felolvasásokat és ismétléseket is Narratíva, véleménykifejtés, tartalomösszegzés, mondatok utánmondása, felolvasás, háromfős társalgás
3
BEA adatközlői Eddig 417 felvétel Egynyelvű, budapesti felnőttek
20-70 év közötti az életkoruk Nemek, iskolázottság és életkor szerint arányosan oszlanak meg a felvételek Ép hallók Fonetikai Laboratórium csendesített helységében A felvételek mellett rögzítésre kerül a beszélők életkora, esetleges beszédhibája, iskolai végzettsége, foglalkozása, termete, súlya és, hogy dohányzik-e Kb. 60 perces felvételek
4
BEA lejegyzése Írásos tükröztetés: helyesírásban, központozás nélkül, jelezve a későbbi feldolgozás szempontjából fontosnak ítélt adatokat (megakadásjelenségek, fiziológiás hangadások) Először Word, aztán Transcriber, majd Praat
5
BEA hozzáférhetősége Az adatbázis használathoz regisztráció, az ehhez tartozó etikai nyilatkozat (felhasználási feltételek) elfogadása, továbbá egy, a kutatási tervre vonatkozó dokumentum elküldése szükséges. A kutatási terv leírása tartalmazza a kutató(k) nevét és affiliációját, címét, a tervezett kutatás rövid absztraktszerű leírását, illetve hallgatók esetében a témavezető nevét és címét. A regisztráció után az egyes hanganyagokhoz és lejegyzésekhez egyenként lehet hozzáférést kérni (egy alkalommal legfeljebb 10 fájlhoz).
6
Keresés a BEA-ban
10
GABI kialakulása, fejlesztése, felvételi protokoll
2007-ben merült fel az ötlet, hogy egy magyar nyelvű, sok beszélővel, széles életkori spektrumot lefedő gyermekbeszéd-adatbázist kellene létrehozni 2011-ben próbafelvételek 2013 gyermeknyelvi kutatócsoport alakult, melynek célja az adatbázis létrehozása Jelenleg fejlesztés alatt áll Fonetikailag megalapozott, többfunkciós spontánbeszéd-adatbázis Köznyelvet beszélő gyermekek beszédének rögzítése 3-18 éves gyermekek/fiatalok (terv: életkoronként felvétel, összesen felvétel elkészítése)
11
Egynyelvű gyermekek (próbaként készültek kétnyelvű gyermekekkel is felvételek)
Kb perces felvételek Felvételi protokoll a BEA protokollja alapján (átalakítva két korcsoport szerint) A hanganyagok rögzítése a gyermekek természetes környezetében történik (óvoda, iskola, otthon) 405 felvétel, ebből 40 annotált Célja: hogy képet kapjunk a beszédtervezés sajátosságairól az anyanyelv-elsajátítás későbbi szakaszaiban is, illetve a beszéd akusztikai jellemzőinek életkori változásairól
12
GABI hozzáférhetősége
Nincs weboldala Bóna Juditnak írt ímélben lehet kérni felvételeket Cserébe részt kell venni a GABI fejlesztésében
13
Tini BEA Szükség volt egy olyan adatbázis létrehozására, mely segítséget nyújt a tizenévesek beszédének vizsgálatához (kevésbé kutatott téma) BEA adatbázis kiegészítése 2013-ban indult Alkalmas fonetikai, alkalmazott fonetikai és pszicholingvisztikai kutatásokra A hangfelvételek a BEA protokollja szerint készülnek Társalgás helyett „zsebszöveg”, 2 diák vesz részt a beszélgetésben, így az adatközlők a BEA-val ellentétben párosával érkeznek a felvételre A felvételeket az MTA Fonetikai Osztályán található zajszigetelt szobában készítik 10 fiú, 8 lány, egynyelvű, köznyelvet beszélő budapesti középiskolások (16-17 évesek) 18 felvétel Hozzáférhetősége: Ugyanaz, mint a BEA-nál, csak keresni nem lehet benne, csak személyesen elkérni a felvételeket
14
Szakirodalom Bóna Judit – Imre Angéla – Markó Alexandra – Váradi Viola – Gósy Mária: GABI – Gyermeknyelvi Beszédadatbázis és Információtár. Beszédkutatás Gyarmathy Dorottya – Neuberger Tilda: Egy hiánypótló adatbázis a Tini BEA. Beszédkutatás Gósy Mária Magyar spontánbeszéd-adatbázis – BEA. Beszédkutatás –207. Gósy Mária – Gyarmathy Dorottya – Horváth Viktória – Gráczi Tekla Etelka – Beke András – Neuberger Tilda – Nikléczy Péter BEA:Beszélt nyelvi adatbázis. In Gósy Mária (szerk.): Beszéd, adatbázis, kutatások. Akadémiai Kiadó, Budapest, 9– 24. Gyarmathy Dorottya – Neuberger Tilda A BEA-adatbázis alkalmazásfüggőlejegyzései. Beszédkutatás −120.
15
Köszönöm a figyelmet!
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.