Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

A szófelismerés információs értelmezése

Hasonló előadás


Az előadások a következő témára: "A szófelismerés információs értelmezése"— Előadás másolata:

1 A szófelismerés információs értelmezése
Információs pszicholingvisztika 2. óra Pléh Csaba ősz

2 Áttekintés Gyakoriság és a szótár. Ziff törvények.
Predikció a vizuális szófelismerésben. Bejóslás és felismerési idő. Kohorsz elmélet és a szókezdet értéke. ‘Az egyéni szótár információs elemzése.

3 Gyakorisági viszonyok a nyelv egészében
A Zipf törvények Estoupf gyorsíró is észrevette már A szó gyakorisága fordított arányban áll rangszámával. Vagyis nagyon gyakori szó kevés van, ritka szó sok. Zipf első törvénye Ri ~ 1/iα Ahol α ~ 1 Hozzá hasonló Lotka törvény, Pareto eloszlás: Kevés sokat publikáló, s kevés nagyin gazdag ember van Mandelbrot általánosítja, optimális információként értelmezi

4 Ziff törvény Németh Géza és Zainkó Csaba (BME) adatai

5 A leggyakoribb szavak : Mit tudunk meg ebből? Mi a népszerű a nyelvben ?

6 Milyen gyakorlati következményei vannak?
Írásban, rövidítésben. Sok rövidítés kell-e? Szókincs elsajátításában gyermekeknél Szókincs növekedésében második nyelven. A hapax szerepe Tárolásban, keresési optimalizációban

7 Zipf „második törvénye”
A gyakori szó rövidebb. A legkisebb erőfeszítés törvénye Egy példa az Anna Karenyina 1. fejezetére

8 Ennek finomítása. ‚információs tartalom’ jobban mutatja a gyakoriságot
Minél bejósolhatóbb valami, annál kevesebb erőfeszítés a bejóslásához

9 Menjünk át pszicholingvisztikára Szavak felismerése és a mentális szótár
Alaptények: gyakoriság, kontextus felülről-lefelé kutya – kuvasz Hozzáférési utak: akusztikus, grafémikus, közös. Általánosítás 1: a jelentés egy közös szótárban Általánosítás 2: a hó és a hav a Hóhoz kapcsol Általánosítás 3: a szófaj is tárolva van, s sok mindent elárul pl. kabát *ik hisz a kabát főnév

10 A szavak gyakorisága gyakran felmerül
Olvasás és szókincs tudás mérés megalapozásához Asszociatív adatok értelmezéséhez Betegek bizarr beszédének interpretáláshoz Még stílus statisztikák is megjelennek

11 Információelméleti észlelés kutatás
G. A. Miller Zaj és észlelés Expoziciós idő és felismerés

12 Gyakoriság és felismerési idő Howes és Solomon 1952
Korrelációk

13

14

15

16 A gyakoriságnak vannak szubjektív mutatói is Ezek jól összefüggenek az objektívakkal
Nyelv Kutató Korr N Francia Bonin és mtsai. (2003) 0,87 277 Kanadai francia Desrochers és Bergeron (2000) 0,73 360 Flieller és Tournois (1994) 0,86 111 Amerikai angol Balota és mtsai. (2001) 0,78 681 Brit angol Stathagen-Honzalez és Davis (2006) 0,7 243

17 Elsajátítási kor

18 Type Token arány és szókincs
Változó TTR 100 TTR CTTR Peabody Képi szók BeszSzó ÍrottSzó 0.54 * 0. 51 * -.26 0.29 * -0.16 0.04 KépiSzókincs 0. 22 -0.01 0.16 0.74 * Szókincs 0.45 * -0.11 0.34 0.64 * 0.58* Írott szókincs 0.24 -0.25 -0.27 0.63 * 0.51* 0.36 Összszó .06 -0.78 * 0.26 0.23 0.18 0.38* -0.05

19 Kor Szubjektív gyakoriság Elsajátítási kor -0,57 Gyakoriság log -0,75 0,73 Betűk ,20 -0,28 Szomszédok -0,22 0,23 Elképzelhető -0,32

20 A gyakoriság értelmetlen szavakkal is szimulálható Solomon és Postman
Az ingerek A gyakorisági hatás

21 Goldiamond és Hawkins ez akkor is megvan, ha nincs is ott az inger
Nagy viták Valódi észlelési hatás Vagy Válaszhajlam Könnyebben mondom ki, hogy program mint azt, hogy proliferáció

22 Főbb modellek a szófelismerésre
Küszöb és alapszint változások: logogén, kohorsz, és konnekcionista modellek Adatok: előfeszítés kutya macska kutya kapu kiolvasás kereszt szódöntés kertesz

23 Logogén modell Morton

24 Kohorsz modell Marslen-Wilson: hallott szavak felismerése: már az első szótag alapján
Aktiválódás minden kompatibilis szóra, majd kiválasztás A bálon rajta volt a … malom,majom, maszk maszat,maszek, maszk maszk Tévedés: A bálon rajta volt a maszat. Visszamenés a bemenethez. Igazodás akkor erős, ha összefüggő a szöveg. Izolált szavaknál s értelmetlen szövegnél kevesebb elvárási hatás van.

25 A konnekcionista felfogás lényegi mozzanatai
PDP, a Parallel Distributed Processing. (Rumelhart és McClelland, 1986), McClelland (1988) A modell egységekből és azok kapcsolataiból áll. Az egységek (az elméleti neuronok) környezetüktől összegzett aktivációt kapnak bemenetként. A kapcsolatok pozitív vagy negatív előjelű súlyozott, módosítható "drótok" az egységek között. A különböző feladatokat eltérő hálózatok (hálózatrészek) valósítják meg. Mindegyikre jellemző azonban a párhuzamos működés. A modellben nincsen elvszerű különbség alulról-felfelé s felülről-lefelé való hatások között, a hálózatokra teljes összekötöttség jellemző.

26 Hogyan működik a szavaknál?
Klasszikus lineáris, szekvenciális modellek: balról-jobbra felismerés, korlátozott kapcsolat a szintek között Hierarchikus szótári viszonyok Konnekcionizmus: totális interakció Szavak hálója a szótárban

27 A szófelismerés konnekcionista modellje

28 A szintek működése egy konkrét szó (TÉR) felismerésénél

29 A szófelismerés ‚érzelmibb’ befolyásolói ? Szubcepció vagy gyakoriság ?
A sajátos kísérleti hatások: szubcepció, előfeszítés, maszkolás, kétértelműség A tudatosítás ablaka Mit mondanak ezek a tudatról? Nyelv és tudat egyéb eltérései Szemantikai hatás  tudat A forma tudata

30 A pszichoanalitikus kép és a kísérleti felfogás
feldolgozás beszámoló Ingerek Egyéb ingerek

31 Szubcepció ’50-es évek ‘küszöbalatti’ hatás
Gyakoriság, kiejthetőség s hasonlók is befolyásolnak Érték is küszöbcsökkentő Tabu szavak: magasabb küszöb. Talán információs érték kevesebb jó-rossz 1 bit, Míg a szó kb. 20 bit

32 Bruner et al, 1947: a saját értékrendemnek megfelelő szavakat gyorsabban ismerem fel

33 McGuninees galvános bőrreakció és felismerési idő az érzékeny szavakra

34 Eriksen 1960 kritikus felfogása
Eriksen: a C modell az érvényes

35 A kettős fedolgozás és a szubcepció modellje ma
Recehártya Colliculus superior Amygdala Corpus geniculatum laterale Elsődleges látókéreg

36 Beépített elektródák epilepsziásoknál
Piros – fenyegető – zöld neutrális Kék az eltérés Maszkolt-nem maszkolt Érzelem: még küszöb alatt is megjelenik a hatása ? Milyen neurális körökből?

37 Előfeszítés Ajtó kerék Ablak ablak

38 Maszkolás Kutya Legerősebb érzelmi esetben: Pl. dög genny
Hasonlított-e a szó érzelmileg? Macska Volt-e ehhez hasonló szó?

39 Nem tudatos előfeszítés jellemzői gyors s nem hagy nyomot Greenwald et al 1996

40 Nyelv és tudat szisztémás eltérülései
(1) Az irreleváns jelentések automatikus aktiválása. (2) A hangrestauráció jelensége 40 % nem tudja, hol volt (a) Mindenki csendben volt, csak nekünk jár a *ánk. (b) Megettük a főzeléket, nekünk már jár a *-ánk. (3) Társalgásainkat számos rejtett nem tudatos szabályszerűség irányítja. Tudjuk ezt? (a) Megkérhetlek, hogy csukd be az ajtót? (b) Be tudnád csukni az ajtót? (c) Nem akarod becsukni az ajtót? (d) Nem kellene becsukni az ajtót?

41 Kétértelműség Általános felismerés: kettős aktiváció Nyúl
Elvi mechanizmus Főnév 300 ms Nyúl

42 Kétértelmű szavak – egyértelmű mondatok
Főnév A zenekarból hiányzik a dob. HEGEDŰ HAJÍT Ige Feri mindig ballal dob. HAJÍT HEGEDŰ Kontroll Mari a labdához fél kézzel nyúl. HAJÍT HEGEDŰ

43 A nem releváns értelem is megjelenik Gergely és Pléh Mit jelent ez
A nem releváns értelem is megjelenik Gergely és Pléh Mit jelent ez? Dekomponálás Kiolvasási idők

44 Bonyolultabb hatás: mindig a főnév az elsődleges Thuma mégpedig ez a gyakoribb
Mondatkontextus Releváns olvasat Irreleváns olvasat Igei előfeszítés A labdát ballal dobom nincs hatás facilitáció Főnévi előfeszítés A zenekarban ott van a dobom. gátlás

45 Vagyis a szófaj döntő: Főnév mindig előnyben (Thuma és Pléh)

46 Visszatudatosítás pl. szóvicc Megetted már a halad? .
Szóalak Kettős aktiváció relevancia szelekció „Tudatos”: Visszatudatosítás pl. szóvicc Megetted már a halad? . Nem én konzervatív vagyok

47 Mindez mit is jelent ? 300 mscig mindkét jelentés aktív
Utána már csak a releváns Inger tudatosulás Dennett millisecundumos integrációs ablak Ezen az idői ablakon belül áthelyezés, kapcsolatképzés

48 Tudatosak-e intuitív ítéleteink?
(a) Ott ült a kávéházban. (b) Belement a feladatba. (c) Bement a kávéházban. (d) Csalódott a feladatba.

49 A stigmatizáció megjelenése reprezentatív mintában Pléh, 1995

50 A tudatosság növekedésével csökken a hiperkorrekció Bodor és Pléh tükörben megítélés

51 Jackendoff 2007 Az élménytudatosság a hangalakra vonatkozik.
A nyelvi tudatosság mindig érzéki képzetekhez, beszédhangokhoz vagy jelekhez kapcsolódik. A gondolat formája s ezzel a jelentés sosem tudatos. A gondolkodás evidencia élménye javarészt a nyelvi képzetekből származik.

52 Jean Piaget: Pszichológia és ismeretelmélet, 1970
Nem vagyunk azonnali tudatában pszichés műveleteinknek, s ezek önműködően zajlanak le, míg csak akadályba nem ütköznek. A tudatosítás tehát centripetális s nem centrifugális, vagyis a műveletek külső eredményeiből indul ki, mielőtt azok belső mechanizmusaira áttérne.

53 Lehetséges feladatok Entrópiaértékek a magyar szótárban a szóalakok alapján eltérő gyakoriságoknál. KABÁT kabátok kabáthoz ÜRGE ürgét, ürgének stb. Egyéni szógyakoriságok, pl. szövegek alapján, s viszonyuk a corpus gyakorisághoz Szubjektív és objektív gyakoriság összevetése. Hol tér el?


Letölteni ppt "A szófelismerés információs értelmezése"

Hasonló előadás


Google Hirdetések