Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Adatbányászati módszerek népzenei elemzések céljára Juhász Zoltán, MTA-TTK-MFA A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti.

Hasonló előadás


Az előadások a következő témára: "Adatbányászati módszerek népzenei elemzések céljára Juhász Zoltán, MTA-TTK-MFA A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti."— Előadás másolata:

1 Adatbányászati módszerek népzenei elemzések céljára Juhász Zoltán, MTA-TTK-MFA A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti erő átalakító munkájának eredménye... Éppoly természeti tünemény, mint pl. az állat- vagy növényvilág megnyilvánulási formái. Ennek folytán egyedei – az egyes dallamok – a legmagasabb művészi tökéletesség példái.” (Bartók o.) 1. A népzenei variálódás modellje 2. Zenei elveket tükröző dallam-vektortér és bázis 3. Zenei típusok és stabilitás-vektorok párhuzamos tanulása önszervező térképen 4. Önszervező felhő – az Kohonen-térkép pontosítása és kiterjesztése 5. Önszervező zenei motívumszótár – az elemi zenei formák feltárása 6. Zenekultúrák kapcsolatainak gépi vizsgálata 7. Zenekultúrák kapcsolatainak jellemzése statisztikai számítással 8. Más alkalmazások: genetika, diagnosztika, kardiológia, biológia

2 1.A variánsok életének szimulációs modellje Alapötlet Pál István dallam-felidézése: az információ egy rokonsági felhőben szétszórva is megtalálható, onnan visszanyerhető.

3 A szimulációhoz szükséges a dallam matematikai modellje: A dallamvonal vektor Zenei távolság: a dv. vektorok euklideszi, idővetemítéses, vagy másmilyen távolsága

4 Az i. (elfelejtett) dallamot felidézi a j. (élő) dallam: Az i. dallamot legalább egy élő felidézi: Zenei táv: Állapotvektor:Táv érzékenység: A népzene élet-szimulációja 1. Véletlen felejtés minden élő dallamra egyenlő p valószínűséggel > új állapot: valószínűségével.2. felidézési kísérlet az állapot függvényében, a siker A szimuláció egy ciklusa: valószínűséggel.

5 A szimuláció eredménye: a népzene önfenntartó optimális rendszer A „nem felejtés” (p) egy kritikus értéke fölött megjelennek a hosszú élettartamú dallamok,de csak az élő népzenei rendszerben. A népzenének tehát struktúrája van. A cél ennek feltárása. T/K% várható élettartamú dallamok száma különböző nem-felejtési valószínűségek mellett (p) Juhász, Z. (2000b). A Model of Variation in the Music of a Hungarian Ethnic Group. Journal of New Music Research 29 (2000) No 2, (pp ). A dv. vektorok felhőjének vetülete (PCA) Az élő dallamok (nagy pontok) közötti rokonsági háló p=0,5 fölött stabilizálódik - Népzenei rendszer élő felidézéssel - Népzenei rendszer véletlen felid. valósz. - Véletlen rendszer élő felidézéssel

6 Zenei elveket tükröző AD térbeli struktúrát keresünk. Probléma: A „struktúra” PCA-val áttekinthetetlen, zeneileg értelmezhetetlen magyar nd. első sorainak pontrendszere. A tényleges zenei bázis keresése 1.A helyi sűrűsödések keresése a felid. val. függvénnyel 2.A helyi sűrűsödések princ. bázisainak meghatározása 3.Új bázis konstruálása Schmitt ortogonalizációval a helyi bázisokból Principális bázis: A dallam vektorok kovariancia mátrixának sajátvektorai 2. A zenei bázis meghatározása

7 A zenei bázis A zenei rendszert értelmező felhang rsz. Magyar dallamok első sorai: alaphang – kvint – oktáv alapú zenei rendszer. A sorkezdő és záró hangok ortogonálisan variálódnak. Juhász, Z. (2000a). Contour Analysis of Hungarian Folk Music in a Multidimensional Music- Space. Journal of New Music Research 29 (2000) No 1, (pp 71-83). Az új bázisvektorok

8 Továbblépés szükségessége: 1. Nagyobb zenei formákhoz nem áttekinthető semmilyen AD lineáris vetület. 2. A rendszer összefüggő, csak összemosódó helyi sűrűsödései vannak. 3. Típusokat tanuló algoritmust szeretnénk, ilyen feltételek között. 4. A típusok zeneileg meghatározó – invariáns - jegyeit is kimutató algoritmust szeretnénk.

9 3. Önszervező térkép, adaptív súlytényezőkkel. Eredeti ÖT: a rácspontokhoz rendelt típus vektorokat tanulja: 1. Véletlenül kiválaszt egy tanítóvektort. 2. Megkeresi a leghasonlóbb típusvektort. 3. A típusvektort elmozdítja a tanítóvektor irányába. 4. A típusvektor rácsbeli környezetével u. ezt teszi. > térkép Módosítás: A típusvektorokhoz még súlyvektorokat is rendelünk. A SOM ezeket is tanulja: Az így tanult adaptív súlytényezők jellemzik a dv. idősor l-edik értékének fontosságát (invarianciáját): A típus és a dallam eltérése súlyozott euklideszi távolság:

10 Eredmény: Két automatikusan tanult magyar típus, a dallamhelyek súlyaival. Juhász, Z. (2007): Analysis of melody roots in Hungarian folk music using self-organizing maps with adaptively weighted dynamic time warping. APPLIED ARTIFICIAL INTELLIGENCE Volume: 21 Issue: 1 Pages: 35-55

11 A továbblépés szükségessége: 1. Az ÖT rács-szerkezete helyett folytonos, nagyobb szabadságfokú felhőt szeretnénk. 2. Az ÖT rács 3D 4D változata nehézkes. (5*5 ~ 3*3*3) 3. Az ÖT térképszerűsége csak az osztályozási pontosság feladásával valósul meg. Térképszerűbb és pontosabb tanulást szeretnénk: Önszervező felhő. ÖTÖF 1ÖF 2

12 Dallamvonal vektorok Típus vektorok (csoport-átlagok) -ra legjobban hasonlító típus („a győztes”). : a k-adik, véletlenül választott dallamvonal vektor (tanító vektor). Algoritmus: Az algoritmus 1. lépése: helyi sűrűsödések keresése és a típusvektorok tanulása (K átlag) 4. Önszervező felhő.

13 Eredmények: típus vektorok és osztályozott dallamok

14 Az m-edik AD vektor k-adik koordinátájára vonatkozó rekurzió: Az AD pontok elrendezésének feltétele: A SD típusvektorok távolsága Az AD pontok távolsága Az algoritmus 2. lépése: A típusvektorok térképszerű elrendezése AD térben (MDS).

15 Eredmény: a magyar népzene típusainak önszervező felhője

16 Együttműködő tanulás: visszacsatolás a SD típus vektorok tanulása és a megfelelő AD pontok helyzete között Önszervező felhő kooperatív tanulással - A „győztes” környezetében levő vektorokat is módosítjuk - Az AD pontok elhelyezkedése visszahat a tanulásra - Ezért a konvergencia nem pontos - Az AD rendeződés viszont tagoltabb, térképszerűbb.

17 Eredmények: Magyar teljes dallamok és első sorok önszervező felhői független és együttműködő tanulással Teljes dallamokElső sorok függetlenegyüttműködő független együttműködő

18 a: SOM együttműködő tanulás b: SOM független tanulás a) után c: ÖF független tanulás d: ÖF súlyozott független tanulás e: A típus vektorok PCA vetülete f: ÖF együttműködő tanulás Az önszervező felhő és a K átlag, MDS, SOM, PCA algoritmusok Előnyök: - síkrács helyett folytonos AD tér - független: pontos, térképszerű - együttm.: van hiba, de tagoltabb a térkép Z. Juhász: Low dimensional visualisation of folk music systems using the self organising cloud. 12th International Society for music information retrieval okt , Miami, Florida, USA. Szóbeli előadás. K átlag: független ÖF térkép nélkül PCA: tanítóvektorok lin. térképe tanulás nélkül MDS: tanítóvektorok nemlin. térképe tanulás nélkül SOM: együttműködő ÖF rácshoz kötött térképpel

19 5. Önszervező zenei motívumszótár Motívum: egy dallamon belül többször, vagy több dallamban gyakran előforduló dallamrészek

20 Két idősor leghosszabb közös (hasonló) részének keresése részleges din. idővetemítéssel Eltérés mátrixVetemítési mátrix Hasonló szakaszok keresése idősoron belül Vetemítési mátrix

21 Önszervező zenei szótár A motívumok azonosítása a SOM pillanatnyi állapotától függ -> A tanítóhalmaz a tanulás során változik Juhász, Z. (2009b): Motive Identification in 22 folksong corpora using dynamic time warping and self organising maps. Proc. of the 10th Internapional Society for Music Information retrieval Conference (ISMIR 2009) ed: K. Hirata, G. Tzanetakis, Japan, october , Kobe, Japan, pp 171 – 176

22 Magyar motívum-térkép a zenei bázisban Magyarral rokon motívum térképek Más típusú motívum térképek

23 Adatbázis (összesen dallam, 31 kultúra) Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel MTA BTK ZTI: - Európai népdalkatalógus digitalizált gyűjtemény: francia (Canteloube), szicíliai (Favara), bolgár (Sztoin), Appalache (Sharp), spanyol (Garcia), orosz (Kotikova), morva (Susil), román (Bartók, Dragoi), szlovák (Bartók, SLP) - Régi magyar népdaltípusok (főszerk: Pávai István) - Anatóliai, azeri, kirgiz, karacsáj, kurd helyszíni gyűjtések (Sipos János könyveiben publikálva) - Hanti, komi (Lázár Katalin könyveiben publikálva) - Mari, csuvas, tatár, votják (Vikár L. és Bereczki G, könyveiben, vmint. Kodály művek forrásai közt publikálva) Polish Academy of Sciences (Institute of Arts, Dr. Ewa Dahlig, Deputy Directory) : - Essen Associative code and folksong database (H. Schaffrath). Német, skót, ír, kínai, dakota gyűjtemények - Kasub, warmiai, nagylengyel gyűjtemények University of Yvaskyla: Finnish Folksong Database Meertens Institute, Utrecht University: Dutch Folksong Database Inner Mongolian University, Kökequota: mongol University of Oslo, Balladerdatatabasen: norvég University of Luxembourg: luxemburgi, lotaringiai Magángyűjtemény: Ördög L. és Ördög M. perui gyűjtései Minden gyűjtemény tud. műhelyben készült. Minden forrás feltünteti az összes dallam gyűjtési adatait. 6. Zenei nyelvcsaládok keresése az ismertetett gépi technikákkal „ … az a gyanúm, hogy a földkerekség minden népzenéje, ha elegendő anyag és tanulmány áll majd rendelkezésünkre, alapjában véve visszavezethető lesz majd néhány ősformára, őstípusra, ős – stílus - fajra.” (Bartók 1937)

24 A gyűjtemények eltérő méreteiből és szerkesztéséből fakadó eltérések kompenzálása Gyűjtemény méretek: 1500 fölött: 16, 1000 fölött: 6, 500 fölött: 9 Minden kultúráról külön ÖF készül. Az ÖF méretét meghatározó feltétel: adott közös küszöb mellett a dallamok 80-85%-át osztályozza. Így a tanult típusok száma a gyűjteményben lévő tényleges típusok számához közelít, függetlenül attól, hogy átlagosan hány dallam tartozik egy típushoz a gyűjteményben. Eredmény: a gyűjteményenként tanult típusok száma közelít egymáshoz: 400 – 576. Az így keletkezett 31 típuskészletet egyesítjük, és ezzel tanítunk egy alkalmas méretű ÖF-t (1000). Így nincsenek előnyben a gyűjteményekben túl sok változattal reprezentált típusok. Előnyben vannak viszont a több kultúrában párhuzamosan meglévő típusok. Ezek közös típusokat tanítanak az egyesített ÖF-n. Juhász, Z. (2006b): A Systematic Comparison of Different European Folk Music Traditions Using Self-Organizing Maps. Journal of New Music Research, 2006, Vol. 35, No. 2, pp

25 31 kultúra egyesített típuskészletének térképe együttműködő tanulással Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel

26 Az egyesített felhő gerjesztettségei különböző kultúrák hatására

27 Mi a valószínűsége annak, hogy N-ből véletlenül kiválasztva egy A és egy B méretű részhalmazt, a metszet éppen x méretű? 7. Az átlapolások véletlenszerűségének elemzése. A kultúrák eltérő típus-számának kompenzálása Annak valószínűsége, hogy véletlen válogatás esetén a metszet kisebb, mint X: N=900, A=255, B=127 Determ. rokonVéletlenDeterm. más Ha P nagy, a determinisztikus kapcsolat valószínűsége nagy. Z. Juhász and J. Sipos, (2009): A comparative analysis of Eurasian folksong corpora, using self organising maps, Journal of Interdisciplinary Music Studies. (2009), doi: /jims Kisebb A v. B esetén a csúcs balra tolódik! x p(x)

28 31 kultúra kapcsolati hálója MDS-sel szerkesztve. Élek: az okszerű kapcsolat valószínűsége 0,99-nél nagyobb Független genetikai megerősítés: Zenei és genetika rokonság korrelációja: P(z|g)=0,28 P(g|z)=0,82 !!!! A comparative phylogenetic study of genetics and folk music Horolma Pamjav Zoltán Juhász Andrea Zalán Endre Németh Bayarlkhagva Damdin, Mol Genet Genomics Színek: helyi sűrűsödések Zenei nyelvcsaládok

29 8. Helyi sűrűsödés + MDS + ÖF más alkalmazásai: - Populációgenetikai osztályozás, Populációgenetikai osztályozás, - Születés előtti adatsorok osztályozása diagnosztikai céllal, Születés előtti adatsorok osztályozása diagnosztikai céllal, - Vérnyomásgörbék osztályozása diagnosztikai céllal, Vérnyomásgörbék osztályozása diagnosztikai céllal, - Akusztikai jelek (Madárdallamok, kolomphangok) osztályozása Akusztikai jelek (Madárdallamok, kolomphangok) osztályozása

30 A legtöbb kultúrában közös terület az egyesített felhőn (a „marker stílus”) Kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota

31 A keleti ősnyelv rekonstrukciója a „marker stílust” tartalmazó kultúrákból Az egyesített önszervező felhő együttműködő tanulással Az egyesített önszervező felhő gerjesztettségei kultúránként kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota (vastag: genetikailag is kimutatottan rokonok) Juhász Z: Őstípusok, népzenei nyelvek elemzése egy öntanuló modell segítségével. In: TÜKRÖZŐDÉSEK. Tanulmánykötet Domokos Mária népzenekutató-zenetörténész tiszteletére 2013, Budapest, L’Harmattan.

32

33

34

35 „Katonák, négy (?) évezred tekint le rátok”


Letölteni ppt "Adatbányászati módszerek népzenei elemzések céljára Juhász Zoltán, MTA-TTK-MFA A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti."

Hasonló előadás


Google Hirdetések