Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Adatbányászati módszerek népzenei elemzések céljára

Hasonló előadás


Az előadások a következő témára: "Adatbányászati módszerek népzenei elemzések céljára"— Előadás másolata:

1 Adatbányászati módszerek népzenei elemzések céljára
Juhász Zoltán, MTA-TTK-MFA A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti erő átalakító munkájának eredménye ... Éppoly természeti tünemény, mint pl. az állat- vagy növényvilág megnyilvánulási formái. Ennek folytán egyedei – az egyes dallamok – a legmagasabb művészi tökéletesség példái.” (Bartók o.) 1. A népzenei variálódás modellje 2. Zenei elveket tükröző dallam-vektortér és bázis 3. Zenei típusok és stabilitás-vektorok párhuzamos tanulása önszervező térképen 4. Önszervező felhő – az Kohonen-térkép pontosítása és kiterjesztése 5. Önszervező zenei motívumszótár – az elemi zenei formák feltárása 6. Zenekultúrák kapcsolatainak gépi vizsgálata 7. Zenekultúrák kapcsolatainak jellemzése statisztikai számítással 8. Más alkalmazások: genetika, diagnosztika, kardiológia, biológia

2 A variánsok életének szimulációs modellje
Alapötlet Pál István dallam-felidézése: az információ egy rokonsági felhőben szétszórva is megtalálható, onnan visszanyerhető.

3 A szimulációhoz szükséges a dallam matematikai modellje: A dallamvonal vektor
Zenei távolság: a dv. vektorok euklideszi, idővetemítéses, vagy másmilyen távolsága

4 A népzene élet-szimulációja
Az i. (elfelejtett) dallamot felidézi a j. (élő) dallam: valószínűséggel. Az i. dallamot legalább egy élő felidézi: valószínűséggel. Zenei táv: Állapotvektor: Táv érzékenység: A szimuláció egy ciklusa: 1. Véletlen felejtés minden élő dallamra egyenlő p valószínűséggel > új állapot: 2. felidézési kísérlet az állapot függvényében, a siker valószínűségével.

5 A szimuláció eredménye: a népzene önfenntartó optimális rendszer
A „nem felejtés” (p) egy kritikus értéke fölött megjelennek a hosszú élettartamú dallamok,de csak az élő népzenei rendszerben. A népzenének tehát struktúrája van. A cél ennek feltárása. A dv. vektorok felhőjének vetülete (PCA) Az élő dallamok (nagy pontok) közötti rokonsági háló p=0,5 fölött stabilizálódik T/K% várható élettartamú dallamok száma különböző nem-felejtési valószínűségek mellett (p) - Népzenei rendszer élő felidézéssel Népzenei rendszer véletlen felid. valósz. - Véletlen rendszer élő felidézéssel Juhász, Z. (2000b). A Model of Variation in the Music of a Hungarian Ethnic Group. Journal of New Music Research 29 (2000) No 2, (pp ).

6 2. A zenei bázis meghatározása
Zenei elveket tükröző AD térbeli struktúrát keresünk. Probléma: A „struktúra” PCA-val áttekinthetetlen, zeneileg értelmezhetetlen. 2500 magyar nd. első sorainak pontrendszere. Principális bázis: A dallam vektorok kovariancia mátrixának sajátvektorai A tényleges zenei bázis keresése A helyi sűrűsödések keresése a felid. val. függvénnyel A helyi sűrűsödések princ. bázisainak meghatározása Új bázis konstruálása Schmitt ortogonalizációval a helyi bázisokból

7 A zenei bázis A zenei rendszert értelmező felhang rsz.
Az új bázisvektorok Magyar dallamok első sorai: alaphang – kvint – oktáv alapú zenei rendszer. A sorkezdő és záró hangok ortogonálisan variálódnak. Juhász, Z. (2000a). Contour Analysis of Hungarian Folk Music in a Multidimensional Music- Space. Journal of New Music Research 29 (2000) No 1, (pp 71-83).

8 Továbblépés szükségessége:
1. Nagyobb zenei formákhoz nem áttekinthető semmilyen AD lineáris vetület. 2. A rendszer összefüggő, csak összemosódó helyi sűrűsödései vannak. 3. Típusokat tanuló algoritmust szeretnénk, ilyen feltételek között. 4. A típusok zeneileg meghatározó – invariáns - jegyeit is kimutató algoritmust szeretnénk.

9 3. Önszervező térkép, adaptív súlytényezőkkel.
Eredeti ÖT: a rácspontokhoz rendelt típus vektorokat tanulja: 1. Véletlenül kiválaszt egy tanítóvektort. 2. Megkeresi a leghasonlóbb típusvektort. 3. A típusvektort elmozdítja a tanítóvektor irányába. 4. A típusvektor rácsbeli környezetével u. ezt teszi. > térkép Módosítás: A típusvektorokhoz még súlyvektorokat is rendelünk. A SOM ezeket is tanulja: Az így tanult adaptív súlytényezők jellemzik a dv. idősor l-edik értékének fontosságát (invarianciáját): A típus és a dallam eltérése súlyozott euklideszi távolság:

10 Eredmény: Két automatikusan tanult magyar típus, a dallamhelyek súlyaival.
Juhász, Z. (2007): Analysis of melody roots in Hungarian folk music using self-organizing maps with adaptively weighted dynamic time warping. APPLIED ARTIFICIAL INTELLIGENCE    Volume: 21    Issue: 1    Pages: 35-55

11 ÖT ÖF 1 ÖF 2 A továbblépés szükségessége:
1. Az ÖT rács-szerkezete helyett folytonos, nagyobb szabadságfokú felhőt szeretnénk. 2. Az ÖT rács 3D 4D változata nehézkes. (5*5 ~ 3*3*3) 3. Az ÖT térképszerűsége csak az osztályozási pontosság feladásával valósul meg. Térképszerűbb és pontosabb tanulást szeretnénk: Önszervező felhő. ÖT ÖF 1 ÖF 2

12 4. Önszervező felhő. Az algoritmus 1. lépése:
helyi sűrűsödések keresése és a típusvektorok tanulása (K átlag) Dallamvonal vektorok Típus vektorok (csoport-átlagok) Algoritmus: : a k-adik, véletlenül választott dallamvonal vektor (tanító vektor). -ra legjobban hasonlító típus („a győztes”).

13 Eredmények: típus vektorok és osztályozott dallamok

14 A típusvektorok térképszerű elrendezése AD térben (MDS)
Az algoritmus 2. lépése: A típusvektorok térképszerű elrendezése AD térben (MDS) A SD típusvektorok távolsága Az AD pontok távolsága Az AD pontok elrendezésének feltétele: Az m-edik AD vektor k-adik koordinátájára vonatkozó rekurzió: .

15 Eredmény: a magyar népzene típusainak önszervező felhője

16 Együttműködő tanulás:
visszacsatolás a SD típus vektorok tanulása és a megfelelő AD pontok helyzete között Önszervező felhő kooperatív tanulással A „győztes” környezetében levő vektorokat is módosítjuk Az AD pontok elhelyezkedése visszahat a tanulásra Ezért a konvergencia nem pontos Az AD rendeződés viszont tagoltabb, térképszerűbb.

17 Eredmények: Magyar teljes dallamok és első sorok önszervező felhői
független és együttműködő tanulással Teljes dallamok Első sorok független együttműködő független együttműködő

18 Az önszervező felhő és a K átlag, MDS, SOM, PCA algoritmusok
a: SOM együttműködő tanulás b: SOM független tanulás a) után c: ÖF független tanulás d: ÖF súlyozott független tanulás e: A típus vektorok PCA vetülete f: ÖF együttműködő tanulás Előnyök: síkrács helyett folytonos AD tér független: pontos, térképszerű együttm.: van hiba, de tagoltabb a térkép K átlag: független ÖF térkép nélkül PCA: tanítóvektorok lin. térképe tanulás nélkül MDS: tanítóvektorok nemlin. térképe tanulás nélkül SOM: együttműködő ÖF rácshoz kötött térképpel Z. Juhász: Low dimensional visualisation of folk music systems using the self organising cloud. 12th International Society for music information retrieval okt , Miami, Florida, USA. Szóbeli előadás.

19 5. Önszervező zenei motívumszótár
Motívum: egy dallamon belül többször, vagy több dallamban gyakran előforduló dallamrészek

20 Két idősor leghosszabb közös (hasonló) részének
keresése részleges din. idővetemítéssel Hasonló szakaszok keresése idősoron belül Vetemítési mátrix Eltérés mátrix Vetemítési mátrix

21 Önszervező zenei szótár
A motívumok azonosítása a SOM pillanatnyi állapotától függ ->A tanítóhalmaz a tanulás során változik Juhász, Z. (2009b): Motive Identification in 22 folksong corpora using dynamic time warping and self organising maps. Proc. of the 10th Internapional Society for Music Information retrieval Conference (ISMIR 2009) ed: K. Hirata, G. Tzanetakis, Japan, october 26-30, Kobe, Japan, pp 171 – 176

22 Magyar motívum-térkép a zenei bázisban
Más típusú motívum térképek Magyarral rokon motívum térképek

23 6. Zenei nyelvcsaládok keresése az ismertetett gépi technikákkal
„ … az a gyanúm, hogy a földkerekség minden népzenéje, ha elegendő anyag és tanulmány áll majd rendelkezésünkre, alapjában véve visszavezethető lesz majd néhány ősformára, őstípusra, ős – stílus - fajra.” (Bartók 1937) Adatbázis (összesen dallam, 31 kultúra) Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel MTA BTK ZTI: - Európai népdalkatalógus digitalizált gyűjtemény: francia (Canteloube), szicíliai (Favara), bolgár (Sztoin), Appalache (Sharp), spanyol (Garcia), orosz (Kotikova), morva (Susil), román (Bartók, Dragoi), szlovák (Bartók, SLP) - Régi magyar népdaltípusok (főszerk: Pávai István) - Anatóliai, azeri, kirgiz, karacsáj, kurd helyszíni gyűjtések (Sipos János könyveiben publikálva) - Hanti, komi (Lázár Katalin könyveiben publikálva) - Mari, csuvas, tatár, votják (Vikár L. és Bereczki G, könyveiben, vmint. Kodály művek forrásai közt publikálva) Polish Academy of Sciences (Institute of Arts, Dr. Ewa Dahlig, Deputy Directory) : - Essen Associative code and folksong database (H. Schaffrath). Német, skót, ír, kínai, dakota gyűjtemények - Kasub, warmiai, nagylengyel gyűjtemények University of Yvaskyla: Finnish Folksong Database Meertens Institute, Utrecht University: Dutch Folksong Database Inner Mongolian University, Kökequota: mongol University of Oslo, Balladerdatatabasen: norvég University of Luxembourg: luxemburgi, lotaringiai Magángyűjtemény: Ördög L. és Ördög M. perui gyűjtései Minden gyűjtemény tud. műhelyben készült. Minden forrás feltünteti az összes dallam gyűjtési adatait.

24 Gyűjtemény méretek: 1500 fölött: 16, 1000 fölött: 6, 500 fölött: 9
A gyűjtemények eltérő méreteiből és szerkesztéséből fakadó eltérések kompenzálása Gyűjtemény méretek: 1500 fölött: 16, 1000 fölött: 6, 500 fölött: 9 Minden kultúráról külön ÖF készül. Az ÖF méretét meghatározó feltétel: adott közös küszöb mellett a dallamok 80-85%-át osztályozza. Így a tanult típusok száma a gyűjteményben lévő tényleges típusok számához közelít, függetlenül attól, hogy átlagosan hány dallam tartozik egy típushoz a gyűjteményben. Eredmény: a gyűjteményenként tanult típusok száma közelít egymáshoz: 400 – 576. Az így keletkezett 31 típuskészletet egyesítjük, és ezzel tanítunk egy alkalmas méretű ÖF-t (1000). Így nincsenek előnyben a gyűjteményekben túl sok változattal reprezentált típusok. Előnyben vannak viszont a több kultúrában párhuzamosan meglévő típusok. Ezek közös típusokat tanítanak az egyesített ÖF-n. Juhász, Z. (2006b): A Systematic Comparison of Different European Folk Music Traditions Using Self-Organizing Maps. Journal of New Music Research, 2006, Vol. 35, No. 2, pp

25 31 kultúra egyesített típuskészletének térképe együttműködő tanulással
Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel

26 Az egyesített felhő gerjesztettségei különböző kultúrák hatására

27 7. Az átlapolások véletlenszerűségének elemzése.
A kultúrák eltérő típus-számának kompenzálása Kisebb A v. B esetén a csúcs balra tolódik! Mi a valószínűsége annak, hogy N-ből véletlenül kiválasztva egy A és egy B méretű részhalmazt, a metszet éppen x méretű? p(x) N=900, A=255, B=127 x Determ. más Véletlen Determ. rokon Annak valószínűsége, hogy véletlen válogatás esetén a metszet kisebb, mint X: Ha P nagy, a determinisztikus kapcsolat valószínűsége nagy. Z. Juhász and J. Sipos, (2009): A comparative analysis of Eurasian folksong corpora, using self organising maps, Journal of Interdisciplinary Music Studies. (2009), doi: /jims

28 31 kultúra kapcsolati hálója MDS-sel szerkesztve.
Élek: az okszerű kapcsolat valószínűsége 0,99-nél nagyobb Színek: helyi sűrűsödések Zenei nyelvcsaládok Független genetikai megerősítés: Zenei és genetika rokonság korrelációja: P(z|g)=0,28 P(g|z)=0,82 !!!! A comparative phylogenetic study of genetics and folk music Horolma Pamjav • Zoltán Juhász • Andrea Zalán •Endre Németh • Bayarlkhagva Damdin, Mol Genet Genomics

29 8. Helyi sűrűsödés + MDS + ÖF más alkalmazásai:
Populációgenetikai osztályozás, Születés előtti adatsorok osztályozása diagnosztikai céllal, Vérnyomásgörbék osztályozása diagnosztikai céllal, Akusztikai jelek (Madárdallamok, kolomphangok) osztályozása

30 A legtöbb kultúrában közös terület az egyesített felhőn
(a „marker stílus”) Kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota

31 Az egyesített önszervező felhő gerjesztettségei kultúránként
A keleti ősnyelv rekonstrukciója a „marker stílust” tartalmazó kultúrákból kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota (vastag: genetikailag is kimutatottan rokonok) Az egyesített önszervező felhő gerjesztettségei kultúránként Az egyesített önszervező felhő együttműködő tanulással Juhász Z: Őstípusok, népzenei nyelvek elemzése egy öntanuló modell segítségével. In: TÜKRÖZŐDÉSEK. Tanulmánykötet Domokos Mária népzenekutató-zenetörténész tiszteletére 2013, Budapest, L’Harmattan.

32

33

34

35 „Katonák, négy (?) évezred tekint le rátok”


Letölteni ppt "Adatbányászati módszerek népzenei elemzések céljára"

Hasonló előadás


Google Hirdetések