Adatbányászati módszerek népzenei elemzések céljára

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

A felsőoktatási intézmények felvételi eljárása
Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
Bodolai Anna Borbála ICCR-Budapest Alapítvány Január 14. Európai Integrációs Modulok-Szakmai Tapasztalatcsere (EIA/2012/4.8.1.)
PPKE ITK 2009/10 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás
Fejmozgás alapú gesztusok felismerése
Péter Pázmány Catholic University, Department of Information Technology Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis.
1. Érettségi vizsga • Itt az iskolában kiosztott jelentkezési lapon • február 15-ig • Érettségi tárgyak: • magyar, matematika, történelem, idegen.
Humánkineziológia szak
Azonosítók és képzési szabályaik
1 Hernyák Zoltán Programozási Nyelvek II. Eszterházy Károly Főiskola Számítástudományi tsz.
Koordináta transzformációk
Koordináta transzformációk
Sűrűségfüggvény Parzen becslés Mintapontszám, szigma.
Digitális képanalízis
Térbeli niche szegregáció kétfoltos környezetben
Intervallum.
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Lineáris és nemlineáris regressziók, logisztikus regresszió
Dimenziócsökkentés, valamint jellemzőszelekciós eljárások
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
A diákat jészítette: Matthew Will
Véletlen logikai hálózatok. Bevezető Logikai változó: Bináris változó. Két lehetséges értéke van: 0 és 1, néha ±1 {σ 1, σ 2,..., σ N }, σ i : {0,1}, i.
4. tétel: A nyelvek eredet szerinti felosztása. Nyelvcsaládok
Statisztika Érettségi feladatok
A felsőoktatási intézmények felvételi eljárása A 237/2006. (XI. 27.) Kormányrendelet alapján.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
ADATBÁZISOK
A GÖMBÖC A bemutató a BME és a wikipedia anyagának felhasználásával, Várkonyi Péter előadása alapján készült.
Az ipari növekedés mai területi folyamatai
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Regresszióanalízis 10. gyakorlat.
Kisebbségi kultúrák.
dr. Szalkai István Pannon Egyetem, Veszprém
Lázár István Témavezető: Hajdu András
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Adatbázisrendszerek jövője
A szemcsehatárok tulajdonságainak tudatos módosítása Szabó Péter János BME Anyagtudomány és Technológia Tanszék Anyagvizsgálat a gyakorlatban (AGY 4) 2008.
Politikai és szociálgeográfia I.
Készítette: Horváth Zoltán (2012)
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
7. Csoportok és változók sztochasztikus összehasonlítása (összehasonlítások ordinális függő változók esetén)
Képfeldolgozási módszerek alkalmazása kajszimagok morfológiai tulajdonságainak leírására Felföldi J. 1, Hermán R. 2, Pedryc A. 2, Firtha F. 1 1 Budapesti.
Többváltozós adatelemzés
Két kvantitatív változó kapcsolatának vizsgálata
Európa nyelvei.
Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika.
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
Petri-hálón alapuló modellek analízise és alkalmazásai a reakciókinetikában Papp Dávid június 22. Konzulensek: Varró-Gyapay Szilvia, Dr. Tóth János.
Költség-minimalizálás az ellenőrző kártyák alkalmazásánál Feladatmegoldás, kiegészítés.
Szemcsés rendszerek statikája Tibély Gergely X. 26.
Diszkrét elem módszerek BME TTK, By Krisztián Rónaszegi.
Paleobiológiai módszerek és modellek 7. Hét TÖBBVÁLTOZÓS ADATELEMZÉS
Kis és nagy iskolák HÉTFA Kutatóintézet és Elemző Központ
Algoritmizálás, adatmodellezés tanítása 8. előadás.
Analogic and Neural Computing Laboratory, Computer and Automation Research Institute of the Hungarian Academy of Sciences Csatolt CNN lineáris súlytényezőkkel.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
1.  Szerzői:  Panagiotis Bouros (University of Hong Kong),  Shen Ge (University of Hong Kong),  Nikos Mamoulis (University of Hong Kong)  Esemény:
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
A digitális kompetencia mérése. IKT-alapú értékelés
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
1.Kanonikus felügyelt tanulási feladat definíciója (5p) 1.Input, output (1p) 2.Paraméterek (1p) 3.Hipotézisfüggvény (1p) 4.Hibafüggvény/költségfüggvény.
Operációkutatás I. 1. előadás
Balázsi Ildikó Oktatási Hivatal
Előadás másolata:

Adatbányászati módszerek népzenei elemzések céljára Juhász Zoltán, MTA-TTK-MFA A szűkebb értelemben vett parasztzene tehát öntudatlanul működő természeti erő átalakító munkájának eredménye ... Éppoly természeti tünemény, mint pl. az állat- vagy növényvilág megnyilvánulási formái. Ennek folytán egyedei – az egyes dallamok – a legmagasabb művészi tökéletesség példái.” (Bartók 1924. 1990 10. o.) 1. A népzenei variálódás modellje 2. Zenei elveket tükröző dallam-vektortér és bázis 3. Zenei típusok és stabilitás-vektorok párhuzamos tanulása önszervező térképen 4. Önszervező felhő – az Kohonen-térkép pontosítása és kiterjesztése 5. Önszervező zenei motívumszótár – az elemi zenei formák feltárása 6. Zenekultúrák kapcsolatainak gépi vizsgálata 7. Zenekultúrák kapcsolatainak jellemzése statisztikai számítással 8. Más alkalmazások: genetika, diagnosztika, kardiológia, biológia

A variánsok életének szimulációs modellje Alapötlet Pál István dallam-felidézése: az információ egy rokonsági felhőben szétszórva is megtalálható, onnan visszanyerhető.

A szimulációhoz szükséges a dallam matematikai modellje: A dallamvonal vektor Zenei távolság: a dv. vektorok euklideszi, idővetemítéses, vagy másmilyen távolsága

A népzene élet-szimulációja Az i. (elfelejtett) dallamot felidézi a j. (élő) dallam: valószínűséggel. Az i. dallamot legalább egy élő felidézi: valószínűséggel. Zenei táv: Állapotvektor: Táv érzékenység: A szimuláció egy ciklusa: 1. Véletlen felejtés minden élő dallamra egyenlő p valószínűséggel > új állapot: 2. felidézési kísérlet az állapot függvényében, a siker valószínűségével.

A szimuláció eredménye: a népzene önfenntartó optimális rendszer A „nem felejtés” (p) egy kritikus értéke fölött megjelennek a hosszú élettartamú dallamok,de csak az élő népzenei rendszerben. A népzenének tehát struktúrája van. A cél ennek feltárása. A dv. vektorok felhőjének vetülete (PCA) Az élő dallamok (nagy pontok) közötti rokonsági háló p=0,5 fölött stabilizálódik T/K% várható élettartamú dallamok száma különböző nem-felejtési valószínűségek mellett (p) - Népzenei rendszer élő felidézéssel Népzenei rendszer véletlen felid. valósz. - Véletlen rendszer élő felidézéssel Juhász, Z. (2000b). A Model of Variation in the Music of a Hungarian Ethnic Group. Journal of New Music Research 29 (2000) No 2, (pp 159-172).

2. A zenei bázis meghatározása Zenei elveket tükröző AD térbeli struktúrát keresünk. Probléma: A „struktúra” PCA-val áttekinthetetlen, zeneileg értelmezhetetlen. 2500 magyar nd. első sorainak pontrendszere. Principális bázis: A dallam vektorok kovariancia mátrixának sajátvektorai A tényleges zenei bázis keresése A helyi sűrűsödések keresése a felid. val. függvénnyel A helyi sűrűsödések princ. bázisainak meghatározása Új bázis konstruálása Schmitt ortogonalizációval a helyi bázisokból

A zenei bázis A zenei rendszert értelmező felhang rsz. Az új bázisvektorok Magyar dallamok első sorai: alaphang – kvint – oktáv alapú zenei rendszer. A sorkezdő és záró hangok ortogonálisan variálódnak. Juhász, Z. (2000a). Contour Analysis of Hungarian Folk Music in a Multidimensional Music- Space. Journal of New Music Research 29 (2000) No 1, (pp 71-83).

Továbblépés szükségessége: 1. Nagyobb zenei formákhoz nem áttekinthető semmilyen AD lineáris vetület. 2. A rendszer összefüggő, csak összemosódó helyi sűrűsödései vannak. 3. Típusokat tanuló algoritmust szeretnénk, ilyen feltételek között. 4. A típusok zeneileg meghatározó – invariáns - jegyeit is kimutató algoritmust szeretnénk.

3. Önszervező térkép, adaptív súlytényezőkkel. Eredeti ÖT: a rácspontokhoz rendelt típus vektorokat tanulja: 1. Véletlenül kiválaszt egy tanítóvektort. 2. Megkeresi a leghasonlóbb típusvektort. 3. A típusvektort elmozdítja a tanítóvektor irányába. 4. A típusvektor rácsbeli környezetével u. ezt teszi. > térkép Módosítás: A típusvektorokhoz még súlyvektorokat is rendelünk. A SOM ezeket is tanulja: Az így tanult adaptív súlytényezők jellemzik a dv. idősor l-edik értékének fontosságát (invarianciáját): A típus és a dallam eltérése súlyozott euklideszi távolság:

Eredmény: Két automatikusan tanult magyar típus, a dallamhelyek súlyaival. Juhász, Z. (2007): Analysis of melody roots in Hungarian folk music using self-organizing maps with adaptively weighted dynamic time warping. APPLIED ARTIFICIAL INTELLIGENCE    Volume: 21    Issue: 1    Pages: 35-55

ÖT ÖF 1 ÖF 2 A továbblépés szükségessége: 1. Az ÖT rács-szerkezete helyett folytonos, nagyobb szabadságfokú felhőt szeretnénk. 2. Az ÖT rács 3D 4D változata nehézkes. (5*5 ~ 3*3*3) 3. Az ÖT térképszerűsége csak az osztályozási pontosság feladásával valósul meg. Térképszerűbb és pontosabb tanulást szeretnénk: Önszervező felhő. ÖT ÖF 1 ÖF 2

4. Önszervező felhő. Az algoritmus 1. lépése: helyi sűrűsödések keresése és a típusvektorok tanulása (K átlag) Dallamvonal vektorok Típus vektorok (csoport-átlagok) Algoritmus: : a k-adik, véletlenül választott dallamvonal vektor (tanító vektor). -ra legjobban hasonlító típus („a győztes”).

Eredmények: típus vektorok és osztályozott dallamok

A típusvektorok térképszerű elrendezése AD térben (MDS) Az algoritmus 2. lépése: A típusvektorok térképszerű elrendezése AD térben (MDS) A SD típusvektorok távolsága Az AD pontok távolsága Az AD pontok elrendezésének feltétele: Az m-edik AD vektor k-adik koordinátájára vonatkozó rekurzió: .

Eredmény: a magyar népzene típusainak önszervező felhője

Együttműködő tanulás: visszacsatolás a SD típus vektorok tanulása és a megfelelő AD pontok helyzete között Önszervező felhő kooperatív tanulással A „győztes” környezetében levő vektorokat is módosítjuk Az AD pontok elhelyezkedése visszahat a tanulásra Ezért a konvergencia nem pontos Az AD rendeződés viszont tagoltabb, térképszerűbb.

Eredmények: Magyar teljes dallamok és első sorok önszervező felhői független és együttműködő tanulással Teljes dallamok Első sorok független együttműködő független együttműködő

Az önszervező felhő és a K átlag, MDS, SOM, PCA algoritmusok a: SOM együttműködő tanulás b: SOM független tanulás a) után c: ÖF független tanulás d: ÖF súlyozott független tanulás e: A típus vektorok PCA vetülete f: ÖF együttműködő tanulás Előnyök: síkrács helyett folytonos AD tér független: pontos, térképszerű együttm.: van hiba, de tagoltabb a térkép K átlag: független ÖF térkép nélkül PCA: tanítóvektorok lin. térképe tanulás nélkül MDS: tanítóvektorok nemlin. térképe tanulás nélkül SOM: együttműködő ÖF rácshoz kötött térképpel Z. Juhász: Low dimensional visualisation of folk music systems using the self organising cloud. 12th International Society for music information retrieval. 2011. okt. 25-28, Miami, Florida, USA. Szóbeli előadás.

5. Önszervező zenei motívumszótár Motívum: egy dallamon belül többször, vagy több dallamban gyakran előforduló dallamrészek

Két idősor leghosszabb közös (hasonló) részének keresése részleges din. idővetemítéssel Hasonló szakaszok keresése idősoron belül Vetemítési mátrix Eltérés mátrix Vetemítési mátrix

Önszervező zenei szótár A motívumok azonosítása a SOM pillanatnyi állapotától függ ->A tanítóhalmaz a tanulás során változik Juhász, Z. (2009b): Motive Identification in 22 folksong corpora using dynamic time warping and self organising maps. Proc. of the 10th Internapional Society for Music Information retrieval Conference (ISMIR 2009) ed: K. Hirata, G. Tzanetakis, Japan, october 26-30, Kobe, Japan, pp 171 – 176

Magyar motívum-térkép a zenei bázisban Más típusú motívum térképek Magyarral rokon motívum térképek

6. Zenei nyelvcsaládok keresése az ismertetett gépi technikákkal „ … az a gyanúm, hogy a földkerekség minden népzenéje, ha elegendő anyag és tanulmány áll majd rendelkezésünkre, alapjában véve visszavezethető lesz majd néhány ősformára, őstípusra, ős – stílus - fajra.” (Bartók 1937) Adatbázis (összesen 33 000 dallam, 31 kultúra) Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel MTA BTK ZTI: - Európai népdalkatalógus digitalizált gyűjtemény: francia (Canteloube), szicíliai (Favara), bolgár (Sztoin), Appalache (Sharp), spanyol (Garcia), orosz (Kotikova), morva (Susil), román (Bartók, Dragoi), szlovák (Bartók, SLP) - Régi magyar népdaltípusok (főszerk: Pávai István) - Anatóliai, azeri, kirgiz, karacsáj, kurd helyszíni gyűjtések (Sipos János könyveiben publikálva) - Hanti, komi (Lázár Katalin könyveiben publikálva) - Mari, csuvas, tatár, votják (Vikár L. és Bereczki G, könyveiben, vmint. Kodály művek forrásai közt publikálva) Polish Academy of Sciences (Institute of Arts, Dr. Ewa Dahlig, Deputy Directory) : - Essen Associative code and folksong database (H. Schaffrath). Német, skót, ír, kínai, dakota gyűjtemények - Kasub, warmiai, nagylengyel gyűjtemények University of Yvaskyla: Finnish Folksong Database Meertens Institute, Utrecht University: Dutch Folksong Database Inner Mongolian University, Kökequota: mongol University of Oslo, Balladerdatatabasen: norvég University of Luxembourg: luxemburgi, lotaringiai Magángyűjtemény: Ördög L. és Ördög M. perui gyűjtései Minden gyűjtemény tud. műhelyben készült. Minden forrás feltünteti az összes dallam gyűjtési adatait.

Gyűjtemény méretek: 1500 fölött: 16, 1000 fölött: 6, 500 fölött: 9 A gyűjtemények eltérő méreteiből és szerkesztéséből fakadó eltérések kompenzálása Gyűjtemény méretek: 1500 fölött: 16, 1000 fölött: 6, 500 fölött: 9 Minden kultúráról külön ÖF készül. Az ÖF méretét meghatározó feltétel: adott közös küszöb mellett a dallamok 80-85%-át osztályozza. Így a tanult típusok száma a gyűjteményben lévő tényleges típusok számához közelít, függetlenül attól, hogy átlagosan hány dallam tartozik egy típushoz a gyűjteményben. Eredmény: a gyűjteményenként tanult típusok száma közelít egymáshoz: 400 – 576. Az így keletkezett 31 típuskészletet egyesítjük, és ezzel tanítunk egy alkalmas méretű ÖF-t (1000). Így nincsenek előnyben a gyűjteményekben túl sok változattal reprezentált típusok. Előnyben vannak viszont a több kultúrában párhuzamosan meglévő típusok. Ezek közös típusokat tanítanak az egyesített ÖF-n. Juhász, Z. (2006b): A Systematic Comparison of Different European Folk Music Traditions Using Self-Organizing Maps. Journal of New Music Research, 2006, Vol. 35, No. 2, pp 95-112.

31 kultúra egyesített típuskészletének térképe együttműködő tanulással Kínai, mongol, kirgiz, volgai, szicíliai, bulgár, azeri, anatólia, karacsáj, magyar, szlovák, morva, román, kasub, finn, norvég, német, luxemburgi, francia, holland, kelta, spanyol, dakota, navajo, komi, mari, kurd, szerb-horvát, orosz, warmiai, nagylengyel

Az egyesített felhő gerjesztettségei különböző kultúrák hatására

7. Az átlapolások véletlenszerűségének elemzése. A kultúrák eltérő típus-számának kompenzálása Kisebb A v. B esetén a csúcs balra tolódik! Mi a valószínűsége annak, hogy N-ből véletlenül kiválasztva egy A és egy B méretű részhalmazt, a metszet éppen x méretű? p(x) N=900, A=255, B=127 x Determ. más Véletlen Determ. rokon Annak valószínűsége, hogy véletlen válogatás esetén a metszet kisebb, mint X: Ha P nagy, a determinisztikus kapcsolat valószínűsége nagy. Z. Juhász and J. Sipos, (2009): A comparative analysis of Eurasian folksong corpora, using self organising maps, Journal of Interdisciplinary Music Studies. (2009), doi: 10.4407/jims.2009.11.005

31 kultúra kapcsolati hálója MDS-sel szerkesztve. Élek: az okszerű kapcsolat valószínűsége 0,99-nél nagyobb Színek: helyi sűrűsödések Zenei nyelvcsaládok Független genetikai megerősítés: Zenei és genetika rokonság korrelációja: P(z|g)=0,28 P(g|z)=0,82 !!!! A comparative phylogenetic study of genetics and folk music Horolma Pamjav • Zoltán Juhász • Andrea Zalán •Endre Németh • Bayarlkhagva Damdin, Mol Genet Genomics 2012 03. 04.

8. Helyi sűrűsödés + MDS + ÖF más alkalmazásai: Populációgenetikai osztályozás, Születés előtti adatsorok osztályozása diagnosztikai céllal, Vérnyomásgörbék osztályozása diagnosztikai céllal, Akusztikai jelek (Madárdallamok, kolomphangok) osztályozása

A legtöbb kultúrában közös terület az egyesített felhőn (a „marker stílus”) Kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota

Az egyesített önszervező felhő gerjesztettségei kultúránként A keleti ősnyelv rekonstrukciója a „marker stílust” tartalmazó kultúrákból kínai, mongol, volgai, szicíliai, anatóliai, kaukázusi, magyar, szlovák, dakota (vastag: genetikailag is kimutatottan rokonok) Az egyesített önszervező felhő gerjesztettségei kultúránként Az egyesített önszervező felhő együttműködő tanulással Juhász Z: Őstípusok, népzenei nyelvek elemzése egy öntanuló modell segítségével. In: TÜKRÖZŐDÉSEK. Tanulmánykötet Domokos Mária népzenekutató-zenetörténész tiszteletére 2013, Budapest, L’Harmattan.

„Katonák, négy (?) évezred tekint le rátok”