PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.

Slides:



Advertisements
Hasonló előadás
GRIN: Gráf alapú RDF index
Advertisements

Készítette: Kosztyán Zsolt Tibor
Elemi algoritmusok Páll Boglárka.
Meteorológiai Előrejelzés Adatbányászati Támogatással Putnoki Gyula GTK ISZAM II.évf. Társszerzők: az ISZAM-os Meteor-team TDK-konferencia 2007 Gödöllő.
Funkcionális függés Redundancia 1NF, 2NF, 3NF
Adatbányászat a kontrollingban
Adatbányászat: Asszociációs szabályok Alapfogalmak és algoritmusok
Önálló Laboratórium II. Készítette: Varga Róbert
Illés Tibor – Hálózati folyamok
Ph.D beszámoló 2004/2005 I.félév Készítette: Iváncsy Renáta Konzulens: Vajk István.
PhD beszámoló 2002/2003 II. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Streaming Algorithms for k-core Decomposition. K-mag dekompozíció Maximális részgráf, amiben minden csúcshoz legalább k részgráfbeli csúcs csatlakozik.
DAG topologikus rendezése
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Készítette: Pető László
Szoftver bonyolultsági mértékek alkalmazási területei Király Roland 2011.
az MSAccess programmal
2005. Stratégiai menedzsment és informatikai támogatás (A Vezetői információs rendszerek tantárgyhoz) Gaul Géza.
Programozó matematikus szak 2003/2004-es tanév II. félév
Prím algoritmus.
„Országos” feladat. Feladat: Egy tetszőleges, színes országokat tartalmazó térképen akar eljutni egy kommandós csapat egy országból egy másikba. Viszont.
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Ismeretalapú rendszerek alaptechnikái I. Szabályalapú rendszerek.
Ismeretalapú rendszerek alaptechnikái I. Szabályalapú rendszerek.
Készítette: Kosztyán Zsolt Tibor
Objektumok. Az objektum információt tárol, és kérésre feladatokat hajt végre. Az objektum adatok (attribútumok) és metódusok (operációk,műveletek) összessége,
*** HALMAZOK *** A HALMAZ ÉS MEGADÁSA A HALMAZ FOGALMA
Adatbázisrendszerek jövője
Hálózati réteg.
Intelligens Felderítő Robotok
Elemi algoritmusok Páll Boglárka.
Adatszerkezetek 1. előadás
Készítette: Tóth Ervin
Idősor karaktersorozatként való vizsgálata – SAX algoritmus Szabó Dániel Konzulens: dr. Dobrowiecki Tadeusz Önálló Labor előadás december 12.
Vektorterek Definíció. Legyen V Abel-csoport, F test, továbbá
Adatbázis kezelés.
Adatbázis-kezelés.
Algoritmizálás, adatmodellezés tanítása 8. előadás.
Slides for Quantum Computing and Communications – An Engineering Approach Chapter 7 Searching in an Unsorted Database Sándor Imre Ferenc Balázs.

Osztott adatbázisok.  Gyors ismétlés: teljes redukáló  Teljes redukáló költsége  Természetes összekapcsolások vetítése  Természetes összekapcsolások.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Nyomkövetés alapú hibadetektálás Autonóm és Hibatűrő Inf.
Algoritmus és adatszerkezet Tavaszi félév Tóth Norbert1 Floyd-Warshall-algoritmus Legrövidebb utak keresése.
Gráfok ábrázolása teljesen láncoltan
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
Computing n-Gram Statistics in MapReduce Klaus Berberich, Srikanta Bedathur EDBT/ICDT 2013 Joint Conference.
Diszjunkt halmazok adatszerkezete A diszjunkt halmaz adatszerkezet diszjunkt dinamikus halmazok S={S 1,…,S n } halmaza. Egy halmazt egy képviselője azonosít.
Gyakori minták bányászata tranzakciós és strukturált adatbázisokban
Készítette: Mátyás István agrár mérnöktanár szakos hallgató,
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Gráf szélességi bejárása. Cél Az algoritmus célja az, hogy bejárjuk egy véges gráf összes csúcsát és kiírjuk őket a kezdőcsúcstól való távolságuk szerint.
Memóriakezelés feladatok Feladat: 12 bites címtartomány. 0 ~ 2047 legyen mindig.
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
Ismétlés. "Man - a being in search of meaning." Plato Searching in an Unsorted Database.
Adatbázisszintű adatmodellek
Huffman kód.
Nevezetes algoritmusok
BFák Kiegyensúlyozott keresőfák
Mesterséges intelligencia
Kovács Gergely Péter Bevezetés
Algoritmusok és Adatszerkezetek I.
Relációs adatmodell, normálformák
iOT eszközök által rögzített adatok feldolgozása, megjelenítése
Adatbázis-kezelés 2. Relációs adatbázisok.
Algoritmusok és Adatszerkezetek I.
Adatbázisrendszerek elméleti alapjai 9. előadás
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István

Adatbányászat Asszociációs szabályok feltárása Pl. vásárlói kosarak Feladat: Elemek együttes előfordulásának megszámolása A keresési idő és a memória igény csökkentése

Elemhalmaz támogatottsága Az X elemhalmaz támogatottsága: azon tranzakciók számának aránya az összes tranzakciószámhoz képest, amelyek tartalmazzák az X-et.

Asszociációs szabály

Asszociációk bányászatának lépései Az összes gyakori elemhalmaz megtalálása A gyakori elemhalmazokból érvényes asszociációs szabályok generálása Gyakori elemhalmaz: támogatottsága nagyobb mint a küszöbérték Érvényes szabály: eleget tesz mind a minimális támogatottság, mind a minimális bizonyosság küszöbértékének Számítási igény alapján a gyakori elemhalmazok meghatározása a kritikus

A félév során végzett munka Korlátozott méretű szabály keresés Az Apriori és az FP-growth algoritmus módosítása Az Apriori algoritmus problémáinak feltárása ASC algoritmus Az FP-growth algoritmus problémáinak feltárása Cubic FP-growth

Apriori algoritmus (1) Szintenként haladó algoritmus Alapja: egy gyakori elemhalmaz minden részhalmaza is gyakori, azaz ha egy elemhalmaz nem gyakori, akkor annak bármely elemmel való bővítése sem lesz gyakori Az adatok tranzakciókban kerülnek reprezentálásra (minden egyes tranzakció egy azonosítóból és egy elemeket tartalmazó listából áll)

Apriori algoritmus (2) Meg kell találni az összes 1 elemű gyakori elemhalmazt (L 1 ) Ha megvan a k-1 elemű gyakori elemhalmazunk (L k-1 ), ebből kell generálni a k elemű jelölteket (C k ) Összekapcsoljuk azon két halmazt, amik az első k-2 elemben azonosak A jelöltekből kivesszük azokat, aminek van k-1 elemű nem gyakori részhalmaza, így megkapjuk C k -t L k -t C k -ból kapjuk a min_s alapján

Az FP-growth algoritmus 1. adatbázis olvasás  gyakori elemhalmazok sorbarendezése 2. adatbázis olvasás  FP-fa felépítése a memóriában Az FP-fából feltételes fák építésének segítségével meghatározza a gyakori elemhalmazokat

Korlátozott méretű szabály keresése Apriori módosítása – szintenként haladó k. szinten be kell fejezni a feldolgozást FP-growth módosítása A fa bejárásakor csak a max. k méretű halmazokat kell kigenerálni

Mérési eredmények APRIORI FP-GROWTH

Magyarázat az FP-growth viselkedésére

Az Apriori algoritmus viselkedése

Az ASC algoritmus 1 és 2 elemű halmazok meghatározása mátrix segítségével 3-4 elemű halmazok meghatározása kocka struktúrával 1 n HASHHASH HASHHASH HASHHASH

FP-growth algoritmus Azonos statisztikai tulajdonsággal rendelkező két adathalmaz esetén, amikben a tranzakciók száma egy nagyságrenddel tér el, a generált fa mérete és közel egy nagyságrenddel tér el A felesleges csomópontokat ne építsük bele a fába Csak azokból a tranzakciókból építsünk fát, amik tartalmaznak legalább egy négyelemű gyakori elemhalmazt

Cubic FP-growth algoritmus Az ASC algoritmussal meghatározzuk az 1-4 gyakori elemhalmazokat Kiszűrjük azokat a tranzakciókat, amik nem tartalmaznak gyakori négyelemű részhalmazt Felépítjük az FP-fát és végrehajtjuk az FP- growth algoritmust

Mérési eredmények

Publikációk R.Iváncsy, F.Kovács, I.Vajk: An Analysis of Association Rule Mining Algorithms, EIS 2004 F.Kovács, R.Iváncsy, I.Vajk: Dynamic Itemset Counting in PC Cluster Based Association Rule Mining, EIS 2004 F.Kovács, R.Iváncsy, I.Vajk: Evaluation of the Serial Association Rule Mining Algorithms, IASTED 2004 R.Iváncsy, I.Vajk: Size Restricted Association Rule Mining, MicroCAD 2004 S.Juhász, R.Iváncsy, I.Vajk: Performance Modelling of the Apriori Association Rule Mining Algorithm, MicroCAD 2004