Ph.D beszámoló 2004/2005 I.félév Készítette: Iváncsy Renáta Konzulens: Vajk István.

Slides:



Advertisements
Hasonló előadás
Deduktív adatbázisok.
Advertisements

ILLYÉS LÁSZLÓ Sapientia Egyetem, Csíkszereda Kiegyensúlyozott csoportok kialakítása egyetemi projektekhez.
Az AUDI AG az általában Audiként ismert német autógyártó cég, melynek székhelye a németországi Ingolstadtban található óta 99,7 %-ban a Volkswagen.
Partner kiválasztási feladat modellezése Virtuális vállalat 8. gyakorlat Dr. Kulcsár Gyula.
Gráf alapú klaszterezési eljárások
Kötelező alapkérdések
Matematika II. 2. előadás Geodézia szakmérnöki szak 2012/2013. tanév Műszaki térinformatika ágazat őszi félév.
Illés Tibor – Hálózati folyamok
PhD beszámoló 2002/2003 II. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
Dinamikus tömbök.
Sztringek.
Bevezetés a Java programozásba
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Egydimenziós tömbök. Deklarálás: var valtozónév:array[kezdőérték..végsőérték]of típus; type típusnév = array [kezdőérték..végsőérték] of típus; var valtozónév:
Algoritmizálás Göncziné Kapros Katalin humaninformatika.ektf.hu.
Programozó matematikus szak 2003/2004-es tanév II. félév
A digitális számítás elmélete
A digitális számítás elmélete
A digitális számítás elmélete
Determinisztikus véges automaták csukva nyitva m s kbsm csukva nyitva csukva nyitva csukvanyitva 1. Példa: Fotocellás ajtó s b m m= mindkét helyen k= kint.
A 4D stúdió valós idejű GPU-s implementálása Hapák József ELTE-IK MSC 2012.
Webbányászat (web mining) Mártonffy A: Kutakodom, tehát vagyok cikke nyomán.
A digitális számítás elmélete
Analogical and Neural Computing Laboratory Computer and Automation Research Institute Hungarian Academy of Sciences, Budapest 1 CNN template dekompozíció.
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Ficsor Lajos Template-ek CPP8/ 1 Template-ek. Ficsor Lajos Template-ek CPP8/ 2 A template fogalma Kiindulási probléma: tetszőleges típusokon kellene ugyanolyan.
Készítette: Kosztyán Zsolt Tibor
4. Gyires Béla Informatikai Nap Debreceni Egyetem Informatikai Kar Új eredmények a Chomsky-féle (formális) nyelvtípusokkal kapcsolatban Dr. Nagy Benedek.
Lázár István Témavezető: Hajdu András
Algoritmusok II. Gyakorlat 3. Feladat Pup Márton.
Hasonlósággal kapcsolatos szerkesztések
TARTALOM: Általánosságok Algoritmusok ábrázolása:
Összetett adattípusok
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
BUDAPEST UNIVERSITY OF TECHNOLOGY AND ECONOMICS DEPARTMENT OF ELECTRONICS TECHNOLOGY PRECÍZIÓS, GYÁRTÁSKÖZI OPTIKAI MÓDSZEREK ÉS RENDSZEREK ELEKTRONIKAI.
A Dijkstra algoritmus.
Idősor karaktersorozatként való vizsgálata – SAX algoritmus Szabó Dániel Konzulens: dr. Dobrowiecki Tadeusz Önálló Labor előadás december 12.
Egyenesvonalú (lineáris) adatszerkezetek
Döbrössy Petra PhD hallgató Doktori fokozatszerzés előrehaladás jelentése Iroda: A / Győr, szeptember.
Slides for Quantum Computing and Communications – An Engineering Approach Chapter 7 Searching in an Unsorted Database Sándor Imre Ferenc Balázs.
A doktori képzés színvonalának és minőségének fejlesztése alprojekt TÁMOP-4.2.2/B-10/ Tudományos képzési műhelyek támogatása és a tehetséggondozás.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Nyomkövetés alapú hibadetektálás Autonóm és Hibatűrő Inf.
Feladatok (értékadás)
Project 4: Visual motion based Human-Computer Interface Jaksa Zsombor Németh József Ungi Tamás Utasi Tamás.
Computing n-Gram Statistics in MapReduce Klaus Berberich, Srikanta Bedathur EDBT/ICDT 2013 Joint Conference.
Gyakori minták bányászata tranzakciós és strukturált adatbázisokban
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Készítette : Giligor Dávid Neptun : HSYGGS
PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
Adatszerkezetek és algoritmusok 2008/ Algoritmus Az algoritmus szó eredete a középkori arab matematikáig nyúlik vissza, egy a i.sz. IX. században.
Adatbázisszintű adatmodellek
1/19 Hogyan tájékozódnak a robotok? Koczka Levente Eötvös Collegium.
3D képek a fotóidból Tövissy Judit.
VÁKUUMTECHNIKA GYAKORLATI ALAPJAI
LL(1)-elemzés ● az LL(1)-elemzők már jobbak az előzőeknél, bár nem fedik le a programozási nyelvek szükségleteit ● alapötlet: a levezetés következő lépéséhez.
A Dijkstra algoritmus.
International Olympiad in Informatics
Mediánok és rendezett minták
Kovács Gergely Péter Bevezetés
LL(1)-elemzés az LL(1)-elemzők már jobbak az előzőeknél, bár nem fedik le a programozási nyelvek szükségleteit alapötlet: a levezetés következő lépéséhez.
Algoritmusok és Adatszerkezetek I.
iOT eszközök által rögzített adatok feldolgozása, megjelenítése
Bankszámlatranzakciók feldolgozása és könyvelése Gyorsan és egyszerűen
Dijkstra algoritmusa: legrövidebb utak
Dijkstra algoritmusa: legrövidebb utak
Dijkstra algoritmusa: legrövidebb utak
Algoritmusok és Adatszerkezetek I.
Algoritmusok és Adatszerkezetek I.
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

Ph.D beszámoló 2004/2005 I.félév Készítette: Iváncsy Renáta Konzulens: Vajk István

Elemhalmaz bányászat Eddigi kutatási terület Vásárlói kosár Minden tranzakció elemek halmazát tartalmazza Cél: olyan termékeket találni, amik együttesen a megadott értéknél gyakrabban fordulnak elő

Szekvencia bányászat Olyan vásárlói kosár, ahol a vásárlókat megkülönböztetjük egymástól A tranzakciók elemhalmazok sorozatát tartalmazza  Egy vásárló az egyes vásárlási alkalmai során miket vásárolt Egy elemhalmazon belül az elemek sorrendje irreleváns (Ált. lexikografikusan rendezett) Az elemhalmazok sorrendje fontos  vásárolt termékek gyakran előforduló szekvenciáját keressük Példa szekvencia:

Részszekvencia -- Tartalmazás Legyen az elemhalmaz i=(i 1, i 2, …, i m ) ahol i j egy elem. Legyen a szekvencia s=, ahol s i egy elemhalmaz. Az szekvenciát tartalmazza a szekvencia, ha léteznek egészek i 1 < i 2 < …< i n, hogy a 1  b i 1, a 2  b i 2, …, a n  b i n. Példa: része az vagy az, de például nem része az

Szekvencia bányászat feladata Adott a szekvenciák halmaza Feladat megtalálni az összes résszekvenciát, ami gyakori a szekvencia adatbázisban Legelterjedtebb algoritmusok: AprioriAll GSP SPADE SPAM PrefixSpan …

A GSP algoritmus Generalized Sequential Patterns Szintenként halad Kihasználja az apriori hipotézist Első körben a gyakori elemeket határozza meg További lépésekben jelölteket generál, és egy újabb adatbázis olvasás során meghatározza a támogatottságukat

GSP – jelölt generálás

GSP – támogatottság meghatározása Az azonos méretű jelölteket hash-fában tárolja A jelöltek tárolásánál csak az elemeket veszi figyelembe A tranzakció feldolgozásakor a tranzakció elemeit rekurzívan dolgozza fel  egy elemre többször is sor kerül

Az SM-Tree algoritmus Szintenként haladó algoritmus A kételemű jelöltek támogatottságát mátrix segítségével határozza meg A jelölteket azonos elv alapján állítja elő, mint a GSP A jelöltek támogatottságához az automata elmélet alapján készített SM- Tree-t használja

A 2-szekvenciák meghatározása Egyelemű jelöltek tömbbel Kételemű jelöltek mátrixszal Két mátrix kell, az típusú és az típusú jelölteknek. Három elemű jelöltek generálása: és 

Véges automata elmélet Egy véges automata öt paraméterrel jellemezhető: M= (Q,Σ,δ,q 0,F) Q: állapotok halmaza Σ: alfabeta δ: Q  Σ  Q mozgási szabály q 0 : kiindulási állapot F: elfogadó állapotok halmaza Célunk: jelölt szekvenciákat elfogadó automata generálása

Szekvencia felismerése véges automatával Szekvenciát ábrázoljuk sztringként = ab-c-de A szekvencia véges automatája akkor fogadja el a bemenetét, ha a bemenet tartalmazza a szekvenciát S0S0 S1S1 S2S2 S3S3 S4S4 S5S5 S6S6 S7S7 ab - c - de - - \{a}\{b,-}\{-}\{c}\{-}\{d}\{e,-}

S0S0 S1S1 S2S2 S3S3 S4S4 S5S5 S6S6 S7S7 ab - c - de - - \{a}\{b,-}\{-}\{c}\{-}\{d}\{e,-}

Az SM-Tree létrehozása (1) Minden jelölt szekvenciához létre kell hozni egy automatát A könnyebb kezelés érdekében érdemes ezeket az automatákat összevonni  State Machine-Tree Az összevonáshoz definiálni kell a JOIN műveletet M 1 M 2 =SM 3, lényegében olyan, mint egy automata, csak a mozgási szabályban tér el: δ: Q  Σ  Q 2

Az SM-Tree létrehozása - példa ab-cd-e e ab-c -de - d - JOIN ab-c-de S1S1 -- S2S2 S3S3 S4S4 S5S5 S6S6 S7S7 S0S0 S0S0 S1S1 S2S2 S3S3 S4S4 S5S5 S6S6 S7S7 S0S0 S1S1 S2S2 S3S3 S4S4 S5S5 S6S6 S7S7 S8S8 S9S9 S 10

Az SM-Tree használata ABD BF - - A B F -- ABFD-F-ABF-AD-ABD-AFD-BFD-B-A F ABFF AA

ABFBF-AD-ABD-AFD-BFD-B-AD-F-A A B D B B B A F F AF F F AA D -BA - C A F A bemenet:

Mérési eredmények D25C10T5S4I1.25

D200C10T5S6I3

Összefoglalás Probléma: nagy szekvenciákat tartalmazó adathalmazban gyakori részszekvenciák meghatározása Megoldás: automata elméleti alapokon Automata a jelölt szekvenciáknak SM-Tree készítése az automatákból A tranzakció minden elemét pontosan egyszer kell beolvasni

Publikációs listaPublikációs lista -- Folyóirat Iváncsy, R. and I. Vajk, “A Time and Memory Efficient Frequent Itemset Discovering Algorithm for Association Rule Mining”, International Journal of Computer Applications in Technology, Special Issue on "Data Mining Applications" by Inderscience Enterprises Ltd. (accepted) Iváncsy, R. and I. Vajk, “Fast Discovery of Frequent Itemsets: a Cubic-Structure-based Approach”, Computational Intelligence in Data mining Special Issue of the Informatica Journal (ISSN ) (accepted)

Publikációs listaPublikációs lista -- Konferencia Iváncsy, G, R. Iváncsy and I. Vajk, “Graph Mining-Based Image Indexing”, In Proc. of the 5th International Symposium of Hungarian Researchers on Computational Intelligence, Budapest,Hungary, Nov , pp. Iváncsy R and I. Vajk, “A Survey of Discovering Frequent Patterns in Graph Data”, In Proc. of the IASTED International Conference on Databases and Applications ~DBA 2005~ as part of the Twenty-Third IASTED International Multi-Conference on Applied Informatics, Innsbruck, Austria, Feb , (accepted) Iváncsy R and I. Vajk, “Efficient Sequential Pattern Mining Algorithms”, In Proc. of the 4th WSEAS International Conference on Artificial Intelligence, Knowledge Engineering and Databases (AIKED 2005), Salzburg, Austria, Feb , (accepted) Iváncsy, R., S. Juhász and I. Vajk, “Fast Discovery of Sequential Patterns by Level- Wise Approach”, MicroCAD 2005 International Scientific Conference, University of Miskolc, March 10-11, Miskolc, 2005 (accepted) Iváncsy, R., T. Levendovszky and H. Charaf, “.NET Facilities in Data Mining Applications”, MicroCAD 2005 International Scientific Conference, University of Miskolc, March 10-11, Miskolc, 2005 (accepted) Iváncsy, R. and G. Iváncsy, “Image Indexing Using Frequent Graph Mining Technique”, MicroCAD 2005 International Scientific Conference, University of Miskolc, March 10-11, Miskolc, 2005 (accepted)

Kérdések