Adatbiztonság és tartalom alapú információkezelés

Slides:



Advertisements
Hasonló előadás
Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
Advertisements


Kamarai prezentáció sablon
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
Készítette: Boros Erzsi
Digitális képanalízis Félévi megbeszélnivalók. A tárgy •címe: Digitális képanalízis •szakirányos tárgy •neptun-kód: BMEEOFTASJ5 (BSc) •előadó és gyakorlatvezető:
Weblap szerkesztés HTML oldal felépítése Nyitó tag Záró tag Nyitó tag Záró tag oldalfej tözs.
Internet magyarul? Széphalom, 2009 okt.2. Internetezés és nyelvhasználat A magyar nyelvű tartalmakon kívül milyen tartalmakat használ az interneten? (internetezők.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS Adatbázis alapú rendszerek 1. Gyakorlat Követelmények / SQL.
Erőállóképesség mérése Találjanak teszteket az irodalomban
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Házman DIGITÁLIS BESZÉDJEL ÁTVITEL.
Egy vonzóbb város: Biharkeresztes
Az előadásokon oldandók meg. (Szimulációs modell is tartozik hozzájuk)
Humánkineziológia szak
Mellár János 5. óra Március 12. v
1Objektumorientált elemzés és tervezés – Dinamikus modellezés Gyurkó György Objektumorientált elemzés és tervezés Dinamikus modellezés.
MFG-Pro váll-ir. rendszer bemutatása
6) 7) 8) 9) 10) Mennyi az x, y és z értéke? 11) 12) 13) 14) 15)
Műveletek logaritmussal
Koordináta transzformációk
Utófeszített vasbeton lemez statikai számítása Részletes számítás
A tételek eljuttatása az iskolákba
Környezettechnika A 13. C osztály részére 2011/2012.
Mérés és adatgyűjtés laboratóriumi gyakorlat Karakterisztikák mérése 1 Makan Gergely, Mingesz Róbert, Nagy Tamás V
Mérés és adatgyűjtés laboratóriumi gyakorlat Makan Gergely, Mingesz Róbert, Nagy Tamás 2. óra szeptember 9., 10. v
A diákat jészítette: Matthew Will
Vizsga- és versenyfeladatok patológiája és diagnosztikája
Műszaki ábrázolás alapjai
Talajjavítás mélytömörítéssel, szemcsés kőoszlopokkal
Pázmány - híres perek Pázmány híres perek.
Szerkezeti elemek teherbírásvizsgálata összetett terhelés esetén:
6. Előadás Merevítő rendszerek típusok, szerepük a tervezésben
Darupályák tervezésének alapjai
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
A LÁTHATATLAN PÉNZ TITKAI
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém /' /
dr. Szalkai István Pannon Egyetem, Veszprém
szakmérnök hallgatók számára
Válogatott fejezetek sejtbiológiából („VFSB”, BSc, biomérnök)
Válogatott fejezetek sejtbiológiából (BSc, biomérnök)
Kerékpártároló átadás
A háború és a modern fegyveres erő
9.1. ábra. A 135Xe abszorpciós hatáskeresztmetszetének energiafüggése.
4. Feladat (1) Foci VB 2006 Különböző országok taktikái.
2007. május 22. Debrecen Digitalizálás és elektronikus hozzáférés 1 DEA: a Debreceni Egyetem elektronikus Archívuma Karácsony Gyöngyi DE Egyetemi és Nemzeti.
var q = ( from c in dc.Customers where c.City == "London" where c.City == "London" select c).Including( c => c.Orders ); select c).Including(
Készítette: Gocsál Ákos, Gocsál Klára, Fehér Péter 1 A program megvalósulását az Apertus Közalapítvány támogatta. Internet az oktatásban – taneszközök.
MIKROELEKTRONIKA, VIEEA306
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika.
2006. május 15P2P hálózatok 1 Fóliák a vizsgára: 1. előadás  Bevezető: 11-16, 21,  Usenet: előadás:  Bevezető: 3-8  Napster: 
2006. Peer-to-Peer (P2P) hálózatok Távközlési és Médiainformatikai Tanszék.
QualcoDuna interkalibráció Talaj- és levegövizsgálati körmérések évi értékelése (2007.) Dr. Biliczkiné Gaál Piroska VITUKI Kht. Minőségbiztosítási és Ellenőrzési.
1 Gyarapodó Köztársaság Növekvő gazdaság – csökkenő adók február 2.
1 Adatbiztonság és tartalom alapú információkezelés 2. előadás.
MULTIMÉDIA. Az előadás rövid tartalma 4 Mi a multimédia ? (definíció) 4 A hang és kép 4 A sávszélesség kihívása (néhány szó a tömörítésről) 4 Néhány multimédia.
Hibaterjedés-analízis
MIKROELEKTRONIKA, VIEEA306
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Virtuális Méréstechnika Sub-VI és grafikonok 1 Makan Gergely, Vadai Gergely v
Mérés és adatgyűjtés laboratóriumi gyakorlat - levelező Sub-VI és grafikonok 1 Mingesz Róbert V
Kvantitatív módszerek
MULTIMÉDIA. Az előadás rövid tartalma 4 Mi a multimédia ? (definíció) 4 A hang és kép 4 A sávszélesség kihívása (néhány szó a tömörítésről) 4 Néhány multimédia.
1 TANULÁSI TÍPUS TESZT.
Digitális képanalízis Félévi megbeszélnivalók. A tárgy címe: Digitális képanalízis szakirányos tárgy neptun-kód: BMEEOFTASJ5 (BSc) előadó és gyakorlatvezető:
Programozási alapismeretek 8. előadás. ELTE Szlávi-Zsakó: Programozási alapismeretek 8.2/  További programozási.
A KÖVETKEZŐKBEN SZÁMOZOTT KÉRDÉSEKET VAGY KÉPEKET LÁT SZÁMOZOTT KÉPLETEKKEL. ÍRJA A SZÁMOZOTT KÉRDÉSRE ADOTT VÁLASZT, VAGY A SZÁMOZOTT KÉPLET NEVÉT A VÁLASZÍV.
A termelés költségei.
Előadás másolata:

Adatbiztonság és tartalom alapú információkezelés Dr. Levendovszky János, egyetemi tanár BME, Híradástechnikai Tanszék elérhetőség+ kurzusinfo : bonusz@octopus.hit.bme.hu, Háttéranyagok, hirdetmények : http://neural.hit.bme.hu/tartalom fogadóóra (konz. időpont): csütörtök 4h (IL 118)

Számonkérés Félévközben 1 db. Zh (illetve PZh) Projektfeladat (szorgalmi időszak végén) Vizsga dolgozat leadás + előadás A számonkérés anyaga csak az előadásokon elhangzottakat érinti

Ajánlott irodalom S. Mitra, T. Acharya: “Data mining multimeida, soft computing and bioinformatics”, Wiley, 2003 S. Haykin: “Neural networks, a comprehensive foundation”, Prentice Hall, 1999 J. Han, M. Kamber: “Adatbányászat”, PANEM, 2004, Előadásjegyzetek

Tartalom alapú információkezelés : adott adattípusokon belül rejtett kapcsolatok és „minták”, függőségek …stb. feltárása Multimédiás adatok: Bármilyen információ ami tárolható, processzálható és átvihető digitális médiumon keresztül (pl. video, hang, szöveg, grafikus információk, …stb.)

Információelőhívás és kezelés tartalom alapján ??? szöveg kép hang Melyik biztonsági kamerás felvételen szerepelt álarcos ember ? Melyik e-mail-ben szerepel a szó Bin Laden ?_ Melyik híradóban hangzott el a szó ‘elnökválasztás”

Általános modell MULTIMEDIA adat korpusz Feature extraction, transformation, compression Asszociatív leképezés, osztályozó algoritmus Relevancia rangsor végeredmény Query Klaszterezés, indexelés (redukált dimenziójú térben) Feature extraction, transformation, compression MULTIMEDIA adat korpusz

Indexelés – asszociatív leképezések Instances (egyedi megvalósulások) Prototípus: a NAP

Asszociatív leképezés (formális definíció) Prototípusok objektumok (indexek) Megfigyelt objektum (képrészlet): megfigyelési tér metrikával (pl. Hamming távolság) Asszociáció:

Objects (e.g. texts, or sound FFTs, or images) Klaszterezés Objects (e.g. texts, or sound FFTs, or images) 1-es prototípus 2-es prototípus 3-as prototípus

Formális leírás Adott úgy, hogy és

Klaszterezés – indexing (osztályozás) Objects (e.g. texts, or sound FFTs, or images) 1-es prototípus 2-es prototípus 3-as prototípus query

Lényegkiemelés, dimenzió csökkentés Csak az információ fele kell

Egy kicsit jobb megoldás Így is csak fele sávszélesség kell !!!

Dimenzióredukció Lényegtelen és lényeges részek szétválasztása 1. térbeli frekvenciák alapján 2. statisztikai függetlenség alapján 3. Időbeli változások alapján

A képtömörítés algoritmusa Alapgondolat: A nem fontos részek eldobása. Azt hogy mi a fontos egy transzformáció mondja meg, amely a képet “fontossági sorrendbe állítja”. „prioritezált” kép Ere-deti kép Transzformáció a fontossági sorrend felállítására „Vágás”(a nem fontos info. eldobása) Tömörített kép Inverz transzformáció Veszteséges visszaállítás a vágás után

Transzformációk Karhunen - Loéve Transzformáció (KLT): a fontossági sorrendet a “főkomponen-sek” határozzák meg, amelyek lineár kombinációjából létrejön a korelált videojel. Discrete Cosine Transform (DCT): A magasabb térbeli periodicitású komponensek elhagyása

www keresés

Eredmények I

Eredmények II Mi releváns, mi nem ?

Történeti áttekintés 1960-70 „String matching” probléma, Boyer-Moore algoritmus, Knuth-Morris-Pratt algoritmus, Karp- Rabin algoritmus Tartalomalapú információkezelés természetes nyelveken (kis tudományos szövegkorpuszok, Boolean és vektortéralapú modellek, Salton, Cornell University)

Történeti áttekintés (folyt.) 1980-as évek Nagy dokumentum adathalmazok, vállalati tulajdonban Lexis – Nexis Dialog MEDLINE

Történeti áttekintés (folyt.) 1990-as évek FTP letölthető dokumentumok keresése az interneten Archie WAIS Keresés a világhálón Lycos Yahoo Altavista Automated text categorization and clustering Érzékelő és felügyelő rendszerek multimédiás adathalmazai

Történeti áttekintés (folyt.) 2000 - as évek Link analízis web-es keresésre - Google Automatikus információ kinyerés – Whizbang, Fetch, Burning Glass Kérdés felelet típusú információkinyerés – TREC Q/A track Multimedia IR Cross language IR – DARPA tides Dokumentum összefoglalók

String matching

Text: a b b b a b a b a b b a b b a b b b b a a b b a b Pattern: b b a b Text: a b b b a b a b a b b a b b a b b b b a a b b a b a 1 2 3 4 b Állapotgráf:

Pattern: b b a b Text: a b b b a b a b a b b a b b a b b b b a a b b a b Állapotgráf: 1 2 3 4 a b állapot a b 1 2 3 4

Előhívás a b 1 2 3 4 Pattern: b b a b állapot a b 1 2 3 4 Text: a b b b a b a b a b b a b b a b b b b a a b b a b 0 0 1 2 2 3 4 0 1 0 1 2 3 4 2 3 4 2 2 2 3 0 1 2 3 4 Komplexitás:

Knuth- Morris- Pratt algoritmus Text: c b b a b a b b a b a b a c a b a Pattern: b a b a b c a Eltolt pattern: b a b a b c a b a b a b b a b Nincs szükség visszamenőleges összehasonlításra !

Next táblázat 1 2 3 4 5 b a b a b a b b a b a b b a b a b b a b a b j 1 2 3 4 5 Pattern b a Next

A Next tábla előállítása

KMP algoritmus

Boyer – Moore algoritmus Text: … a b b a d b a b a c b d a Skip 5 Skip 3 Pattern: b c b a b b c b a b b c b a b Skip tábla a b c d 1 3 5

Példa Text: …one of them matches and other mismatch from Pattern: match Skip tábla m a t c h * 4 3 2 1 5

Példa (folyt.) …one of them matches and other mismatch from match 5 match 1 match match 5 match 5 match 5 match 5 match 5 match match No skip

A skip tábla előállítása

Boyer – Moore – Horspool algoritmus Text: …one of them matches and other mismatch from Pattern: match Skip tábla m a t c h * 4 3 2 1 5

BMH (folyt.) …one of them matches and other mismatch from match match No skip match 5 match 1 match 5 match 5 5 match 5 match 5 match match 5 match 1

Karp – Rabin algoritmus Pattern: d e d Text: b a d e d e d c a b Text: 1 0 3 4 3 4 3 4 2 0 1 Text: 1 0 3 4 3 4 3 2 0 1 Transzf: 28 19 98 119 98 117 85 51 98 98 98 98 98 98 98 98 AND 0 0 1 0 1 0 0 0

Előhívás tömörített file-ban Text: a b a c b b a a b c a b c Pattern: ac Huffman kódolás 11 = c 10 = b 0 =a Pattern: 011 Text: 010011101000101101011 NEMOK OK