"Szemantikus beszélgetések" - 2002. november 29., Műegyetem R épület #201 Információ és jelentés: a vektorteres információkereső modell értelmezési lehetőségei.

Slides:



Advertisements
Hasonló előadás
Keresés a számítógépes katalógusokban
Advertisements

Néhány fontos terület a Kreatív Ipar fejlődéséhez
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
INFORMÁCIÓKERESÉS JELENTÉSREPREZENTÁCIÓ ALAPJÁN
Tengeralattjáró győzelmi hírek elmaradása – kilövés
Információ és közlemény
Miről szól a Katégoriák? Cat.3: „Amikor valamit másvalamiről, mint alanyról állítunk, mindaz, amit az állítmányról mondunk, az alanyról is mondható. Pl.
EE/R adatmodell (Extended E/R) 1 Az objektum orientált szemlélet elterjedésével egyre nőtt az igény az olyan SDM (Semantic Data Model) modellek iránt,
Logika Miskolci Egyetem Állam- és Jogtudományi Kar
Készítette: Mester Tamás METRABI.ELTE.  Egy bemeneten kapott szöveg(karakter sorozat) méretét csökkenteni, minél kisebb méretűre minél hatékonyabb algoritmussal.
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Sűrűségfüggvény Parzen becslés Mintapontszám, szigma.
1. A KVANTUMMECHANIKA AXIÓMÁI
13.a CAD-CAM informatikus
Az informatika alapjai
Logika Érettségi követelmények:
A második nyelv elsajátítás elméletei 2.
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
ARISZTOTELÉSZ (Kr. e ).
Vámossy Zoltán 2006 Gonzales-Woods, SzTE (Kató Zoltán) anyagok alapján
Egy komponensű folyadékok Klasszikus elmélet
Orvosi kódrendszerek. Élő és élettelen Környezeti hatás  szerkezetváltozás.
Bevezetés az orvosi kódrendszerekhez 2. előadás Semmelweis Egyetem Egészségügyi szervező szak II. évf
Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár.
3. A HIDROGÉNATOM SZERKEZETE A hidrogénatom Schrödinger-egyenlete.
2. A KVANTUMMECHANIKA AXIÓMÁI 1. Erwin Schrödinger: Quantisierung als Eigenwertproblem (1926) 2.
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Szemantikus keresők.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
Navigáció hypertext- rendszerekben Varga Balázs tanársegéd ELTE IK Algoritmusok és Alkalmazásaik Tsz.
Személyiségelméletek
Számítógép-hálózatok
2. A logika története Gregor Reisch  1503  Typus logice Premissae
Adatbányászati módszerek a térinformatikában
Zentai László: Térképészet Térinformatika sáv Térképészet Zentai László Eötvös Loránd Tudományegyetem Térképtudományi és Geoinformatikai Tanszék
W.V. O. Q UINE A DOLGOK ÉS HELYÜK AZ ELMÉLETEKBEN (1981) Mészáros Zsuzsanna Tudományfilozófia szem.
Logika Miskolci Egyetem Állam- és Jogtudományi Kar Jogelméleti és Jogszociológiai Tanszék.
Az irodalomtudomány alapjai Anglisztika alapszak Germanisztika alapszak Kedd ADs 035.
Az irodalomtudomány alapjai
A valószínűségi magyarázat induktív jellege
Funkciós blokkok A funkciós blokkok áttekintése Az alkalmazás előnyei.
Keresés a weben Kulcsszavas keresés: Google (
Címlap Bevezetés az információelméletbe Keszei Ernő ELTE Fizikai Kémiai Tanszék
Newton gravitációs törvényének és Coulomb törvényének az összehasonlítása. Sípos Dániel 11.C 2009.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
A tömeg (m) A tömeg fogalma A tömeg fogalma:
Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.
Automatikus dokumentum- feldolgozó megoldások
A kommunikáció értelmezése
Kiterjesztések szemantikája: Szemantikai tartomány : Adatoknak, vagy értékeknek egy nem üres halmazát szemantikai tartománynak nevezzük. Jelölése: D. Egy.
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
Keresés fajtái Matching (szabadszavas)
Chapter 2 Human Information Processing
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
A középkor után A filozófia változása: metafizika helyett az ismeretelmélet a központi diszciplína. Logika: A középkori logika továbbélése: reneszánsz.
Szövegfeldolgozás ontológiák segítségével – fogalmak azonosítása Szekeres András Márk.
Adat és információ. Információ, tudás  A latin informatio = felvilágosítás, tájékoztatás, oktatás szóból  Minden, ami megkülönböztet  Új ismeretté.
Hátralevő évek: Próbálkozás a paradoxon kiküszöbölésére a rossz úton – 1906 k. feladja. Vita Hilberttel a geometriáról: szélsőségesen konzervatív kantiánus.
Információelmélet 8. 1 Eszterházy Károly Főiskola, Eger Médiainformatika intézet Információs Társadalom Oktató-
Pécsi Tudományegyetem Pollack Mihály Műszaki Kar Műszaki Informatika Szak Data Mining 16. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens PTE-PMMK Számítástechnika.
Információelmélet 1 Eszterházy Károly Főiskola, Eger Médiainformatika intézet Információs Társadalom Oktató- és.
Ajánlott irodalom Klinghammer, Papp-Váry: Füldünk tükre, a térkép. Gondolat, Bp., 1983 Klinghammer, Mosonyi, Török, Zs.: Amiről a térképek mesélnek (CD-ROM).
Vizualizáció és képszintézis
Filozófiai tudományágak (diszciplínák)
Hőmérséklet Időjárás.
Tanulás és emlékezet 5. előadás.
Tudásstruktúrák szerepe a befogadásban
Bevezetés Tematika Számonkérés Irodalom
Előadás másolata:

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Információ és jelentés: a vektorteres információkereső modell értelmezési lehetőségei Darányi Sándor Tartalomelméleti Virtuális Kutatócsoport Információ- és Tudásmenedzsment Tanszék, BMGE

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Információ és jelentés: Gizike és gőzeke  Információ = jelentés vs. információ  jelentés  Információ 1 = hír, újdonság, ritkaság – a.m. valamilyen tartalom ritkasága  Információ 2 = a ritkaság valószínűségi mértéke a rendezetlenségből levezetve (jelentés nélkül); a valószínűség reciproka  Shannon-Weaver; Machlup-Mansfield

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Vektortér és szemantika  Információ a vektortérben: átkódolás eredménye (szövegből szám)  Érthetetlen, az osztályozás mitől jó (= mitől szemantikus)  Tehát a vektortérben ott kell legyen a szemantika  De hol?  A fő válfajok: Wittgenstein / Saussure, Carnap, Bloomfield / Uexküll, Frege / Peirce  Trier és a szemantikai mező (1934)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 1  “Meaning is use” (Wittgenstein, PhI [1953]: § 43) [1] (az ún. pragmatikus irány)  “Use” = (1) „szövegkörnyezet”, (2) „az említés gyakorisága”, ismétlés, bevésés  Az input mátrix a változók értékeinek előfordulását ill. együttes előfordulását kódolja  Ez megfelel a “use” mindkét értelmének  A fogalmi tér W-szemantikus

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 2  Saussure: a nyelv = szövet, a szójelentés kontextuális, a struktúrában elfoglalt helytől függ (az ún. strukturalista irány)  Jelentés = helyiérték  A jel kételemű, forma és szubsztancia egyvelege  Ágoston, a skolasztikusok, Hobbes, Locke, Port- Royal, Hjelmslev, Cassirer, Jakobson…  A fogalmi tér S-szemantikus is

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 3  Carnap, cf. Lyons: a logikai szemantikában a fogalmak tartalma és terjedelme fordítottan arányos  Minél több intenzió, annál kevesebb extenzió  Vö. input mátrix, értékek gyakorisága  Vö. tezaurusz, BT :: NT  A fogalmi tér C-szemantikus is

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 4  Bloomfield: inger-ingerület modell  A jelentés a következmény  A jelentés kételemű (az ún. antimentalista, behaviourista irány)  Vö. vektortér időbeli változásai  A fogalmi tér B-szemantikus is  Uexküll: az észlelet mint buborék

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 5  Frege / Peirce: az ún. mentalista irány  A jel háromelemű (tárgy, hordozó, jelentés / fogalom)  Platón, Arisztotelész, a sztoikusok, Boethius, Bacon, Leibniz, Husserl, Ogden & Richards, Morris…  Valós vektortéren nem értelmezhető, mert hordozó és hordozott közt nincs minőségi különbség: mindkettő egynemű pont  A komplex fogalmi tér FP-szemantikus is

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 6  Ha a vektortér egyszerre W-, S-, C-, B-, FP- szemantikus, akkor a jelentés összetett, a fenti elméletek egysíkúak  Mivel mindet geometrián figyeltük meg, közös tulajdonságuk a mező  A szemantikai mező (Trier 1934) 2-d, emez n-d  A jelentés mezőelmélete?

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Információkereső modellek  Boole  Valószínűségi  Vektortér-alapú  Fuzzy  Kognitív

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Dióhéjban a modellről 1  A vektorteres IR modell a szemantikai differenciál elvén működik (hasonló : nem hasonló = közeli : nem közeli)  A kereső algoritmus a tárgyszóvektor és a dokumentumvektor távolságát minimalizálja  Az eredmények láttatására különböző metaforákat használnak  A metaforák mind visszavezethetők a mezőre

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Dióhéjban a modellről 2 n A szemantikának van egy arány-oldala: a kifejezések értelme egymáshoz viszonyítható, a skála láttatható, noha sok esetet sok szempontból hasonlítunk össze (Osgood et al. 1957, affektív jelentés) n A sokváltozós osztályozási algoritmusok ilyen skálákat hoznak létre

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 BIGSMALL CARNIVORE HERBIVORE ELEPHANT HYPPO MOUSE GOAT PIG CAT TYRANNOSAURUS TIGER

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 A „főzni” ige szemantikai mezeje (Lehrer 1974)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201

Néhány vizualizálási metafora a felhasználói felülethez (GUI)  (Vonalkód, brokkoli, fa, stb.)  Csillagászat (galaxis)  Térkép  3-d domborzati  2-d rétegvonalas  Háttérsugárzás (= a tartalom mint hő)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Közös tárgyszó- és dokumentumgalaxis a vektortérben (Sophia adatbázis, 1389 dokumentum x 1839 tárgyszó, k = 3 [353] faktor)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Önszervező (Kohonen-) térkép  A dokumentumokat egy felületre vetíti  Metafora:  ”földrajzi” szomszédság = a szemantikai tartalom hasonlóságát takarja (The Websom Project,

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 ThemeScapes TM  ”Topográfiák” – hegycsúcsok mint tartalmi indikátorok  Metafora:  A közelség tartalmi hasonlóságot jelez  A domborzat magassága kontextusban ábrázolja a fontosságot (SPIRE project, Pacific Northwest National Laboratory, USA )

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés rétegvonalas térképe (John Old, IUB)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés mint domborzat (John Old, IUB)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Kölcsönös idézés mint domborzat (John Old, IUB)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Vektortér mezőábrázolása, 1. változat (Magyar néphit corpus, 1837 tárgyszó x 2706 szöveg, k = 520 faktor, 1:10 vízszintes tömörítés)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Ugyanaz különböző nagyításban

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201

Vektortér mezőábrázolása, 2. változat (Magyar néphit corpus, 1837 tárgyszó x 2706 szöveg, k = 520 faktor, 1:10 vízszintes tömörítés)

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Forma : tartalom = hordozó : hordozott  Ha kettéválasztjuk a hordozót és a hordozottat, akkor nem írhatja le őket egy sajátállapot  Hordozó és hordozott: kettős sajátállapot  Modularitás: többes sajátállapot  Van-e a jelentésnek olyan fizikai megfelelője, amilyen az információnak a kétállapotú jelenségek?  Van, ha csinálunk  Információátvitel helyett tartalomátvitel

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Értelmezési és alkalmazási lehetőségek  A geometria mint ismeretábrázolási séma  Valós vs. komplex vektortér Dokumentumkeresés Nyelvközi keresés  A nyelv mint fizika  Szimbólumok téreloszlása  A klasszikus mechanika képletei

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Valós vs. komplex vektortér  Dokumentumkeresés: komplex tárgyszó, komplex dokumentum  Ábrázolja mind a 2-, mind a 3-elemű jelet  Cél: zajszűrés  Cél: értelmezett háló (Semantic Web)  Nyelvközi keresés: iker-korpuszoktól a különbözőek felé  Dokumentum vs. motívum-keresés

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Komplex keresés  Miért nem elég a valós koordináta?  A tárgyszó második koordinátájára zajszűrés miatt van szükség  A dokumentum második koordinátája a tárgyszó komplex volta miatt kell  Most a keresés értékelése van soron (= mennyire zajos, vö. munkahipotézis)  (Még) nem komplex indexelés  Semantic Web  „Értelmező” robot

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 A nyelv mint fizika  Szimbólumok tér(idő-)eloszlása  Nyelv  Osztályozás  Közgazdaság  Eloszlások fizikai törvényei  Egyedi szimbólum = specifikus fizikai ismérv, vö. hely, súly (vö. Saussure, helyiérték)  Egy lépésben átvitel, bitsorozat helyett

"Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Gyors tartalomátvitel  Analóg számítástechnikához  Nem bit-alapú tartalomátvitel  Az ideografikus írás elve  Feleltessük meg a fogalmakat helyeknek az n-dimenziós térben  Kódoljuk ezeket a helyeket pl. színekkel  Modem és spektroszkóp  Wawe computing