Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

"Szemantikus beszélgetések" - 2002. november 29., Műegyetem R épület #201 Információ és jelentés: a vektorteres információkereső modell értelmezési lehetőségei.

Hasonló előadás


Az előadások a következő témára: ""Szemantikus beszélgetések" - 2002. november 29., Műegyetem R épület #201 Információ és jelentés: a vektorteres információkereső modell értelmezési lehetőségei."— Előadás másolata:

1 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Információ és jelentés: a vektorteres információkereső modell értelmezési lehetőségei Darányi Sándor Tartalomelméleti Virtuális Kutatócsoport Információ- és Tudásmenedzsment Tanszék, BMGE

2 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Információ és jelentés: Gizike és gőzeke  Információ = jelentés vs. információ  jelentés  Információ 1 = hír, újdonság, ritkaság – a.m. valamilyen tartalom ritkasága  Információ 2 = a ritkaság valószínűségi mértéke a rendezetlenségből levezetve (jelentés nélkül); a valószínűség reciproka  Shannon-Weaver; Machlup-Mansfield

3 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Vektortér és szemantika  Információ a vektortérben: átkódolás eredménye (szövegből szám)  Érthetetlen, az osztályozás mitől jó (= mitől szemantikus)  Tehát a vektortérben ott kell legyen a szemantika  De hol?  A fő válfajok: Wittgenstein / Saussure, Carnap, Bloomfield / Uexküll, Frege / Peirce  Trier és a szemantikai mező (1934)

4 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 1  “Meaning is use” (Wittgenstein, PhI [1953]: § 43) [1] (az ún. pragmatikus irány)  “Use” = (1) „szövegkörnyezet”, (2) „az említés gyakorisága”, ismétlés, bevésés  Az input mátrix a változók értékeinek előfordulását ill. együttes előfordulását kódolja  Ez megfelel a “use” mindkét értelmének  A fogalmi tér W-szemantikus

5 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 2  Saussure: a nyelv = szövet, a szójelentés kontextuális, a struktúrában elfoglalt helytől függ (az ún. strukturalista irány)  Jelentés = helyiérték  A jel kételemű, forma és szubsztancia egyvelege  Ágoston, a skolasztikusok, Hobbes, Locke, Port- Royal, Hjelmslev, Cassirer, Jakobson…  A fogalmi tér S-szemantikus is

6 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 3  Carnap, cf. Lyons: a logikai szemantikában a fogalmak tartalma és terjedelme fordítottan arányos  Minél több intenzió, annál kevesebb extenzió  Vö. input mátrix, értékek gyakorisága  Vö. tezaurusz, BT :: NT  A fogalmi tér C-szemantikus is

7 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 4  Bloomfield: inger-ingerület modell  A jelentés a következmény  A jelentés kételemű (az ún. antimentalista, behaviourista irány)  Vö. vektortér időbeli változásai  A fogalmi tér B-szemantikus is  Uexküll: az észlelet mint buborék

8 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 5  Frege / Peirce: az ún. mentalista irány  A jel háromelemű (tárgy, hordozó, jelentés / fogalom)  Platón, Arisztotelész, a sztoikusok, Boethius, Bacon, Leibniz, Husserl, Ogden & Richards, Morris…  Valós vektortéren nem értelmezhető, mert hordozó és hordozott közt nincs minőségi különbség: mindkettő egynemű pont  A komplex fogalmi tér FP-szemantikus is

9 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés a vektortérben 6  Ha a vektortér egyszerre W-, S-, C-, B-, FP- szemantikus, akkor a jelentés összetett, a fenti elméletek egysíkúak  Mivel mindet geometrián figyeltük meg, közös tulajdonságuk a mező  A szemantikai mező (Trier 1934) 2-d, emez n-d  A jelentés mezőelmélete?

10 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Információkereső modellek  Boole  Valószínűségi  Vektortér-alapú  Fuzzy  Kognitív

11 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Dióhéjban a modellről 1  A vektorteres IR modell a szemantikai differenciál elvén működik (hasonló : nem hasonló = közeli : nem közeli)  A kereső algoritmus a tárgyszóvektor és a dokumentumvektor távolságát minimalizálja  Az eredmények láttatására különböző metaforákat használnak  A metaforák mind visszavezethetők a mezőre

12 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Dióhéjban a modellről 2 n A szemantikának van egy arány-oldala: a kifejezések értelme egymáshoz viszonyítható, a skála láttatható, noha sok esetet sok szempontból hasonlítunk össze (Osgood et al. 1957, affektív jelentés) n A sokváltozós osztályozási algoritmusok ilyen skálákat hoznak létre

13 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 BIGSMALL CARNIVORE HERBIVORE ELEPHANT HYPPO MOUSE GOAT PIG CAT TYRANNOSAURUS TIGER

14 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 A „főzni” ige szemantikai mezeje (Lehrer 1974)

15 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201

16

17 Néhány vizualizálási metafora a felhasználói felülethez (GUI)  (Vonalkód, brokkoli, fa, stb.)  Csillagászat (galaxis)  Térkép  3-d domborzati  2-d rétegvonalas  Háttérsugárzás (= a tartalom mint hő)

18 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Közös tárgyszó- és dokumentumgalaxis a vektortérben (Sophia adatbázis, 1389 dokumentum x 1839 tárgyszó, k = 3 [353] faktor)

19 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Önszervező (Kohonen-) térkép  A dokumentumokat egy felületre vetíti  Metafora:  ”földrajzi” szomszédság = a szemantikai tartalom hasonlóságát takarja (The Websom Project,

20 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 ThemeScapes TM  ”Topográfiák” – hegycsúcsok mint tartalmi indikátorok  Metafora:  A közelség tartalmi hasonlóságot jelez  A domborzat magassága kontextusban ábrázolja a fontosságot (SPIRE project, Pacific Northwest National Laboratory, USA )

21 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés rétegvonalas térképe (John Old, IUB)

22 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Szójelentés mint domborzat (John Old, IUB)

23 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Kölcsönös idézés mint domborzat (John Old, IUB)

24 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Vektortér mezőábrázolása, 1. változat (Magyar néphit corpus, 1837 tárgyszó x 2706 szöveg, k = 520 faktor, 1:10 vízszintes tömörítés)

25 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Ugyanaz különböző nagyításban

26 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201

27

28

29

30 Vektortér mezőábrázolása, 2. változat (Magyar néphit corpus, 1837 tárgyszó x 2706 szöveg, k = 520 faktor, 1:10 vízszintes tömörítés)

31 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Forma : tartalom = hordozó : hordozott  Ha kettéválasztjuk a hordozót és a hordozottat, akkor nem írhatja le őket egy sajátállapot  Hordozó és hordozott: kettős sajátállapot  Modularitás: többes sajátállapot  Van-e a jelentésnek olyan fizikai megfelelője, amilyen az információnak a kétállapotú jelenségek?  Van, ha csinálunk  Információátvitel helyett tartalomátvitel

32 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Értelmezési és alkalmazási lehetőségek  A geometria mint ismeretábrázolási séma  Valós vs. komplex vektortér Dokumentumkeresés Nyelvközi keresés  A nyelv mint fizika  Szimbólumok téreloszlása  A klasszikus mechanika képletei

33 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Valós vs. komplex vektortér  Dokumentumkeresés: komplex tárgyszó, komplex dokumentum  Ábrázolja mind a 2-, mind a 3-elemű jelet  Cél: zajszűrés  Cél: értelmezett háló (Semantic Web)  Nyelvközi keresés: iker-korpuszoktól a különbözőek felé  Dokumentum vs. motívum-keresés

34 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Komplex keresés  Miért nem elég a valós koordináta?  A tárgyszó második koordinátájára zajszűrés miatt van szükség  A dokumentum második koordinátája a tárgyszó komplex volta miatt kell  Most a keresés értékelése van soron (= mennyire zajos, vö. munkahipotézis)  (Még) nem komplex indexelés  Semantic Web  „Értelmező” robot

35 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 A nyelv mint fizika  Szimbólumok tér(idő-)eloszlása  Nyelv  Osztályozás  Közgazdaság  Eloszlások fizikai törvényei  Egyedi szimbólum = specifikus fizikai ismérv, vö. hely, súly (vö. Saussure, helyiérték)  Egy lépésben átvitel, bitsorozat helyett

36 "Szemantikus beszélgetések" november 29., Műegyetem R épület #201 Gyors tartalomátvitel  Analóg számítástechnikához  Nem bit-alapú tartalomátvitel  Az ideografikus írás elve  Feleltessük meg a fogalmakat helyeknek az n-dimenziós térben  Kódoljuk ezeket a helyeket pl. színekkel  Modem és spektroszkóp  Wawe computing


Letölteni ppt ""Szemantikus beszélgetések" - 2002. november 29., Műegyetem R épület #201 Információ és jelentés: a vektorteres információkereső modell értelmezési lehetőségei."

Hasonló előadás


Google Hirdetések