Adat és információ
Információ, tudás A latin informatio = felvilágosítás, tájékoztatás, oktatás szóból Minden, ami megkülönböztet Új ismeretté értelmezett adat Feltételez egy értelmezőt Információt önmagában tárolni, továbbítani lehetetlenség. Továbbítani tárolni csak olyan közleményt lehet, amely információt tartalmaz. A közlemény jelekből épül fel. Az információ a közlemény tartalmi aspektusa. Az emberi elmében rendszerezett, elérhető és alkalmazható információ a tudás. A tudás mindig előrejelző (prognosztív) természetű.
Adat, jel Jelentésétől megfosztott jelsorozat A közlemény formai aspektusa A számítógépek adatokat manipulálnak, tárolnak, továbbítanak. Jelek: a közlemény alkotóelemei, az adatok fizikai hordozói. Lehet analóg és digitális. Szintaktika: a jelek egymáshoz való viszonya Szemantika: a jel és a jelentés viszonya Pragmatika: a jel és a használója közötti viszony
Az információ mennyisége Az információelmélet kidolgozása Shannon nevéhez köthető. Egy közlemény információtartalmának meghatározásához Shannon speciális, ún. „szupertömény” közleményeket vizsgált. Itt a közlemény minden egyes jele egymástól független és önmagában is információt hordoz. (Pl. egy totó tipposzlop: 1,2,X,1,1,1,2,2,2,X,X,X,1,2) A közlemény jelkészlete azoknak a jeleknek a számát adja meg, amelyekből felépül a közlemény. (A példában 3 darab jel van – 1,2 és X – tehát a jelkészlet s = 3)
A jelkészlet összinformációmennyisége Egyetlen jellel annyi darab különböző közlemény alkotható, amennyi a jelkészlet elemeinek a száma. (Példánkban vagy az „1”, vagy a „2”, vagy az „X”) A lehetséges közlemények száma a jelek számával exponenciálisan növekszik. (Egy 3 elemű jelkészlet esetén: 1 jellel 3, 2 jellel 9, 3 jellel 27 különböző közlemény alkotható.) Tehát a teljes jelkészlet összinformációmennyisége S = s j, ahol s a jelkészlet, j pedig a közlemény jeleinek száma
Egyetlen közlemény információmennyisége A közlemény információmennyisége megegyezik a jelkészlet összinformációmennyiségével! Tehát a közlemény információmennyisége S = s j. A könnyebb kezelhetőség végett logaritmizáljuk az egyenlőséget, és megkapjuk az információ mértékegységeit. I = log(s) = log(s j ) = j*log(s). Tehát a közlemény információmennyisége S = s j. A könnyebb kezelhetőség végett logaritmizáljuk az egyenlőséget, és megkapjuk az információ mértékegységeit. I = log(s) = log(s j ) = j*log(s). Egyetlen jel információmennyisége log(s), egy j darab jelből álló közlemény információmennyisége pedig j*log(s). Mindez csak akkor igaz, ha a jelek előfordulási valószínűsége azonos!
Az információ mértékegységei A használt mértékegység a logaritmus alapszámától függ. I = j*log 2 (s) bit, I = j*lg(s) hartley, I = j*ln(s) nat Mindez csak akkor igaz, ha a jelek előfordulási valószínűsége azonos! Feladatok: Mennyi az információtartalma egy totó tipposzlopnak (bitben, natban, hartleyban)? Mennyi az információtartalma annak a szupertömény közleménynek, amely 100 egymást követő kockadobás eredményét tartalmazza (bitben)?
Redundancia Ha a közleményt továbbítani akarjuk, akkor valamilyen csatornán keresztül tudjuk ezt megtenni. Ez lehet térbeli és időbeli is. Mindenképpen számolnunk kell azzal, hogy a továbbítás során sérülhet a közlemény. Zaj: minden olyan jel a csatornában, amely nem része a közleménynek. Redundancia = terjengősség. Az információt a minimálisan szükségesnél több jelből álló közleménnyel írjuk le, az átviteli hibák detektálása, vagy javítása céljából.
Tömörítés A közlemény átalakítása olyan módon, hogy kevesebb jelből álljon, ugyanakkor az információtartalma egyáltalán ne, vagy csak elfogadható mértékben csökkenjen. Veszteséges tömörítés (forráskódolás): jpeg, mpeg, mp3 Veszteségmentes tömörítés (entrópiakódolás): RLE, Huffmann, LZW
Adatábrázolás a számítógépen Az informatikában minden adat 0 és 1 számjegyek sorozataként kerül tárolásra! (Nincsenek karakterek, minuszjel, tizedespont) Numerikus adatok ábrázolása: Egész számok: fixpontos számábrázolás Valós számok: lebegőpontos számábrázolás (karekterisztika és mantissza) Negatív számok: előjelbit Karakteres adatok : ASCII kódtábla, UNICODE kódolás
Adatábrázolás a számítógépen Az informatikában minden adat 0 és 1 számjegyek sorozataként kerül tárolásra! (Nincsenek karakterek, minuszjel, tizedespont) Numerikus adatok ábrázolása: Egész számok: fixpontos számábrázolás Valós számok: lebegőpontos számábrázolás (karekterisztika és mantissza) Negatív számok: előjelbit Karakteres adatok : ASCII kódtábla, UNICODE kódolás
Adatábrázolás a számítógépen Képek: Vektorgrafikus Raszteres (színrendszerek, tömörítés) Hang: Hanghullám (wav, mp3) MIDI Videó: Kép + hang kodekek