Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Szöveges adatok tárolása
ASCII és UNICODE
2
A szöveges adatok alapegysége a karakter.
Karakternek nevezünk pl. egy betűt, egy számjegyet, egy szóközt, egy írásjelet stb.
3
Karakterek tárolása A számítógép „nyelve” a kettes számrendszer.
A szöveges adatok tárolása is kettes számrendszerben történik. Minden karakterhez (jelhez) egy kettes számrendszerbeli számot (kódot) kell rendelni. A hozzárendeléshez egy kódtábla szükséges.
4
Elterjedt kódolások Kiterjesztett ASCII 8 bites kódolás 256 karakter
Unicode 16 bites kódolás 65536 karakter
5
# ASCII # [ejtsd: esz'kii]
American Standard Code for Information Interchange (amerikai szabványos kódrendszer információcseréhez) Nemzetközi szabvánnyá vált rendszer a karakterek számítógépes kódolására. Eredetileg egy karakter kódolása 7 biten történt (standard, 128 féle jel), majd ezt kiterjesztették 8 bitre (kiterjesztett, 256 féle jel).
6
ASCII kódlapok 256 bitsorozat nem elég a szükséges karakterek tárolására (lásd speciális nemzeti karakterek) két részre bontották az ASCII kódtáblát: Állandó rész Cserélhető rész (6 db kódlap)
7
Az ASCII kódtábla 00000000-01111111 (0-127) Standard rész
Vezérlőkarakterek (soremelés, lapváltás stb.) Írásjelek, műv. jelek, stb. (szóköz, (, ), /, ! ,stb.) Számjegyek (0-9) Betűk: angol abc kis-, nagybetűk ( ) Kiterjesztett rész (kódlap) Speciális nemzeti karakterek (á, í, ö stb.) Grafikus karakterek (pl. keretező karakterek)
8
A 852-es kódlap A kódlapokat számmal is ellátták.
Az alapértelmezés szerinti kódlap az amerikai (437-es). A magyar ékezetes betűket a 852-es latin-II nevű kódlap tartalmazza. ASCII kód használata esetén problémákba ütközhetünk több nyelvű szöveg készítésénél!
9
# Unicode # [ejtsd: junikód vagy magyarosan: unikód]
Terjedőben levő nemzetközi szabvány a karakterek számítógépes kódolására. 16 bites kódokat használ, így a 7 vagy 8 bites ASCII korlátozott lehetőségeivel szemben szinte az emberiség által használt valamennyi írásjel leírható vele.
10
universal (univerzális)
Unicode alapelvek unique (egyedi) universal (univerzális) uniform (egységes) "holt" nyelvek is beletartoznak (pl. Szankszkrit) 16 bites hosszúságú és mindegyik egy tényleges létező karaktert reprezentál. Nincsenek sem vezérlő kódok sem vezérlő kódsorozatok.
11
Unicode tartalma-I. Az első 8192: szabványos alfabetikus karakterek számára foglalták le, helyett hagyva a később szabványba bekerülő régi írások ABC-inek. A következő 4096 kód tartalmazza az írásjeleket, matematikai, műszaki és piktogram szimbólumokat. Az ezt követő 4096 karaktert foglalták le a kínai, japán és koreai ABC-nek és írásjeleknek.
12
Unicode részei-II. A kód legnagyobb részét mintegy karaktert az egységesített Han karakterek részére foglalták le. Az egységesített Han karakterkészletet a GB Kínai Nemzeti Szabvány definiálja. Végül az utolsó előtti 5632 hely a felhasználók által használható és definiálható, Az utolsó 495 kód az Unicode alá konvertálást segítő karakterek tartománya.
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.