Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/ Adatábrázolás Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/

Hasonló előadás


Az előadások a következő témára: "Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/ Adatábrázolás Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/"— Előadás másolata:

1 Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/
Adatábrázolás Csernoch Mária

2 Nem-numerikus karakterek
a gyakorlatban legelterjedtebb a kiterjesztett ASCII (American Standard Code for Information Interchange) angol ábécé kis- és nagybetűi számjegyek írásjelek speciális vezérlő karakterek 1 bájt = 1 karakter (összerendelés) 128 standard, 7 bit +128 extended speciális, kódlapok magyar: 852, magyar Windows: 1250 probléma: gépek, programok közötti kommunikáció

3 ASCII standard

4 ASCII standard, extended (Latin-1)
Unicode

5 Unicode az összes létező karakter ábrázolására 32 bit
encoded character: 0–10FFFF(16 (code points) code points ( ) 1 karakter = 1 nemnegatív egész szám jellemzők universal efficient unambiguous 16 bites síkok az utolsó négy hexadecimális számjegy a karakter síkon belüli pozíciója a vezető számjegyek a síkot jelölik

6 Unicode planes plane 0 Unicode alsó 16 bites tartománya, Basic Multilingual Plane (BMP) alsó 128 érték: ASCII alsó 256 érték: Latin-1 modern világ leggyakrabban használt karakterei, valamint ritka vagy történelmi karakterek

7

8

9 Unicode planes plane 0 plane 1 plane 2 plane 3–13 plane 14 plane 15–16
Basic Multilingual Plane (BMP) plane 1 Supplementary Multilingual Plane (SMP) historic scripts (Gothic, Ancient Greek), musical symbols, domino tiles plane 2 Supplementary Ideographic Plane (SIP) CJK Ideographs plane 3–13 unassigned plane 14 Supplementary Special-purpose Plane (SSP) currently contains non-graphical characters (language tag characters) plane 15–16 Private Use Area (PUA) character assignment by parties outside the ISO and the Unicode Consortium

10 Unicode Transformation Format
UTF-32 (32-bit Unicode Transformation Format) teljes fix hosszúságú kódok: karakterenként 4 bájt egy-egy megfeleltetés UTF-16 (16-bit Unicode Transformation Format) U+0000U+FFFF intervallumon (BMP) 16 bites U+1000010FFFF intervallum (supplementary planes) 16 bites párok BMP-nek UTF-16 fix hosszúságú UTF-8 (8-bit Unicode Transformation Format) tömörebb változó hosszúságú kódok leghosszabb 6 bájt 1 bájton tárolt kódjai az ASCII-nek felelnek meg

11 Unicode érték – UTF-8 ábrázolás
xxxxxxx 0xxxxxxx xxx xxxxxxxx 110xxxxx 10xxxxxx xxxxxxxx xxxxxxxx 1110xxxx 10xxxxxx 10xxxxxx xxxxx xxxxxxxx xxxxxxxx 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 000000xx xxxxxxxx xxxxxxxx xxxxxxxx 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 0xxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

12 UTF-8 bitek eloszlása Skalár Első bájt Második bájt Harmadik bájt
Negyedik bájt xxxxxxx 0xxxxxxx 00000yyy yyxxxxxx 110yyyyy 10xxxxxx zzzzyyyy yyxxxxxx 1110zzzz 10yyyyyy 000uuuuu zzzzyyyy yyxxxxxx 11110uuu 10uuzzzz

13 Unicode érték – UTF-8 ábrázolás feladat
Adjuk meg az ó betű Unicode értékét és UTF-8 kódját! Unicode érték: (2 = F3(16 ASCII 110xxxxx 10xxxxxx 110xxx

14

15 Unicode kiegészítések
Unicode Blocks Unicode code converter


Letölteni ppt "Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/ Adatábrázolás Csernoch Mária http://www.inf.unideb.hu/~csernochmaria/bev_info/"

Hasonló előadás


Google Hirdetések