Unicode

A PC-k nemzetközi elterjedésével felmerült az igény hogy más nemzetek karaktereit is lehessen használni, ezért bevezették a kódlapokat: ez olyan 256 karakterből álló táblázat, amely az alsó felén az ASCII kódokat, míg a felső 128 karakter adott földrajzi terület népeinek speciális karakterei közül került ki. Magyarország számára a szláv nyelvekkel együtt a 832-es kódlap volt használható. Ez sajnos csak enyhítette, de nem oldotta meg a problémát, hiszen a kódlapok használata azonnal problémához vezetett kevert nyelvű szövegek esetében. Ezért célszerűbbnek látszott egy olyan kódrendszert kidolgozni — és természetesen nem 8 bites alapon — amely kódlap váltása nélkül is képes eltérő nyelvek speciális karaktereit helyesen ábrázolni.

1987-ben a XEROX cég egy új 16 bites kód fejlesztésébe kezdett. Az Unicode elnevezést az egyik fejlesztő javasolta, mivel: unique (egyedi), universal (univerzális) és uniform (egységes) karakterkódolást biztosít.

A kifejlesztett kezdeti specifikációkat tartalmazó Unicode 1.0 kódrendszer a világ összes írott ABC-jének kódolását tartalmazza. A fejlesztés során követett alapelvek a következők voltak:

 

Az Unicode tervezésénél is azért kompromisszumokat kellett kötni. Például a kompatibilitás érdekében az Unicode helyet foglal le néhány eredeti ASCII vezérlőkódnak, de ezt nem használja.

Az első 8192 helyet a szabványos alfabetikus karakterek számára foglalták le, helyett hagyva a később szabványba bekerülő régi írások ABC-inek. A következő 4096 kód tartalmazza az írásjeleket, matematikai, műszaki és piktogram szimbólumokat. Az ezt követő 4096 karaktert foglalták le a kínai, japán és koreai ABC-nek és írásjeleknek. A kód legnagyobb részét mintegy 27000 karaktert az egységesített Han karakterek részére foglalták le. Az egységesített Han karakterkészletet a GB 13000 Kínai Nemzeti Szabvány definiálja. Végül az utolsó előtti 5632 hely a felhasználók által használható és definiálható, az utolsó 495 kód az Unicode alá konvertálást segítő karakterek tartománya.

Milyen hatással lesz ez a szabvány a számítástechnikára? Remélhetőleg ilyen szabványokkal könnyebben lesznek gépek, és programjaik eladhatók. Ha a szabványt elfogadják, csak egy Unicode karakterkészlettel ellátott verziót kell gyártani.

A rendszerszoftverek íróinak a kétbájtos kódkészlet miatt újra kell írniuk a programjaikat, de ez részben automatizálható, és nem érinti a teljes programot.

A hardver oldaláról nyilvánvaló, hogy a hosszabb kód nagyobb RAM és merevlemez-tároló területet igényel. Egyes becslések szerint egy futó program a RAM 10-20%-át használja fel karaktertárolásra. Ez nem korlátozó tényező, ha figyelembe vesszük, hogy terjednek a 16 Mbájtos RAM-al és 1-2 Gbájtos merevlemez egységgel ellátott PC-k. Az igaz, hogy egy tiszta szövegfájl mérete megduplázódik, de például egy szöveget-grafikát tartalmazó Word fájlnál ez a növekedés csupán 20-25%.


Ábrajegyzék

Bevezetés

1.fejezet: A hálózatok célja, alkalmazása, alapfogalmak

2. fejezet: Általános elméleti alapok, Vonalak megosztása, Vezeték nélküli átviteli közeg, Analóg átvitel, Digitális átvitel(Digitális jelek kódolása, Karakterek ábrázolása - az ACSII kódrendszer), Párhuzamos és soros adatátvitel, Aszinkron soros adatátvitel, Terminálkezelés, X.21 interfész, ISDN-integrált szolgáltatású digitális hálózat, Beágyazott rendszerek kommunikációja, Soros kommunikáció, Ellenőrző kérdések és válaszok

3.fejezet: Közeg-hozzáférési módszerek

4.fejezet: Adatkapcsolati protokollok

5.fejezet: Hálózati réteg

6.fejezet: A felsőbb rétegek

7.fejezet: Lokális hálózatok

8.fejezet: A TCP/IP protokoll és az Internet

9. fejezet: Szótár

Irodalomjegyzék

Tárgymutató