2fdigi3

Unicode

A PC-k nemzetközi elterjedésével felmerült az igény hogy más nemzetek karaktereit is lehessen használni, ezért bevezették a kódlapokat: ez olyan 256 karakterbõl álló táblázat, amely az alsó felén az ASCII kódokat, míg a felsõ 128 karakter adott földrajzi terület népeinek speciális karakterei közül került ki. Magyarország számára a szláv nyelvekkel együtt a 832-es kódlap volt használható. Ez sajnos csak enyhítette, de nem oldotta meg a problémát, hiszen a kódlapok használata azonnal problémához vezetett kevert nyelvû szövegek esetében. Ezért célszerûbbnek látszott egy olyan kódrendszert kidolgozni — és természetesen nem 8 bites alapon — amely kódlap váltása nélkül is képes eltérõ nyelvek speciális karaktereit helyesen ábrázolni.

1987-ben a XEROX cég egy új 16 bites kód fejlesztésébe kezdett. Az Unicode elnevezést az egyik fejlesztõ javasolta, mivel: unique (egyedi), universal (univerzális) és uniform (egységes) karakterkódolást biztosít.

A kifejlesztett kezdeti specifikációkat tartalmazó Unicode 1.0 kódrendszer a világ összes írott ABC-jének kódolását tartalmazza. A fejlesztés során követett alapelvek a következõk voltak:

Teljesség Az Unicode-t úgy tervezték, hogy a szövegek létrehozásához használt összes karaktert tartalmazza, ebbe még olyan "holt" nyelvek is beletartoznak mint pl. a szankszkrit.

Egyszerûség és hatékonyság Minden Unicode kód azonos, 16 bites hosszúságú és mindegyik egy tényleges létezõ karaktert reprezentál. Nincsenek sem vezérlõ kódok sem vezérlõ kódsorozatok. Ezek mind bonyolultabbá teszik a számítógépes szövegkezelést és feldolgozást.

Egyértelmûség Minden kód egyértelmûen egy karaktert jelent. Ezért egy karakter hibás olvasásakor csak egy a hibás és nincs elõre mutató következménye.

Pontosság Minden kódolt karakter szabványos, a nyelvi szakértõk által ismert és elfogadott.

Az Unicode tervezésénél is azért kompromisszumokat kellett kötni. Például a kompatibilitás érdekében az Unicode helyet foglal le néhány eredeti ASCII vezérlõkódnak, de ezt nem használja.

Az elsõ 8192 helyet a szabványos alfabetikus karakterek számára foglalták le, helyett hagyva a késõbb szabványba bekerülõ régi írások ABC-inek. A következõ 4096 kód tartalmazza az írásjeleket, matematikai, mûszaki és piktogram szimbólumokat. Az ezt követõ 4096 karaktert foglalták le a kínai, japán és koreai ABC-nek és írásjeleknek. A kód legnagyobb részét mintegy 27000 karaktert az egységesített Han karakterek részére foglalták le. Az egységesített Han karakterkészletet a GB 13000 Kínai Nemzeti Szabvány definiálja. Végül az utolsó elõtti 5632 hely a felhasználók által használható és definiálható, az utolsó 495 kód az Unicode alá konvertálást segítõ karakterek tartománya.

Milyen hatással lesz ez a szabvány a számítástechnikára? Remélhetõleg ilyen szabványokkal könnyebben lesznek gépek, és programjaik eladhatók. Ha a szabványt elfogadják, csak egy Unicode karakterkészlettel ellátott verziót kell gyártani.

A rendszerszoftverek íróinak a kétbájtos kódkészlet miatt újra kell írniuk a programjaikat, de ez részben automatizálható, és nem érinti a teljes programot.

A hardver oldaláról nyilvánvaló, hogy a hosszabb kód nagyobb RAM és merevlemez-tároló területet igényel. Egyes becslések szerint egy futó program a RAM 10-20%-át használja fel karaktertárolásra. Ez nem korlátozó tényezõ, ha figyelembe vesszük, hogy terjednek a 16 Mbájtos RAM-al és 1-2 Gbájtos merevlemez egységgel ellátott PC-k. Az igaz, hogy egy tiszta szövegfájl mérete megduplázódik, de például egy szöveget-grafikát tartalmazó Word fájlnál ez a növekedés csupán 20-25%.

Ábrajegyzék

Bevezetés

1.fejezet: A hálózatok célja, alkalmazása, alapfogalmak

2. fejezet: Általános elméleti alapok, Vonalak megosztása, Vezeték nélküli átviteli közeg, Analóg átvitel, Digitális átvitel(Digitális jelek kódolása, Karakterek ábrázolása - az ACSII kódrendszer), Párhuzamos és soros adatátvitel, Aszinkron soros adatátvitel, Terminálkezelés, X.21 interfész, ISDN-integrált szolgáltatású digitális hálózat, Beágyazott rendszerek kommunikációja, Soros kommunikáció, Ellenõrzõ kérdések és válaszok

3.fejezet: Közeg-hozzáférési módszerek

4.fejezet: Adatkapcsolati protokollok

5.fejezet: Hálózati réteg

6.fejezet: A felsõbb rétegek

7.fejezet: Lokális hálózatok

8.fejezet: A TCP/IP protokoll és az Internet

9. fejezet: Szótár

Irodalomjegyzék

Tárgymutató