Prezentarea informațiilor de text în computer
Apăsând orice taste alfanumerice de pe tastatură determină că semnalul este trimis la calculator ca un număr binar care reprezintă una dintre valorile unei dicționarului.
tabelul de coduri - este o reprezentare internă de caractere din calculator.
Ca un standard, o lungă perioadă de timp tabel folosit \ (ASCII \) (\ (A \) Merican \ (S \) tandard \ (C \), odă pentru \ (I \) nformational \ (I \) nterchange - Codul standard american pentru schimbul de informații ).
Pentru a stoca binar un simbol alocat \ (1 \) Byte \ (= \) \ (8) \ biți. Având în vedere că fiecare bit este \ (1 \) sau \ (0 \), numărul de combinații posibile de unu și zero este de 2, 8 și + = 256.
Deci, cu ajutorul \ (1 \) octeți pot fi obținute \ (256 \) diferite combinații de cod binar și de a le afișa cu ajutorul \ (256 \) de caractere diferite.
Aceste coduri alcătuiesc masa \ (ASCII \).
Pentru concizie și ușurința acestor coduri de caractere în tabel, folosind un sistem de numerotare hexazecimal constând din \ (16 \) simbolurile - \ (10 \) cifre și \ (6 \) litere latine: \ (A \) \ (B \ ), \ (C \), \ (D \) \ (E \) \ (F \). Când codifică un prim caracter este scris figura coloană și apoi rândurile sunt situate la intersecția simbolului dat.
De exemplu, latină literă \ (S \) în tabelul \ (ASCII \) reprezentat în hexazecimal - \ (53 \). Prin apăsarea litera \ (S \) este înregistrat în memoria de cod de computer \ (01010011 \), reprezentând numărul binar echivalent hexazecimal \ (53 \). Acest cod poate fi obținut prin înlocuirea fiecărui cifre hexazecimale reprezentării sale binare. În acest caz, numărul \ (5 \) se înlocuiește cu codul \ (0101 \), iar numărul 3 - codul \ (0,011 \). În derivă literele (\ S \) de pe ecran, calculatorul realizează decodificarea: este construit pe baza imaginii binare a caracterului.
Fiecare simbol din tabelul \ (ASCII \) este codificat folosind \ (8 \) biți sau \ (2 \) cifre hexazecimale.
Standard \ (ASCII \) codifică primul \ (128 \), caracterele din \ (0 \) la \ (127 \): cifre, litere ale alfabetului latin, caracterele de control. Tabelul de mai sus prezintă simbolurile de codare în notație hexazecimală.
Primul \ (32 \) de caractere de control și sunt destinate în principal pentru transmiterea comenzilor de control. Funcția lor poate varia în funcție de software și hardware. A doua jumătate a tabelului de cod (de la \ (128 \) la \ (255 \)) standardul american nu este definit și proiectat pentru caractere de alfabete naționale, pseudographic și unele simboluri matematice. Diferite variante de realizare a doua jumătate a dicționarului poate fi utilizat în diferite țări.
Numerele sunt codificate de standard \ (ASCII \), în două cazuri: atunci când intrări-ieșiri, iar atunci când acestea apar în text. Dacă numerele implicate în calcule, atunci conversia acestora se realizează într-un cod binar, în conformitate cu normele (a se vedea. Aici).
Pentru comparație, ia în considerare numărul de \ (45 \) pentru cele două opțiuni de codificare.
Atunci când este utilizat în textul acestui număr ar necesita pentru prezentarea \ ei (2) bytes \, ca fiecare cifră este reprezentat de codul lor, în conformitate cu tabelul de \ (ASCII \). Sistemul de cod hexazecimal va arata ca \ (3435 \), în sistemul binar - \ (00110100 00110101 \).
Atunci când este utilizat în calcularea acestui număr de cod este primit la reguli speciale de traducere și reprezentat ca \ (8 \) - numărul de biți binar \ (00101101 \), la un cost de \ (1) \ bytes.
În prezent, cod pe scară largă \ (Unicode \). Această codificare este susținută de cele mai multe sisteme de operare, toate browserele moderne, și multe alte programe.
Standard \ (Unicode \) este rezultatul cooperării a Organizației Internaționale de Standardizare (\ (ISO \)) cu cei mai importanti producatori de computere și software. În lume există \ (6700 \) de limbi vorbite, dar numai \ (50 \) dintre ei sunt limbile oficiale ale statului. Sistemele utilizate în jurul valorii de \ (25 \) Scrierea, ceea ce face posibil pentru a crea un standard universal.
Pentru a codifica aceste scripturi suficient \ (16 \) - gama de biți (\ (2 \) octeți per caracter), adică un interval de la \ (0000 \) la \ (FFFF \). Standard \ (ASCII \) are în spațiu cod locul de onoare în intervalul \ (0000 \) la \ (00FF \).
Fiecare script selectat blocul de cod. Până în prezent, codificarea tuturor celor vii formale scrise este considerată completă: (29000 \) distribuite în jurul poziției \ a \ (65535 \) este posibil.
set de caractere Unicode
Recent, un consorțiu \ (Unicode \) a început să codifice alte sisteme de scriere ale planetei noastre, care reprezintă orice interes :. Scrierea limbile moarte, a renuntat la utilizarea moderne, caractere chinezești, alfabete create în mod artificial, etc ..
Pentru a reprezenta această diversitate de limbi \ (16 \) - bit criptare nu mai este suficient, iar astăzi \ (Unicode \) a început deja dezvoltarea de \ (21 \) - un pic de coduri de spațiu (\ (000000 \) - \ (10FFFF \)), este împărțit în \ (16 \) zonele, avioanele menționate.