Prezentarea informațiilor de text în computer

anterior ◈ următoarea

Apăsând orice taste alfanumerice de pe tastatură determină că semnalul este trimis la calculator ca un număr binar care reprezintă una dintre valorile unei dicționarului.

tabelul de coduri - este o reprezentare internă de caractere din calculator.

Ca un standard, o lungă perioadă de timp tabel folosit \ (ASCII \) (\ (A \) Merican \ (S \) tandard \ (C \), odă pentru \ (I \) nformational \ (I \) nterchange - Codul standard american pentru schimbul de informații ).

Pentru a stoca binar un simbol alocat \ (1 \) Byte \ (= \) \ (8) \ biți. Având în vedere că fiecare bit este \ (1 \) sau \ (0 \), numărul de combinații posibile de unu și zero este de 2, 8 și + = 256.

Deci, cu ajutorul \ (1 \) octeți pot fi obținute \ (256 \) diferite combinații de cod binar și de a le afișa cu ajutorul \ (256 \) de caractere diferite.

Aceste coduri alcătuiesc masa \ (ASCII \).

Pentru concizie și ușurința acestor coduri de caractere în tabel, folosind un sistem de numerotare hexazecimal constând din \ (16 \) simbolurile - \ (10 \) cifre și \ (6 \) litere latine: \ (A \) \ (B \ ), \ (C \), \ (D \) \ (E \) \ (F \). Când codifică un prim caracter este scris figura coloană și apoi rândurile sunt situate la intersecția simbolului dat.

De exemplu, latină literă \ (S \) în tabelul \ (ASCII \) reprezentat în hexazecimal - \ (53 \). Prin apăsarea litera \ (S \) este înregistrat în memoria de cod de computer \ (01010011 \), reprezentând numărul binar echivalent hexazecimal \ (53 \). Acest cod poate fi obținut prin înlocuirea fiecărui cifre hexazecimale reprezentării sale binare. În acest caz, numărul \ (5 \) se înlocuiește cu codul \ (0101 \), iar numărul 3 - codul \ (0,011 \). În derivă literele (\ S \) de pe ecran, calculatorul realizează decodificarea: este construit pe baza imaginii binare a caracterului.

Fiecare simbol din tabelul \ (ASCII \) este codificat folosind \ (8 \) biți sau \ (2 \) cifre hexazecimale.

Standard \ (ASCII \) codifică primul \ (128 \), caracterele din \ (0 \) la \ (127 \): cifre, litere ale alfabetului latin, caracterele de control. Tabelul de mai sus prezintă simbolurile de codare în notație hexazecimală.

Primul \ (32 \) de caractere de control și sunt destinate în principal pentru transmiterea comenzilor de control. Funcția lor poate varia în funcție de software și hardware. A doua jumătate a tabelului de cod (de la \ (128 \) la \ (255 \)) standardul american nu este definit și proiectat pentru caractere de alfabete naționale, pseudographic și unele simboluri matematice. Diferite variante de realizare a doua jumătate a dicționarului poate fi utilizat în diferite țări.

Numerele sunt codificate de standard \ (ASCII \), în două cazuri: atunci când intrări-ieșiri, iar atunci când acestea apar în text. Dacă numerele implicate în calcule, atunci conversia acestora se realizează într-un cod binar, în conformitate cu normele (a se vedea. Aici).

Pentru comparație, ia în considerare numărul de \ (45 \) pentru cele două opțiuni de codificare.

Atunci când este utilizat în textul acestui număr ar necesita pentru prezentarea \ ei (2) bytes \, ca fiecare cifră este reprezentat de codul lor, în conformitate cu tabelul de \ (ASCII \). Sistemul de cod hexazecimal va arata ca \ (3435 \), în sistemul binar - \ (00110100 00110101 \).

Atunci când este utilizat în calcularea acestui număr de cod este primit la reguli speciale de traducere și reprezentat ca \ (8 \) - numărul de biți binar \ (00101101 \), la un cost de \ (1) \ bytes.

În prezent, cod pe scară largă \ (Unicode \). Această codificare este susținută de cele mai multe sisteme de operare, toate browserele moderne, și multe alte programe.

Standard \ (Unicode \) este rezultatul cooperării a Organizației Internaționale de Standardizare (\ (ISO \)) cu cei mai importanti producatori de computere și software. În lume există \ (6700 \) de limbi vorbite, dar numai \ (50 \) dintre ei sunt limbile oficiale ale statului. Sistemele utilizate în jurul valorii de \ (25 \) Scrierea, ceea ce face posibil pentru a crea un standard universal.

Pentru a codifica aceste scripturi suficient \ (16 \) - gama de biți (\ (2 \) octeți per caracter), adică un interval de la \ (0000 \) la \ (FFFF \). Standard \ (ASCII \) are în spațiu cod locul de onoare în intervalul \ (0000 \) la \ (00FF \).

Fiecare script selectat blocul de cod. Până în prezent, codificarea tuturor celor vii formale scrise este considerată completă: (29000 \) distribuite în jurul poziției \ a \ (65535 \) este posibil.

set de caractere Unicode

Recent, un consorțiu \ (Unicode \) a început să codifice alte sisteme de scriere ale planetei noastre, care reprezintă orice interes :. Scrierea limbile moarte, a renuntat la utilizarea moderne, caractere chinezești, alfabete create în mod artificial, etc ..

Pentru a reprezenta această diversitate de limbi \ (16 \) - bit criptare nu mai este suficient, iar astăzi \ (Unicode \) a început deja dezvoltarea de \ (21 \) - un pic de coduri de spațiu (\ (000000 \) - \ (10FFFF \)), este împărțit în \ (16 \) zonele, avioanele menționate.

anterior ◈ următoarea

Prezentarea informațiilor de text în computer

Meniu

Tag-uri articol