Codificarea informațiilor de text

  • Codificarea informațiilor de text.
  • Pentru a familiariza cu metodele de codificare de text în memoria calculatorului.

În textul câmp calculator este o secvență de caractere. În prezent, mașinile sunt un set de caractere care conțin până la 256 de caractere.







Mai mult decât atât, fiecare are propriul său cod de opt biți binar. Astfel, în memoria oricărui simbol de text este de 8 biți sau 1 octet.

În acest sens, este posibil să se măsoare cantitatea de memorie necesară pentru a stoca orice document text.

1 bit (cifră binară) are două valori, adăugarea fiecărui bit în codul dublează numărul de combinații obținute: 2 biți - patru opțiuni de 3 biți - opt, Bit 4 - șaisprezece, etc ...


De exemplu, o pagină dactilografiată A4 conține aproximativ 55 de rânduri. Pe fiecare dintre ele plasat undeva la 60 de caractere.

Cu aceste informații, putem contoriza numărul de informații text pe această pagină.
Fiecare caracter - 1 octeți de informație și toate caracterele - 3300 (60 înmulțit cu 55). Se pare că cantitatea de informații pe pagina în vecinătatea 3 KB.

Codificare Tabel

Codurile binare și caracterele lor corespunzătoare sunt legate tabelul de codificare. Toate utilizate pe masa PC-ul se bazează pe ASCII4 standardul american. Acesta definește primele 128 de coduri (litere, cifre, simboluri). Restul de 128 sunt utilizate pentru caractere speciale și litere ale alfabetului național (română, chineză, arabă). Și, din moment ce standarde comune pentru că nu a fost, a existat o mulțime de seturi de caractere, inclusiv chirilic.


De aceea, uneori puteți vedea textul cuiva ca un set de „zakoryuchek“.

Pentru a se asigura că astfel de texte pot fi citite sunt de program-convertoare. Acestea înlocuiesc codul binar al fiecărui caracter pe de altă codificare de cod. Și, de multe ori, utilizatorul trebuie să specifice care intră în câteva conversie de codificare.

Care este tabelul de cod

Cu toate acestea, există programe, capabile să detecteze automat codificarea textului sursă.
Astfel, un tabel în care toate caracterele mașinii alfabetului livrat numerele de serie respective se numește tabelă de codificare.







tabel de coduri ASCII

După cum sa menționat deja, standardul internațional pentru PC-ul a devenit ASCII (American Standard Code pentru schimbul de informații).

De asemenea, puteți întâlni și o altă masă - KOI-8 (cod pentru schimbul de informații), care este utilizat în rețele de calculatoare.

tabelul de coduri ASCII este împărțit în două părți.

În practica internațională, standardul este doar prima parte a tabelului. adică, simbolurile numerotate de la 0 (00000000) 127 (01111111). Este litere mari și mici ale alfabetului, numere, semne de punctuație, diferite tipuri de suporturi, comerciale și alte caractere.

caractere de numerotare de la 0 la 31 se numesc manageri. Ei controlează modul în care textul de pe ecran sau de imprimare, un semnal sonor la difuzoarele, textul de marcare.
Simbolul 32 - un decalaj sau poziție de gol în text.

Vă atrag atenția asupra faptului că, în tabelul de codificare litere (majuscule și litere mici), aranjate în ordine alfabetică, iar numerele sunt în ordine crescătoare a valorilor. O astfel de conformitate în ordine lexicografică dispunerii simbolurilor numit principiul alfabetului de codificare secvențială.

Care este tabelul de cod

A doua jumătate a tabelului numit pagina de cod ASCII. Acest cod de 128 rămase 10,000,000-11,111,111 și având opțiuni diferite, și fiecare (!) Opțiunea are numărul său propriu.
În primul rând, pagina de cod folosit pentru a găzdui alfabete naționale, distincte din latină. Codificarea românească caracterul național al alfabetului românesc sunt plasate în această parte a tabelului. Deci, pentru fiecare limbă în parte.

codificarea Unicode

Această codificare de 16 biți - este dat fiecărui caracter de 2 octeți de memorie.
Prin urmare, este creșterea cantității de memorie 2 ori. Dar o astfel de tabel de cod poate stoca până la 65.536 de caractere.

Versiunea completa Unicode include toate alfabetele existente și dispărute ale lumii, și o multitudine de simboluri matematice, muzicale, chimice.

Programul de lucru cu text

Procesorul de text nu este un substitut pentru o mașină de scris și un instrument versatil pentru lucrul cu texte.

text procesate apare ca în cazul în care, sub formă de foi de hârtie de format set, defilare pe ecran.


Beneficii stocare fișier text:

1) reducerea consumului de hârtie
2) Aranjamentul compact
3) posibilitatea de a instantaneu copiate în alte medii
4) posibilitatea de a transfera text de-a lungul liniilor de rețea sau Internet

bibliografie


Editat și trimis la profesorul de la Universitatea Națională Kiev. Tarasa Shevchenko Solovevym M. S.


Am lucrat la lecție

Ridicați problema educației moderne, pentru a exprima o idee sau pentru a rezolva problema în picioare, puteți la Forumul Educațional. în cazul în care educația internațională va bord cu gânduri și acțiuni proaspete. Prin crearea unui blog, va spori nu numai statutul său ca un instructor calificat, dar, de asemenea, aduce o contribuție semnificativă la dezvoltarea viitoare a școlii. Liderii Alianței Educație își deschide porțile pentru profesioniștii din cel mai înalt rang, și invită să coopereze pentru crearea celor mai bune școli din lume.