Caractere în sistem hexazecimal. Codificare ASCII (cod standard american pentru schimbul de informații) - codificare de bază a textului pentru alfabetul latin

Suprapunere de caractere

Caracterul BS (backspace) permite imprimantei să imprime un caracter peste altul. ASCII prevedea adăugarea de semne diacritice la litere în acest fel, de exemplu:

a BS "→ á
a BS ` → à
a BS ^ → â
o BS / → ø
c BS , → ç
n BS ~ → с

Notă: în fonturile mai vechi, apostroful „ a fost desenat înclinat spre stânga, iar tilda ~ a fost mutată în sus, astfel încât acestea se potrivesc doar cu rolul unui acut și al unui tilde deasupra.

Dacă același caracter este suprapus unui caracter, rezultatul este un efect de font aldine, iar dacă o subliniere este suprapusă unui caracter, rezultatul este text subliniat.

a BS a → a
aBS_→ A

Notă: aceasta este folosită, de exemplu, în sistemul de ajutor pentru om.

Variante naționale ASCII

Standardul ISO 646 (ECMA-6) prevede posibilitatea plasării caracterelor naționale în locul lui @ [ \ ] ^ ` ( | ) ~ . În plus, £ poate fi plasat în locul #, iar ¤ poate fi plasat în locul $. Acest sistem este potrivit pentru limbile europene unde sunt necesare doar câteva caractere suplimentare. Versiunea de ASCII fără caractere naționale se numește US-ASCII sau „International Reference Version”.

Ulterior, s-a dovedit a fi mai convenabil să folosești codificări pe 8 biți (pagini de cod), în care jumătatea inferioară a tabelului de coduri (0-127) este ocupată de caractere US-ASCII, iar jumătatea superioară (128-255) prin caractere suplimentare, inclusiv un set de caractere naționale. Astfel, jumătatea superioară a tabelului ASCII, înainte de adoptarea pe scară largă a Unicode, a fost folosită în mod activ pentru a reprezenta caractere localizate, litere ale limbii locale. Lipsa unui standard unificat pentru plasarea caracterelor chirilice în tabelul ASCII a cauzat multe probleme cu codificările (KOI-8, Windows-1251 și altele). Alte limbi cu scripturi non-latine au suferit, de asemenea, de a avea mai multe codificări diferite.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F0. 1. 2. 3. 4. 5. 6. 7. 8. 9. A. B. C. D. E. F.

NUL

SOM

EOA

EOM

EQT

W.R.U.

CLOPOT

BKSP

ASA DE

SI.

DC 0

DC 1

DC 2

DC 3

DC 4

ERR

SINCRONIZARE

L.E.M.

S 0

S 1

S 2

S 3

S 4

S 5

S 6

S 7

GOL

(

)

;

[

]

←

ESC

DEL

Pe acele computere în care unitatea minimă de memorie adresabilă a fost un cuvânt de 36 de biți, au fost utilizate inițial caractere de 6 biți (1 cuvânt = 6 caractere). După trecerea la ASCII, astfel de computere au început să conțină fie 5 caractere de șapte biți (1 bit a rămas în plus), fie 4 caractere de nouă biți într-un cuvânt.

Codurile ASCII sunt, de asemenea, folosite pentru a determina ce tastă este apăsată în timpul programării. Pentru o tastatură QWERTY standard, tabelul de coduri arată astfel:

[Codări de 8 biți: ASCII, KOI-8R și CP1251] Primele tabele de codificare create în SUA nu au folosit al optulea bit dintr-un octet. Textul a fost reprezentat ca o secvență de octeți, dar al optulea bit nu a fost luat în considerare (a fost folosit în scopuri oficiale).

Tabelul ASCII (American Standard Code for Information Interchange) a devenit un standard general acceptat. Primele 32 de caractere ale tabelului ASCII (de la 00 la 1F) au fost folosite pentru caracterele care nu se imprimă. Au fost concepute pentru a controla un dispozitiv de imprimare etc. Restul - de la 20 la 7F - sunt caractere obișnuite (printabile).

Tabelul 1 - Codificare ASCII

Dec Hex Oct Char Descriere

0	0	000		nul
1	1	001		începutul direcției
2	2	002		începutul textului
3	3	003		sfârşitul textului
4	4	004		sfârşitul transmisiei
5	5	005		Anchetă
6	6	006		recunoaște
7	7	007		clopot
8	8	010		backspace
9	9	011		filă orizontală
10	A	012		linie nouă
11	B	013		filă verticală
12	C	014		pagina noua
13	D	015		retur transport
14	E	016		schimbă afară
15	F	017		schimbă în
16	10	020		evadare legaturii de date
17	11	021		controlul dispozitivului 1
18	12	022		controlul dispozitivului 2
19	13	023		controlul dispozitivului 3
20	14	024		controlul dispozitivului 4
21	15	025		recunoaștere negativă
22	16	026		inactiv sincron
23	17	027		sfârşitul trans. bloc
24	18	030		Anulare
25	19	031		sfârşitul mediei
26	1A	032		substitui
27	1B	033		evadare
28	1C	034		separator de fișiere
29	1D	035		separator de grup
30	1E	036		separator de înregistrări
31	1F	037		separator de unitate
32	20	040		spaţiu
33	21	041	!
34	22	042	"
35	23	043	#
36	24	044	$
37	25	045	%
38	26	046	&
39	27	047	"
40	28	050	(
41	29	051	)
42	2A	052	*
43	2B	053	+
44	2C	054	,
45	2D	055	-
46	2E	056	.
47	2F	057	/
48	30	060	0
49	31	061	1
50	32	062	2
51	33	063	3
52	34	064	4
53	35	065	5
54	36	066	6
55	37	067	7
56	38	070	8
57	39	071	9
58	3A	072	:
59	3B	073	;
60	3C	074	<
61	3D	075	=
62	3E	076	>
63	3F	077	?

Dec Hex Oct Char

64	40	100	@
65	41	101	A
66	42	102	B
67	43	103	C
68	44	104	D
69	45	105	E
70	46	106	F
71	47	107	G
72	48	110	H
73	49	111	eu
74	4A	112	J
75	4B	113	K
76	4C	114	L
77	4D	115	M
78	4E	116	N
79	4F	117	O
80	50	120	P
81	51	121	Q
82	52	122	R
83	53	123	S
84	54	124	T
85	55	125	U
86	56	126	V
87	57	127	W
88	58	130	X
89	59	131	Y
90	5A	132	Z
91	5B	133	[
92	5C	134	\
93	5D	135	]
94	5E	136	^
95	5F	137	_
96	60	140	`
97	61	141	A
98	62	142	b
99	63	143	c
100	64	144	d
101	65	145	e
102	66	146	f
103	67	147	g
104	68	150	h
105	69	151	i
106	6A	152	j
107	6B	153	k
108	6C	154	l
109	6D	155	m
110	6E	156	n
111	6F	157	o
112	70	160	p
113	71	161	q
114	72	162	r
115	73	163	s
116	74	164	t
117	75	165	u
118	76	166	v
119	77	167	w
120	78	170	X
121	79	171	y
122	7A	172	z
123	7B	173	{
124	7C	174	\|
125	7D	175	}
126	7E	176	~
127	7F	177	DEL

După cum puteți vedea cu ușurință, această codificare conține doar litere latine și cele care sunt folosite în limba engleză. Există, de asemenea, aritmetice și alte simboluri de serviciu. Dar nu există nici litere rusești, nici măcar latine speciale pentru germană sau franceză. Acest lucru este ușor de explicat - codificarea a fost dezvoltată special ca standard american. Pe măsură ce computerele au început să fie folosite în întreaga lume, alte caractere au trebuit să fie codificate.

Pentru a face acest lucru, s-a decis să se folosească al optulea bit din fiecare octet. Acest lucru a făcut să fie disponibile încă 128 de valori (de la 80 la FF) care ar putea fi folosite pentru a codifica caractere. Primul dintre tabelele pe opt biți - „ASCII extins” (ASCII extins) - a inclus diverse variante de caractere latine utilizate în unele limbi ale Europei de Vest. Conținea și alte simboluri suplimentare, inclusiv pseudografice.

Caracterele pseudografice vă permit să oferiți o imagine de grafică afișând doar caractere text pe ecran. De exemplu, programul de gestionare a fișierelor FAR Manager funcționează folosind pseudografice.

Nu existau litere rusești în tabelul ASCII extins. Rusia (fosta URSS) și alte țări și-au creat propriile codificări care au făcut posibilă reprezentarea unor caractere „naționale” specifice în fișiere text pe 8 biți - litere latine ale limbilor poloneză și cehă, chirilice (inclusiv litere rusești) și alte alfabete.

În toate codificările care au devenit răspândite, primele 127 de caractere (adică valoarea octetului cu al optulea bit egal cu 0) sunt aceleași cu ASCII. Deci, un fișier ASCII funcționează în oricare dintre aceste codificări; Literele limbii engleze sunt reprezentate în același mod.

Organizația ISO (International Standardization Organization) a adoptat grupul de standarde ISO 8859. Acesta definește codificări pe 8 biți pentru diferite grupuri de limbi. Deci, ISO 8859-1 este un tabel ASCII extins pentru SUA și Europa de Vest. Și ISO 8859-5 este un tabel pentru alfabetul chirilic (inclusiv rus).

Cu toate acestea, din motive istorice, codarea ISO 8859-5 nu a prins rădăcini. În realitate, pentru limba rusă sunt folosite următoarele codificări:

Pagina de cod 866 (CP866), alias „DOS”, alias „codare GOST alternativă”. Folosit pe scară largă până la mijlocul anilor 90; folosit acum într-o măsură limitată. Practic nu este folosit pentru distribuirea de texte pe Internet.
- KOI-8. Dezvoltat în anii 70-80. Este un standard general acceptat pentru transmiterea mesajelor de e-mail pe internetul rusesc. De asemenea, este utilizat pe scară largă în sistemele de operare din familia Unix, inclusiv Linux. Versiunea în limba rusă a KOI-8 se numește KOI-8R; Există versiuni pentru alte limbi chirilice (de exemplu, KOI8-U este o versiune pentru limba ucraineană).
- Pagina de cod 1251, CP1251, Windows-1251. Dezvoltat de Microsoft pentru a sprijini limba rusă în Windows.

Principalul avantaj al CP866 a fost păstrarea caracterelor pseudo-grafice în aceleași locuri ca în ASCII extins; prin urmare, programele cu text străin, de exemplu, celebrul Norton Commander, ar putea funcționa fără modificări. CP866 este acum utilizat pentru programele Windows care rulează în ferestre text sau în modul text pe ecran complet, inclusiv FAR Manager.

Textele din CP866 au fost destul de rare în ultimii ani (dar este folosit pentru a codifica numele fișierelor rusești în Windows). Prin urmare, ne vom opri mai detaliat asupra altor două codificări - KOI-8R și CP1251.

După cum puteți vedea, în tabelul de codificare CP1251, literele rusești sunt aranjate în ordine alfabetică (cu excepția, însă, a literei E). Acest aranjament facilitează sortarea alfabetică a programelor de calculator.

Dar în KOI-8R ordinea literelor rusești pare aleatorie. Dar de fapt nu este.

În multe programe mai vechi, al 8-lea bit a fost pierdut la procesarea sau transmiterea textului. (Acum, astfel de programe sunt practic „disparute”, dar la sfârșitul anilor 80 - începutul anilor 90 erau răspândite). Pentru a obține o valoare de 7 biți dintr-o valoare de 8 biți, doar scădeți 8 din cifra cea mai semnificativă; de exemplu, E1 devine 61.

Acum comparați KOI-8R cu tabelul ASCII (Tabelul 1). Veți descoperi că literele rusești sunt plasate în corespondență clară cu cele latine. Dacă al optulea bit dispare, literele rusești mici se transformă în litere latine mari, iar literele rusești mari se transformă în litere latine mici. Deci, E1 în KOI-8 este „A” rusesc, în timp ce 61 în ASCII este „a” latin.

Deci, KOI-8 vă permite să mențineți lizibilitatea textului rusesc atunci când al 8-lea bit este pierdut. „Salut tuturor” devine „pRIWET WSEM”.

Recent, atât ordinea alfabetică a caracterelor din tabelul de codificare, cât și lizibilitatea cu pierderea celui de-al 8-lea bit și-au pierdut importanța decisivă. Al optulea bit în computerele moderne nu se pierde în timpul transmisiei sau procesării. Iar sortarea alfabetică se face ținând cont de codificare, și nu prin simpla comparare a codurilor. (Apropo, codurile CP1251 nu sunt complet aranjate alfabetic - litera E nu este la locul ei).

Datorită faptului că există două codificări comune, atunci când lucrați cu Internetul (e-mail, navigarea pe site-uri web), uneori puteți vedea un set de litere fără sens în loc de text rusesc. De exemplu, „EU SUNT SBYUFEMHEL”. Acestea sunt doar cuvintele „cu respect”; dar au fost codificate în codificare CP1251, iar computerul a decodat textul folosind tabelul KOI-8. Dacă aceleași cuvinte, dimpotrivă, ar fi codificate în KOI-8, iar computerul ar decoda textul conform tabelului CP1251, rezultatul ar fi „U HCHBTSEOYEN”.

Uneori se întâmplă ca un computer să descifreze literele în limba rusă folosind un tabel care nu este destinat limbii ruse. Apoi, în locul literelor rusești, apare un set de simboluri fără sens (de exemplu, litere latine ale limbilor est-europene); ele sunt adesea numite „crocozybras”.

În cele mai multe cazuri, programele moderne se ocupă de determinarea în mod independent a codificărilor documentelor de pe Internet (e-mailuri și pagini web). Dar uneori „raușesc”, apoi puteți vedea secvențe ciudate de litere rusești sau „krokozyabry”. De regulă, într-o astfel de situație, pentru a afișa text real pe ecran, este suficient să selectați codarea manual în meniul programului.

Pentru acest articol au fost folosite informații de pe pagina http://open-office.edusite.ru/TextProcessor/p5aa1.html.

Material preluat de pe site:

Dec	Hex	Simbol	Dec	Hex	Simbol
000	00	specialist. NOP	128	80	Ђ
001	01	specialist. DECI H	129	81	Ѓ
002	02	specialist. STX	130	82	‚
003	03	specialist. ETX	131	83	ѓ
004	04	specialist. EOT	132	84	„
005	05	specialist. ENQ	133	85	…
006	06	specialist. ACK	134	86	†
007	07	specialist. BEL	135	87	‡
008	08	specialist. B.S.	136	88	€
009	09	specialist. TAB	137	89	‰
010	0A	specialist. LF	138	8A	Љ
011	0B	specialist. VT	139	8B	‹ ‹
012	0C	specialist. FF	140	8C	Њ
013	0D	specialist. CR	141	8 D	Ќ
014	0E	specialist. ASA DE	142	8E	Ћ
015	0F	specialist. SI.	143	8F	Џ
016	10	specialist. DLE	144	90	ђ
017	11	specialist. DC1	145	91	‘
018	12	specialist. DC2	146	92	’
019	13	specialist. DC3	147	93	“
020	14	specialist. DC4	148	94	”
021	15	specialist. N.A.K.	149	95
022	16	specialist. SYN	150	96	–
023	17	specialist. ETB	151	97	—
024	18	specialist. POATE SA	152	98
025	19	specialist. E.M.	153	99	™
026	1A	specialist. SUB	154	9A	љ
027	1B	specialist. ESC	155	9B	›
028	1C	specialist. FS	156	9C	њ
029	1D	specialist. G.S.	157	9D	ќ
030	1E	specialist. R.S.	158	9E	ћ
031	1F	specialist. NE	159	9F	џ
032	20	ambreiaj SP (Spațiu)	160	A0
033	21	!	161	A1	Ў
034	22	"	162	A2	ў
035	23	#	163	A3	Ћ
036	24	$	164	A4	¤
037	25	%	165	A5	Ґ
038	26	&	166	A6	¦
039	27	"	167	A7	§
040	28	(	168	A8	Eu
041	29	)	169	A9	©
042	2A	*	170	A.A.	Є
043	2B	+	171	AB	«
044	2C	,	172	A.C.	¬
045	2D	-	173	ANUNȚ
046	2E	.	174	A.E.	®
047	2F	/	175	A.F.	Ї
048	30	0	176	B0	°
049	31	1	177	B1	±
050	32	2	178	B2	І
051	33	3	179	B3	і
052	34	4	180	B4	ґ
053	35	5	181	B5	µ
054	36	6	182	B6	¶
055	37	7	183	B7	·
056	38	8	184	B8	e
057	39	9	185	B9	№
058	3A	:	186	B.A.	є
059	3B	;	187	BB	»
060	3C	<	188	B.C.	ј
061	3D	=	189	BD	Ѕ
062	3E	>	190	FI	ѕ
063	3F	?	191	B.F.	ї
064	40	@	192	C0	A
065	41	A	193	C1	B
066	42	B	194	C2	ÎN
067	43	C	195	C3	G
068	44	D	196	C4	D
069	45	E	197	C5	E
070	46	F	198	C6	ȘI
071	47	G	199	C7	Z
072	48	H	200	C8	ȘI
073	49	eu	201	C9	Y
074	4A	J	202	C.A.	LA
075	4B	K	203	C.B.	L
076	4C	L	204	CC	M
077	4D	M	205	CD	N
078	4E	N	206	C.E.	DESPRE
079	4F	O	207	CF	P
080	50	P	208	D0	R
081	51	Q	209	D1	CU
082	52	R	210	D2	T
083	53	S	211	D3	U
084	54	T	212	D4	F
085	55	U	213	D5	X
086	56	V	214	D6	C
087	57	W	215	D7	H
088	58	X	216	D8	SH
089	59	Y	217	D9	SCH
090	5A	Z	218	D.A.	Kommersant
091	5B	[	219	D.B.	Y
092	5C	\	220	DC	b
093	5D	]	221	DD	E
094	5E	^	222	DE	YU
095	5F	_	223	DF	eu
096	60	`	224	E0	A
097	61	A	225	E1	b
098	62	b	226	E2	V
099	63	c	227	E3	G
100	64	d	228	E4	d
101	65	e	229	E5	e
102	66	f	230	E6	și
103	67	g	231	E7	h
104	68	h	232	E8	Și
105	69	i	233	E9	th
106	6A	j	234	E.A.	La
107	6B	k	235	E.B.	l
108	6C	l	236	E.C.	m
109	6D	m	237	ED	n
110	6E	n	238	E.E.	O
111	6F	o	239	E.F.	P
112	70	p	240	F0	R
113	71	q	241	F1	Cu
114	72	r	242	F2	T
115	73	s	243	F3	la
116	74	t	244	F4	f
117	75	u	245	F5	X
118	76	v	246	F6	ts
119	77	w	247	F7	h
120	78	X	248	F8	w
121	79	y	249	F9	sch
122	7A	z	250	FA.	ъ
123	7B	{	251	FB	s
124	7C	\|	252	F.C.	b
125	7D	}	253	FD	uh
126	7E	~	254	F.E.	Yu
127	7F	Specialist. DEL	255	FF	eu

Tabel de coduri de caractere ASCII Windows.
Descrierea caracterelor speciale (de control) Trebuie menționat că inițial caracterele de control ale tabelului ASCII au fost folosite pentru a asigura schimbul de date prin teletip, introducerea datelor de pe bandă perforată și pentru controlul simplu al dispozitivelor externe.
În prezent, majoritatea caracterelor de control ale tabelelor ASCII nu mai poartă această încărcare și pot fi folosite în alte scopuri. Cod Descriere

NUL, 00	Nul, gol
SOH, 01	Începutul titlului
STX, 02	Începutul textului, începutul textului.
ETX, 03	Sfârșitul textului, sfârșitul textului
EOT, 04	Sfârșitul transmisiei, sfârșitul transmisiei
ENQ, 05	Întreba. Vă rugăm să confirmați
ACK, 06	Confirmare. confirm
BEL, 07	Bell, sună
BS, 08	Backspace, întoarceți un caracter înapoi
TAB, 09	Filă, filă orizontală
LF, 0A	Line Feed, line feed. În zilele noastre, în majoritatea limbajelor de programare este notat ca \n
VT, 0B	Filă verticală, tabulare verticală.
FF, 0C	Feed de formulare, feed de pagini, pagină nouă
CR, 0D	Întoarcere cu cărucior, întoarcere cu cărucior. În prezent, în majoritatea limbajelor de programare este notat cu \r
deci,0E	Shift Out, schimbați culoarea benzii de cerneală din dispozitivul de imprimare
SI, 0F	Schimbați, întoarceți înapoi culoarea benzii de cerneală din dispozitivul de imprimare
DLE, 10	Data Link Escape, comutarea canalului la transmisia de date
DC1, 11 DC2, 12 DC3, 13 DC4, 14	Controlul dispozitivului, simboluri de control al dispozitivului
NAK, 15	Confirmare negativă, nu confirm.
SYN, 16	Sincronizare. Simbol de sincronizare
ETB, 17	Sfârșitul blocului de text, sfârșitul blocului de text
CAN, 18	Anulare, anulare a unei transmise anterior
EM, 19	Sfârșitul Mediului
SUB, 1A	Înlocuitor, înlocuitor. Plasat în locul unui simbol al cărui sens a fost pierdut sau corupt în timpul transmiterii
ESC, 1B	Secvență de control de evacuare
FS, 1C	Separator de fișiere, separator de fișiere
GS, 1D	Separator de grup
RS, 1E	Separator de înregistrări, separator de înregistrări
SUA, 1F	Separator de unități
DEL, 7F	Ștergeți, ștergeți ultimul caracter.

Excel pentru Office 365 Word pentru Office 365 Outlook pentru Office 365 PowerPoint pentru Office 365 Publisher pentru Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Word Outlook 2019 Excel 20616 One Outlook 201616 3 Editor 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Word 2010 Outlook 2010 2010 PowerPoint 2010 2010 007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Mai puțin

În acest articol: inserați un caracter ASCII sau Unicode într-un document

Dacă trebuie să introduceți doar câteva caractere speciale sau simboluri, puteți utiliza comenzile rapide de la tastatură. Pentru o listă de caractere ASCII, consultați următoarele tabele sau articolul Inserarea alfabetelor naționale folosind comenzile rapide de la tastatură.

Note:

Inserarea caracterelor ASCII

Pentru a introduce un caracter ASCII, apăsați și mențineți apăsată tasta ALT în timp ce introduceți codul caracterului. De exemplu, pentru a introduce un simbol grad (º), apăsați și mențineți apăsată tasta ALT, apoi introduceți 0176 pe tastatura numerică.

Pentru a introduce numere, utilizați tastatura numerică în loc de numerele de pe tastatura principală. Dacă trebuie să introduceți numere pe tastatura numerică, asigurați-vă că indicatorul BLOCARE NUMĂR este aprins.

Inserarea caracterelor Unicode

Pentru a introduce un caracter Unicode, introduceți codul caracterului, apoi apăsați ALT și X. De exemplu, pentru a introduce un simbol dolar ($), introduceți 0024 și apăsați ALT și X. Pentru toate codurile de caractere Unicode, consultați .

Important: Unele programe Microsoft Office, cum ar fi PowerPoint și InfoPath, nu acceptă conversia codurilor Unicode în caractere. Dacă trebuie să inserați un caracter Unicode într-unul dintre aceste programe, utilizați .

Note:

Dacă apare un caracter Unicode greșit după ce apăsați ALT+X, selectați codul corect, apoi apăsați din nou ALT+X.

În plus, trebuie să introduceți „U+” înainte de cod. De exemplu, dacă introduceți „1U+B5” și apăsați ALT+X, va fi afișat textul „1µ”, iar dacă introduceți „1B5” și apăsați ALT+X, va fi afișat simbolul „Ƶ”.

Folosind tabelul de simboluri

Un tabel de caractere este un program încorporat în Microsoft Windows care vă permite să vizualizați caracterele disponibile pentru un font selectat.

Folosind un tabel de simboluri, puteți copia simboluri individuale sau un grup de simboluri în clipboard și le puteți lipi în orice program care acceptă afișarea acestor simboluri. Deschiderea tabelului de simboluri

În Windows 10, introduceți cuvântul „simbol” în caseta de căutare din bara de activități și selectați tabelul cu simboluri din rezultatele căutării.

În Windows 8, tastați „simbol” pe ecranul Start și selectați tabelul cu simboluri din rezultatele căutării.

În Windows 7, faceți clic pe butonul Start, selectați Toate programele, Accesorii, Instrumente de sistem, apoi faceți clic pe Harta caracterelor.

Caracterele sunt grupate după font. Faceți clic pe lista de fonturi pentru a selecta setul de caractere corespunzător. Pentru a selecta un simbol, faceți clic pe acesta, apoi faceți clic pe butonul Selectați. Pentru a insera un simbol, faceți clic dreapta pe locația dorită din document și selectați Lipire.

Codurile de caractere utilizate frecvent

Pentru o listă completă de caractere, consultați Computer, Tabel de coduri de caractere ASCII sau Tabele de caractere Unicode organizate după set.

Glifă

Valută

Simboluri legale

Simboluri matematice

Fracții

Simboluri de punctuație și dialect

Simboluri de formă

Codurile diacritice utilizate în mod obișnuit

Pentru o listă completă de glife și coduri corespunzătoare, consultați.

Glifă

Caractere de control ASCII care nu se imprimă

Caracterele folosite pentru a controla unele dispozitive periferice, cum ar fi imprimantele, sunt numerotate de la 0 la 31 în tabelul ASCII. De exemplu, caracterul de alimentare în pagină/nouă pagină este numărul 12. Acest caracter îi spune imprimantei să treacă la începutul paginii următoare.

Tabel cu caractere de control ASCII care nu se imprimă

Numar decimal	Semn	Numar decimal	Semn
		Eliberarea canalului de date
Începutul titlului		Primul cod de control al dispozitivului
Începutul textului		Al doilea cod de control al dispozitivului
Sfârșitul textului		Al treilea cod de control al dispozitivului
Sfârșitul transmisiei		Al patrulea cod de control al dispozitivului
	în cinci colţuri	Confirmare negativă
Confirmare		Mod transmisie sincronă
Semnal sonor		Sfârșitul blocului de date transmis

Tabulare orizontală		Sfârșitul media
Avans de linie/linie nouă		Simbol de înlocuire
Filă verticală			depaseste
Traducerea paginii/pagină nouă	Doisprezece	Separator de fișiere
Retur transport		Separator de grup
Schimbați fără a stoca biți		Separator de înregistrări
Deplasare care păstrează biți	cincisprezece	Separator de date

Potrivit Uniunii Internaționale de Telecomunicații, în 2016, trei miliarde și jumătate de oameni au folosit internetul cu o oarecare regularitate. Cei mai mulți dintre ei nici nu se gândesc la faptul că orice mesaje pe care le trimit prin intermediul computerului sau gadgeturilor mobile, precum și textele care sunt afișate pe tot felul de monitoare, sunt de fapt combinații de 0 și 1. Această reprezentare a informațiilor se numește codificare . Acesta asigură și facilitează foarte mult stocarea, prelucrarea și transmiterea acestuia. În 1963, a fost dezvoltată codarea ASCII americană, care face obiectul acestui articol.

Prezentarea informațiilor pe un computer

Din punctul de vedere al oricărui computer electronic, textul este un set de caractere individuale. Acestea includ nu numai litere, inclusiv majuscule, ci și semne de punctuație și numere. În plus, sunt folosite caractere speciale „=”, „&”, „(” și spații.

Setul de caractere care alcătuiesc textul se numește alfabet, iar numărul lor se numește cardinalitate (notat cu N). Pentru a-l determina, se folosește expresia N = 2^b, unde b este numărul de biți sau greutatea informației unui anumit simbol.

S-a dovedit că un alfabet cu o capacitate de 256 de caractere poate reprezenta toate caracterele necesare.

Deoarece 256 reprezintă a 8-a putere a doi, greutatea fiecărui caracter este de 8 biți.

O unitate de măsură de 8 biți se numește 1 octet, deci se obișnuiește să spunem că orice caracter din text stocat pe un computer ocupă un octet de memorie.

Cum se face codarea?

Orice texte sunt introduse în memoria unui computer personal folosind tastele de la tastatură pe care sunt scrise numere, litere, semne de punctuație și alte simboluri. Ele sunt transferate în RAM în cod binar, adică fiecare caracter este asociat cu un cod zecimal cunoscut oamenilor, de la 0 la 255, care corespunde unui cod binar - de la 00000000 la 11111111.

Codificarea caracterelor octet-octet permite procesorului care efectuează procesarea textului să acceseze fiecare caracter individual. În același timp, 256 de caractere sunt destul de suficiente pentru a reprezenta orice informație simbolică.

Codificarea caracterelor ASCII

Această abreviere în engleză înseamnă cod pentru schimbul de informații.

Chiar și în zorii computerizării, a devenit evident că era posibil să se vină cu o mare varietate de modalități de codificare a informațiilor. Cu toate acestea, pentru a transfera informații de la un computer la altul, a fost necesar să se dezvolte un standard unificat. Deci, în 1963, în SUA a apărut tabelul de codificare ASCII. În el, orice simbol al alfabetului computerului este asociat cu numărul său de serie în reprezentare binară. ASCII a fost folosit inițial doar în Statele Unite și mai târziu a devenit un standard internațional pentru computere.

Codurile ASCII sunt împărțite în 2 părți. Doar prima jumătate a acestui tabel este considerată standard internațional. Include caractere cu numere de serie de la 0 (codat ca 00000000) la 127 (codat 01111111).

Număr de serie	Codificarea textului ASCII	Simbol
	0000 0000 - 0001 1111	Caracterele cu N de la 0 la 31 se numesc caractere de control. Funcția lor este de a „gestiona” procesul de afișare a textului pe un monitor sau dispozitiv de imprimare, oferirea unui semnal sonor etc.
	0010 0000 - 0111 1111	Caractere de la N de la 32 la 127 (partea standard a tabelului) - litere mari și mici ale alfabetului latin, cifrele a zecea, semne de punctuație, precum și diverse paranteze, simboluri comerciale și alte simboluri. Caracterul 32 reprezintă un spațiu.
	1000 0000 - 1111 1111	Caracterele cu N de la 128 la 255 (parte alternativă a tabelului sau a paginii de cod) pot avea diferite variante, fiecare având propriul număr. Pagina de coduri este utilizată pentru a specifica alfabetele naționale care sunt diferite de latină. În special, cu ajutorul acestuia se realizează codificarea ASCII pentru caracterele rusești.

În tabel, codificările sunt scrise cu majuscule și se succed în ordine alfabetică, iar numerele sunt în ordine crescătoare. Acest principiu rămâne același pentru alfabetul rus.

Personaje de control

Tabelul de codificare ASCII a fost creat inițial pentru a primi și transmite informații prin intermediul unui dispozitiv care nu a fost folosit de mult timp, cum ar fi un teletype. În acest sens, în setul de caractere au fost incluse caractere neprintabile, folosite ca comenzi pentru controlul acestui dispozitiv. Comenzi similare au fost folosite în astfel de metode de mesagerie pre-computer precum codul Morse etc.

Cel mai comun caracter de teletip este NUL (00). Este folosit și astăzi în majoritatea limbajelor de programare pentru a indica sfârșitul unei linii.

Unde este folosită codarea ASCII?

Codul standard american este necesar nu numai pentru introducerea informațiilor text pe tastatură. Este folosit și în grafică. În special, în ASCII Art Maker, imaginile diferitelor extensii reprezintă un spectru de caractere ASCII.

Există două tipuri de astfel de produse: cele care îndeplinesc funcția de editor grafic prin conversia imaginilor în text și cele care convertesc „desenele” în grafică ASCII. De exemplu, celebra emoticon este un exemplu excelent de simbol de codificare.

ASCII poate fi folosit și la crearea unui document HTML. În acest caz, puteți introduce un anumit set de caractere, iar la vizualizarea paginii va apărea pe ecran un simbol care corespunde acestui cod.

ASCII este, de asemenea, necesar pentru crearea de site-uri web multilingve, deoarece caracterele care nu sunt incluse într-un tabel național specific sunt înlocuite cu coduri ASCII.

Unele caracteristici

ASCII a fost folosit inițial pentru a codifica informațiile text folosind 7 biți (unul a fost lăsat necompletat), dar astăzi funcționează ca 8 biți.

Literele situate în coloanele situate deasupra și dedesubt diferă între ele doar într-un singur bit. Acest lucru reduce semnificativ complexitatea auditului.

Utilizarea ASCII în Microsoft Office

Dacă este necesar, acest tip de codificare a informațiilor text poate fi utilizat în editorii de text Microsoft, cum ar fi Notepad și Office Word. Cu toate acestea, este posibil să nu puteți utiliza unele funcții când introduceți text în acest caz. De exemplu, nu veți putea folosi text îngroșat deoarece codarea ASCII păstrează doar sensul informațiilor, ignorând aspectul și forma generală a acesteia.

Standardizare

Organizația ISO a adoptat standardele ISO 8859. Acest grup definește codificări pe opt biți pentru diferite grupuri de limbi. Mai exact, ISO 8859-1 este un tabel ASCII extins pentru Statele Unite și țările din Europa de Vest. Și ISO 8859-5 este un tabel folosit pentru alfabetul chirilic, inclusiv limba rusă.

Din mai multe motive istorice, standardul ISO 8859-5 a fost folosit pentru o perioadă foarte scurtă de timp.

Pentru limba rusă, în acest moment sunt utilizate următoarele codificări:

CP866 (Pagina de cod 866) sau DOS, care este adesea numită codificare GOST alternativă. A fost folosit în mod activ până la mijlocul anilor 90 ai secolului trecut. Momentan practic nu este folosit.
KOI-8. Codificarea a fost dezvoltată în anii 1970 și 80 și este în prezent standardul general acceptat pentru mesajele de e-mail pe RuNet. Este utilizat pe scară largă în sistemele de operare Unix, inclusiv Linux. Versiunea „rusă” a KOI-8 se numește KOI-8R. În plus, există versiuni pentru alte limbi chirilice, cum ar fi ucraineană.
Pagina de cod 1251 (CP 1251, Windows - 1251). Dezvoltat de Microsoft pentru a oferi suport pentru limba rusă în mediul Windows.

Principalul avantaj al primului standard CP866 a fost păstrarea caracterelor pseudografice în aceleași poziții ca în ASCII extins. Acest lucru a făcut posibilă rularea programelor text fabricate în străinătate, cum ar fi celebrul Norton Commander, fără modificări. În prezent, CP866 este utilizat pentru programele dezvoltate pentru Windows care rulează în modul text pe ecran complet sau în ferestre text, inclusiv FAR Manager.

Textele de computer scrise în codificare CP866 sunt destul de rare în zilele noastre, dar este cea care este folosită pentru numele fișierelor rusești în Windows.

„Unicode”

În acest moment, această codificare este cea mai utilizată. Codurile Unicode sunt împărțite în zone. Primul (U+0000 la U+007F) include caractere ASCII cu coduri. Urmează zonele de caractere ale diferitelor scripturi naționale, precum și semnele de punctuație și simbolurile tehnice. În plus, unele coduri Unicode sunt rezervate în cazul în care este necesar să se includă noi caractere în viitor.

Acum știți că în ASCII, fiecare caracter este reprezentat ca o combinație de 8 zerouri și unu. Pentru nespecialiști, aceste informații pot părea inutile și neinteresante, dar nu vrei să știi ce se întâmplă „în creierul” computerului tău?!