Mô tả Ascii. Mã hóa ASCII (mã tiêu chuẩn Mỹ để trao đổi thông tin) - mã hóa văn bản cơ bản cho bảng chữ cái Latinh

Một máy tính hiểu được quá trình chuyển đổi nó thành dạng cho phép truyền, lưu trữ hoặc xử lý tự động dữ liệu này thuận tiện hơn. Nhiều bảng khác nhau được sử dụng cho mục đích này. ASCII là hệ thống đầu tiên được phát triển ở Hoa Kỳ để làm việc với văn bản tiếng Anh, sau đó nó đã trở nên phổ biến trên toàn thế giới. Bài viết dưới đây được dành cho mô tả, tính năng, tính chất và cách sử dụng tiếp theo của nó.

Hiển thị và lưu trữ thông tin trong máy tính

Các biểu tượng trên màn hình máy tính hoặc một hoặc một thiết bị kỹ thuật số di động khác được hình thành dựa trên tập hợp các dạng vectơ gồm nhiều ký tự khác nhau và một mã cho phép bạn tìm thấy trong số chúng biểu tượng cần được chèn vào đúng vị trí. Nó đại diện cho một chuỗi các bit. Do đó, mỗi ký tự phải tương ứng duy nhất với một tập hợp số 0 và số 1, xuất hiện theo một thứ tự duy nhất nhất định.

Mọi việc đã bắt đầu thế nào

Trong lịch sử, những chiếc máy tính đầu tiên có ngôn ngữ tiếng Anh. Để mã hóa thông tin tượng trưng trong chúng, chỉ cần sử dụng 7 bit bộ nhớ là đủ, trong khi 1 byte gồm 8 bit được phân bổ cho mục đích này. Số lượng ký tự mà máy tính hiểu được trong trường hợp này là 128. Những ký tự này bao gồm bảng chữ cái tiếng Anh với dấu chấm câu, số và một số ký tự đặc biệt. Mã hóa bảy bit bằng tiếng Anh với bảng tương ứng (trang mã), được phát triển vào năm 1963, được gọi là Mã tiêu chuẩn Hoa Kỳ để trao đổi thông tin. Thông thường, chữ viết tắt “mã hóa ASCII” đã và vẫn được sử dụng để biểu thị nó.

Chuyển sang đa ngôn ngữ

Theo thời gian, máy tính được sử dụng rộng rãi ở các nước không nói tiếng Anh. Về vấn đề này, cần có những bảng mã cho phép sử dụng ngôn ngữ quốc gia. Người ta đã quyết định không phát minh lại bánh xe và lấy ASCII làm cơ sở. Bảng mã hóa trong phiên bản mới đã được mở rộng đáng kể. Việc sử dụng bit thứ 8 giúp dịch 256 ký tự sang ngôn ngữ máy tính.

Sự miêu tả

Bảng mã ASCII có một bảng được chia thành 2 phần. Chỉ nửa đầu của nó được coi là một tiêu chuẩn quốc tế được chấp nhận rộng rãi. Nó bao gồm:

  • Các ký tự có số sê-ri từ 0 đến 31, được mã hóa theo dãy từ 00000000 đến 00011111. Chúng dành riêng cho các ký tự điều khiển điều khiển quá trình hiển thị văn bản trên màn hình hoặc máy in, phát ra tín hiệu âm thanh, v.v.
  • Các ký tự có NN trong bảng từ 32 đến 127, được mã hóa theo dãy từ 00100000 đến 01111111 tạo thành phần tiêu chuẩn của bảng. Chúng bao gồm khoảng trắng (N 32), các chữ cái trong bảng chữ cái Latinh (chữ thường và chữ hoa), số có mười chữ số từ 0 đến 9, dấu chấm câu, dấu ngoặc có kiểu dáng khác nhau và các ký hiệu khác.
  • Các ký tự có số sê-ri từ 128 đến 255, được mã hóa theo trình tự từ 10000000 đến 11111111. Chúng bao gồm các chữ cái trong bảng chữ cái quốc gia không phải tiếng Latinh. Phần thay thế này của bảng ASCII được sử dụng để chuyển đổi các ký tự tiếng Nga sang dạng máy tính.

Một số tài sản

Đặc điểm của mã hóa ASCII bao gồm sự khác biệt giữa các chữ cái “A” - “Z” của chữ thường và chữ hoa chỉ một bit. Trường hợp này giúp đơn giản hóa rất nhiều việc chuyển đổi đăng ký, cũng như kiểm tra xem nó có thuộc một phạm vi giá trị nhất định hay không. Ngoài ra, tất cả các chữ cái trong hệ thống mã hóa ASCII đều được thể hiện bằng số thứ tự riêng trong bảng chữ cái, được viết bằng 5 chữ số trong hệ thống số nhị phân, trước 011 2 cho chữ thường và 010 2 cho chữ in hoa.

Một trong những tính năng của mã hóa ASCII là biểu diễn 10 chữ số - “0” - “9”. Trong hệ thống số thứ hai, chúng bắt đầu bằng 00112 và kết thúc bằng 2 giá trị số. Do đó, 0101 2 tương đương với số thập phân năm nên ký tự “5” được viết là 0011 01012. Dựa vào cách trên, bạn có thể dễ dàng chuyển đổi số BCD thành chuỗi ASCII bằng cách thêm chuỗi bit 00112 vào mỗi nibble trên chuỗi. bên trái.

"Unicode"

Như bạn đã biết, cần có hàng nghìn ký tự để hiển thị văn bản bằng các ngôn ngữ của nhóm Đông Nam Á. Một số lượng như vậy không thể được mô tả bằng bất kỳ cách nào trong một byte thông tin, do đó, ngay cả các phiên bản mở rộng của ASCII cũng không còn có thể đáp ứng nhu cầu ngày càng tăng của người dùng từ các quốc gia khác nhau.

Do đó, nảy sinh nhu cầu tạo ra một loại mã hóa văn bản phổ quát, việc phát triển mã hóa này với sự cộng tác của nhiều nhà lãnh đạo trong ngành CNTT toàn cầu đã được thực hiện bởi tập đoàn Unicode. Các chuyên gia của nó đã tạo ra hệ thống UTF 32. Trong đó, 32 bit được phân bổ để mã hóa 1 ký tự, tạo thành 4 byte thông tin. Nhược điểm chính là dung lượng bộ nhớ cần thiết tăng mạnh lên tới 4 lần, kéo theo nhiều vấn đề.

Đồng thời, đối với hầu hết các quốc gia có ngôn ngữ chính thức thuộc nhóm Ấn-Âu, số lượng ký tự bằng 2 32 là quá nhiều.

Là kết quả của công việc tiếp theo của các chuyên gia từ tập đoàn Unicode, mã hóa UTF-16 đã xuất hiện. Nó trở thành tùy chọn để chuyển đổi thông tin tượng trưng phù hợp với mọi người cả về dung lượng bộ nhớ cần thiết và số lượng ký tự được mã hóa. Đó là lý do tại sao UTF-16 được sử dụng theo mặc định và yêu cầu 2 byte dành riêng cho một ký tự.

Ngay cả phiên bản Unicode khá tiên tiến và thành công này cũng có một số nhược điểm và sau khi chuyển đổi từ phiên bản mở rộng của ASCII sang UTF-16, trọng lượng của tài liệu đã tăng gấp đôi.

Về vấn đề này, người ta đã quyết định sử dụng mã hóa độ dài thay đổi UTF-8. Trong trường hợp này, mỗi ký tự của văn bản nguồn được mã hóa thành một chuỗi có độ dài từ 1 đến 6 byte.

Liên hệ mã chuẩn Mỹ để trao đổi thông tin

Tất cả các ký tự Latinh có độ dài thay đổi UTF-8 được mã hóa thành 1 byte, như trong hệ thống mã hóa ASCII.

Điểm đặc biệt của YTF-8 là trong trường hợp văn bản bằng tiếng Latin không sử dụng các ký tự khác thì ngay cả những chương trình không hiểu Unicode vẫn có thể đọc được. Nói cách khác, mã hóa văn bản ASCII cơ sở chỉ đơn giản trở thành một phần của UTF có độ dài thay đổi mới. Các ký tự Cyrillic trong YTF-8 chiếm 2 byte và ví dụ: các ký tự Georgia - 3 byte. Bằng cách tạo UTF-16 và 8, vấn đề chính về việc tạo một không gian mã duy nhất trong phông chữ đã được giải quyết. Kể từ đó, các nhà sản xuất phông chữ chỉ có thể điền vào bảng các dạng ký tự văn bản vector dựa trên nhu cầu của họ.

Các hệ điều hành khác nhau thích các mã hóa khác nhau. Để có thể đọc và chỉnh sửa văn bản được nhập bằng bảng mã khác, các chương trình chuyển đổi văn bản tiếng Nga được sử dụng. Một số trình soạn thảo văn bản có chứa bộ chuyển mã tích hợp và cho phép bạn đọc văn bản bất kể mã hóa.

Bây giờ bạn đã biết có bao nhiêu ký tự trong bảng mã ASCII cũng như cách thức và lý do nó được phát triển. Tất nhiên, ngày nay tiêu chuẩn Unicode phổ biến nhất trên thế giới. Tuy nhiên, chúng ta không được quên rằng nó dựa trên ASCII, vì vậy sự đóng góp của các nhà phát triển nó cho lĩnh vực CNTT cần được đánh giá cao.

[Mã hóa 8 bit: ASCII, KOI-8R và CP1251] Các bảng mã hóa đầu tiên được tạo ở Hoa Kỳ không sử dụng bit thứ tám trong một byte. Văn bản được biểu diễn dưới dạng một chuỗi byte, nhưng bit thứ tám không được tính đến (nó được sử dụng cho mục đích chính thức).

Bảng ASCII (Mã tiêu chuẩn Mỹ để trao đổi thông tin) đã trở thành một tiêu chuẩn được chấp nhận rộng rãi. 32 ký tự đầu tiên của bảng ASCII (00 đến 1F) được sử dụng cho các ký tự không in được. Chúng được thiết kế để điều khiển một thiết bị in, v.v. Phần còn lại - từ 20 đến 7F - là các ký tự thông thường (có thể in được).

Bảng 1 - Mã hóa ASCII

Tháng mười hai Hex Tháng mười Char Mô tả
0 0 000 vô giá trị
1 1 001 bắt đầu tiêu đề
2 2 002 bắt đầu văn bản
3 3 003 cuối văn bản
4 4 004 kết thúc truyền tải
5 5 005 cuộc điều tra
6 6 006 thừa nhận
7 7 007 chuông
8 8 010 xóa lùi
9 9 011 Tab ngang
10 MỘT 012 dòng mới
11 B 013 tab dọc
12 C 014 trang mới
13 D 015 vận chuyển trở lại
14 E 016 chuyển ra ngoài
15 F 017 thay đổi trong
16 10 020 thoát liên kết dữ liệu
17 11 021 điều khiển thiết bị 1
18 12 022 điều khiển thiết bị 2
19 13 023 điều khiển thiết bị 3
20 14 024 điều khiển thiết bị 4
21 15 025 thừa nhận tiêu cực
22 16 026 nhàn rỗi đồng bộ
23 17 027 kết thúc quá trình chuyển đổi. khối
24 18 030 Hủy bỏ
25 19 031 kết thúc phương tiện
26 1A 032 thay thế
27 1B 033 bỏ trốn
28 1C 034 phân tách tập tin
29 1D 035 dấu tách nhóm
30 1E 036 dấu tách bản ghi
31 1F 037 dấu phân cách đơn vị
32 20 040 không gian
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2A 052 *
43 2B 053 +
44 2C 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3A 072 :
59 3B 073 ;
60 3C 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
Tháng mười hai Hex Tháng mười Char
64 40 100 @
65 41 101 MỘT
66 42 102 B
67 43 103 C
68 44 104 D
69 45 105 E
70 46 106 F
71 47 107 G
72 48 110 H
73 49 111 TÔI
74 4A 112 J
75 4B 113 K
76 4C 114 L
77 4D 115 M
78 4E 116 N
79 4F 117
80 50 120 P
81 51 121 Q
82 52 122 R
83 53 123 S
84 54 124 T
85 55 125 bạn
86 56 126 V.
87 57 127 W
88 58 130 X
89 59 131 Y
90 5A 132 Z
91 5B 133 [
92 5C 134 \
93 5D 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141 Một
98 62 142 b
99 63 143 c
100 64 144 d
101 65 145 e
102 66 146 f
103 67 147 g
104 68 150 h
105 69 151 Tôi
106 6A 152 j
107 6B 153 k
108 6C 154 tôi
109 6D 155 tôi
110 6E 156 N
111 6F 157
112 70 160 P
113 71 161 q
114 72 162 r
115 73 163 S
116 74 164 t
117 75 165 bạn
118 76 166 v
119 77 167 w
120 78 170 x
121 79 171 y
122 7A 172 z
123 7B 173 {
124 7C 174 |
125 7D 175 }
126 7E 176 ~
127 7F 177 DEL

Như bạn có thể dễ dàng thấy, bảng mã này chỉ chứa các chữ cái Latinh và những chữ cái được sử dụng bằng tiếng Anh. Ngoài ra còn có số học và các ký hiệu dịch vụ khác. Nhưng không có chữ cái tiếng Nga, thậm chí không có chữ cái Latinh đặc biệt dành cho tiếng Đức hoặc tiếng Pháp. Điều này rất dễ giải thích - mã hóa được phát triển đặc biệt theo tiêu chuẩn của Mỹ. Khi máy tính bắt đầu được sử dụng trên toàn thế giới, các ký tự khác cần được mã hóa.

Để làm điều này, người ta quyết định sử dụng bit thứ tám trong mỗi byte. Điều này làm cho có thêm 128 giá trị có sẵn (từ 80 đến FF) có thể được sử dụng để mã hóa các ký tự. Bảng đầu tiên trong số tám bit - “ASCII mở rộng” ( ASCII mở rộng) - bao gồm nhiều biến thể khác nhau của các ký tự Latinh được sử dụng trong một số ngôn ngữ ở Tây Âu. Nó cũng chứa các ký hiệu bổ sung khác, bao gồm cả bút danh.

Các ký tự giả cho phép bạn cung cấp một số hình ảnh đồ họa bằng cách chỉ hiển thị các ký tự văn bản trên màn hình. Ví dụ: chương trình quản lý tệp FAR Manager hoạt động bằng cách sử dụng đồ họa giả.

Không có chữ cái tiếng Nga nào trong bảng ASCII mở rộng. Nga (trước đây là Liên Xô) và các quốc gia khác đã tạo ra bảng mã riêng của họ để có thể thể hiện các ký tự “quốc gia” cụ thể trong các tệp văn bản 8 bit - các chữ cái Latinh của tiếng Ba Lan và tiếng Séc, Cyrillic (bao gồm cả các chữ cái tiếng Nga) và các bảng chữ cái khác.

Trong tất cả các mã hóa đã trở nên phổ biến, 127 ký tự đầu tiên (nghĩa là giá trị byte có bit thứ tám bằng 0) đều giống như ASCII. Vì vậy, tệp ASCII hoạt động ở một trong hai bảng mã này; Các chữ cái trong tiếng Anh được thể hiện theo cách tương tự.

Tổ chức ISO (Tổ chức tiêu chuẩn hóa quốc tế) đã áp dụng nhóm tiêu chuẩn ISO 8859. Nó xác định mã hóa 8 bit cho các nhóm ngôn ngữ khác nhau. Vì vậy, ISO 8859-1 là bảng ASCII mở rộng dành cho Hoa Kỳ và Tây Âu. Và ISO 8859-5 là bảng dành cho bảng chữ cái Cyrillic (bao gồm cả tiếng Nga).

Tuy nhiên, vì lý do lịch sử, mã hóa ISO 8859-5 đã không có hiệu lực. Trong thực tế, các bảng mã sau được sử dụng cho tiếng Nga:

Mã Trang 866 (CP866), hay còn gọi là “DOS”, hay còn gọi là “mã hóa GOST thay thế”. Được sử dụng rộng rãi cho đến giữa những năm 90; nay được sử dụng ở mức độ hạn chế. Thực tế không được sử dụng để phân phối văn bản trên Internet.
- KOI-8. Được phát triển vào những năm 70-80. Đây là một tiêu chuẩn được chấp nhận rộng rãi để truyền tải các email trên Internet của Nga. Nó cũng được sử dụng rộng rãi trong các hệ điều hành thuộc họ Unix, bao gồm cả Linux. Phiên bản tiếng Nga của KOI-8 được gọi là KOI-8R; Có các phiên bản dành cho các ngôn ngữ Cyrillic khác (ví dụ: KOI8-U là phiên bản dành cho tiếng Ukraina).
- Mã trang 1251, CP1251, Windows-1251. Được phát triển bởi Microsoft để hỗ trợ tiếng Nga trong Windows.

Ưu điểm chính của CP866 là bảo toàn các ký tự đồ họa giả ở những vị trí giống như trong Extended ASCII; do đó, các chương trình văn bản nước ngoài, chẳng hạn như Norton Commander nổi tiếng, có thể hoạt động mà không cần thay đổi. CP866 hiện được sử dụng cho các chương trình Windows chạy trong cửa sổ văn bản hoặc chế độ văn bản toàn màn hình, bao gồm cả Trình quản lý FAR.

Các văn bản trong CP866 khá hiếm trong những năm gần đây (nhưng nó được sử dụng để mã hóa tên tệp tiếng Nga trong Windows). Do đó, chúng tôi sẽ trình bày chi tiết hơn về hai bảng mã khác - KOI-8R và CP1251.



Như bạn có thể thấy, trong bảng mã hóa CP1251, các chữ cái tiếng Nga được sắp xếp theo thứ tự bảng chữ cái (tuy nhiên, ngoại trừ chữ E). Sự sắp xếp này giúp các chương trình máy tính dễ dàng sắp xếp theo thứ tự bảng chữ cái.

Nhưng trong KOI-8R thứ tự các chữ cái tiếng Nga có vẻ ngẫu nhiên. Nhưng thực tế thì không phải vậy.

Trong nhiều chương trình cũ, bit thứ 8 bị mất khi xử lý hoặc truyền văn bản. (Bây giờ những chương trình như vậy thực tế đã “tuyệt chủng”, nhưng vào cuối những năm 80 - đầu những năm 90, chúng đã lan rộng). Để nhận giá trị 7 bit từ giá trị 8 bit, chỉ cần trừ 8 từ chữ số có nghĩa nhất; ví dụ: E1 trở thành 61.

Bây giờ so sánh KOI-8R với bảng ASCII (Bảng 1). Bạn sẽ thấy rằng các chữ cái tiếng Nga được đặt tương ứng rõ ràng với các chữ cái Latinh. Nếu bit thứ tám biến mất, các chữ cái tiếng Nga viết thường sẽ chuyển thành chữ cái Latinh viết hoa và các chữ cái tiếng Nga viết hoa sẽ chuyển thành chữ cái Latinh viết thường. Vì vậy, E1 trong KOI-8 là chữ “A” trong tiếng Nga, trong khi 61 trong ASCII là chữ “a” trong tiếng Latin.

Vì vậy, KOI-8 cho phép bạn duy trì khả năng đọc của văn bản tiếng Nga khi mất bit thứ 8. “Xin chào mọi người” trở thành “PRIWET WSEM”.

Gần đây, cả thứ tự chữ cái của các ký tự trong bảng mã hóa và khả năng đọc khi mất bit thứ 8 đều mất đi tầm quan trọng mang tính quyết định. Bit thứ tám trong máy tính hiện đại không bị mất trong quá trình truyền hoặc xử lý. Và việc sắp xếp theo thứ tự bảng chữ cái được thực hiện có tính đến việc mã hóa chứ không chỉ bằng cách so sánh các mã. (Nhân tiện, mã CP1251 không được sắp xếp hoàn toàn theo thứ tự bảng chữ cái - chữ E không ở đúng vị trí của nó).

Do có hai cách mã hóa phổ biến nên khi làm việc với Internet (thư, duyệt các trang Web), đôi khi bạn có thể thấy một tập hợp các chữ cái vô nghĩa thay vì văn bản tiếng Nga. Ví dụ: “TÔI LÀ SBYUFEMHEL.” Đây chỉ là những từ “với sự tôn trọng”; nhưng chúng được mã hóa bằng mã hóa CP1251 và máy tính đã giải mã văn bản bằng bảng KOI-8. Ngược lại, nếu các từ tương tự được mã hóa bằng KOI-8 và máy tính giải mã văn bản theo bảng CP1251 thì kết quả sẽ là “U HCHBTSEOYEN”.

Đôi khi xảy ra trường hợp máy tính giải mã các chữ cái tiếng Nga bằng cách sử dụng một bảng không dành cho tiếng Nga. Sau đó, thay vì các chữ cái tiếng Nga, một bộ ký hiệu vô nghĩa xuất hiện (ví dụ: các chữ cái Latinh của các ngôn ngữ Đông Âu); chúng thường được gọi là “crocozybras”.

Trong hầu hết các trường hợp, các chương trình hiện đại có thể xử lý việc xác định mã hóa của tài liệu Internet (email và trang Web) một cách độc lập. Nhưng đôi khi chúng “bắn nhầm”, và sau đó bạn có thể thấy những chuỗi chữ cái tiếng Nga hoặc “krokozyabry” kỳ lạ. Theo quy định, trong tình huống như vậy, để hiển thị văn bản thực trên màn hình, chỉ cần chọn mã hóa thủ công trong menu chương trình là đủ.

Thông tin từ trang http://open-office.edusite.ru/TextProcessor/p5aa1.html đã được sử dụng cho bài viết này.

Tài liệu được lấy từ trang web:

Excel cho Office 365 Word cho Office 365 Outlook cho Office 365 PowerPoint cho Office 365 Nhà xuất bản cho Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Nhà xuất bản 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Nhà xuất bản 201 6 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Nhà xuất bản 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Nhà xuất bản 2010 Visio 2010 Excel 2007 Word 2007 Outlook 200 7 PowerPoint 2007 Nhà xuất bản 2007 Truy cập 2007 Visio 2007 OneNote 2007 Office Tiêu chuẩn Visio 2010 Tiêu chuẩn Visio 2007 Tiêu chuẩn Visio 2010 Ít hơn

Trong bài viết này: Chèn ký tự ASCII hoặc Unicode vào tài liệu

Nếu chỉ cần nhập một vài ký tự hoặc ký hiệu đặc biệt, bạn có thể sử dụng phím tắt. Để biết danh sách các ký tự ASCII, hãy xem các bảng sau hoặc bài viết Chèn bảng chữ cái quốc gia bằng phím tắt.

Ghi chú:

Chèn ký tự ASCII

Để chèn ký tự ASCII, nhấn và giữ phím ALT trong khi nhập mã ký tự. Ví dụ: để chèn ký hiệu độ (°), hãy nhấn và giữ phím ALT, sau đó nhập 0176 trên bàn phím số.

Để nhập số, hãy sử dụng bàn phím số thay vì các số trên bàn phím chính. Nếu bạn cần nhập số trên bàn phím số, hãy đảm bảo đèn báo NUM LOCK được bật.

Chèn ký tự Unicode

Để chèn ký tự Unicode, hãy nhập mã ký tự, sau đó nhấn ALT và X. Ví dụ: để chèn ký hiệu đô la ($), hãy nhập 0024 rồi nhấn ALT và X. Để biết tất cả các mã ký tự Unicode, hãy xem .

Quan trọng: Một số chương trình Microsoft Office, chẳng hạn như PowerPoint và InfoPath, không hỗ trợ chuyển đổi mã Unicode thành ký tự. Nếu bạn cần chèn ký tự Unicode vào một trong các chương trình này, hãy sử dụng .

Ghi chú:

    Nếu ký tự Unicode sai xuất hiện sau khi bạn nhấn ALT+X, hãy chọn mã đúng, rồi nhấn lại ALT+X.

    Ngoài ra, bạn phải nhập "U+" trước mã. Ví dụ: nếu bạn nhập "1U+B5" và nhấn ALT+X, văn bản "1µ" sẽ được hiển thị và nếu bạn nhập "1B5" và nhấn ALT+X, ký hiệu "Ƶ" sẽ được hiển thị.

Sử dụng bảng ký hiệu

Bảng ký tự là một chương trình được tích hợp trong Microsoft Windows cho phép bạn xem các ký tự có sẵn cho phông chữ đã chọn.

Sử dụng bảng ký hiệu, bạn có thể sao chép các ký hiệu riêng lẻ hoặc một nhóm ký hiệu vào bảng tạm và dán chúng vào bất kỳ chương trình nào hỗ trợ hiển thị các ký hiệu đó. Mở bảng ký hiệu

    Trong Windows 10, nhập từ "ký hiệu" vào hộp tìm kiếm trên thanh tác vụ và chọn bảng ký hiệu từ kết quả tìm kiếm.

    Trong Windows 8, nhập "ký hiệu" trên màn hình Bắt đầu và chọn bảng ký hiệu từ kết quả tìm kiếm.

    Trong Windows 7, bấm vào nút Bắt đầu, chọn Tất cả chương trình, Phụ kiện, Công cụ hệ thống, rồi bấm vào Bản đồ ký tự.

Các ký tự được nhóm theo phông chữ. Bấm vào danh sách phông chữ để chọn bộ ký tự phù hợp. Để chọn một biểu tượng, hãy nhấp vào biểu tượng đó, sau đó nhấp vào nút Chọn. Để chèn ký hiệu, bấm chuột phải vào vị trí mong muốn trong tài liệu và chọn Dán.

Mã ký tự thường dùng

Để biết danh sách đầy đủ các ký tự, hãy xem Máy tính, Bảng mã ký tự ASCII hoặc Bảng ký tự Unicode được tổ chức theo bộ.

Glyph

Glyph

Tiền tệ

Ký hiệu pháp lý

Ký hiệu toán học

Phân số

Dấu câu và ký hiệu phương ngữ

Ký hiệu hình dạng

Các mã dấu phụ thường dùng

Để biết danh sách đầy đủ các ký tự và mã tương ứng, hãy xem.

Glyph

Glyph

Ký tự điều khiển ASCII không in được

Các ký tự được sử dụng để điều khiển một số thiết bị ngoại vi, chẳng hạn như máy in, được đánh số từ 0–31 trong bảng ASCII. Ví dụ: nguồn cấp trang/ký tự trang mới là số 12. Ký tự này báo cho máy in di chuyển đến đầu trang tiếp theo.

Bảng ký tự điều khiển ASCII không in được

Số thập phân

Dấu hiệu

Số thập phân

Dấu hiệu

Giải phóng kênh dữ liệu

Bắt đầu tiêu đề

Mã điều khiển thiết bị đầu tiên

Bắt đầu văn bản

Mã điều khiển thiết bị thứ hai

Kết thúc văn bản

Mã điều khiển thiết bị thứ ba

Kết thúc truyền tải

Mã điều khiển thiết bị thứ tư

năm cánh

Xác nhận tiêu cực

Xác nhận

Chế độ truyền đồng bộ

Tín hiệu âm thanh

Kết thúc khối dữ liệu được truyền

Lập bảng theo chiều ngang

Kết thúc phương tiện truyền thông

Nguồn cấp dữ liệu/dòng mới

Ký hiệu thay thế

Tab dọc

quá

Dịch trang/trang mới

Mười hai

Dấu tách tập tin

Vận chuyển trở lại

Dấu phân cách nhóm

Dịch chuyển mà không lưu bit

Dấu phân cách bản ghi

Dịch chuyển bảo toàn bit

mười lăm

Dấu phân cách dữ liệu

Để sử dụng ASCII một cách chính xác, bạn cần mở rộng kiến ​​thức về lĩnh vực này và về khả năng mã hóa.

Nó là gì?

ASCII là bảng mã hóa các ký tự in (xem ảnh chụp màn hình số 1) được gõ trên bàn phím máy tính để truyền thông tin và một số mã. Nói cách khác, bảng chữ cái và chữ số thập phân được mã hóa thành các ký hiệu tương ứng thể hiện và mang thông tin cần thiết.

ASCII được phát triển ở Mỹ nên bộ ký tự tiêu chuẩn thường bao gồm bảng chữ cái tiếng Anh kèm theo các con số, tổng cộng khoảng 128 ký tự. Nhưng sau đó một câu hỏi công bằng được đặt ra: phải làm gì nếu cần mã hóa bảng chữ cái quốc gia?

Các phiên bản khác của bảng ASCII đã được phát triển để giải quyết các vấn đề tương tự. Ví dụ: đối với các ngôn ngữ có cấu trúc nước ngoài, các chữ cái trong bảng chữ cái tiếng Anh đã bị xóa hoặc các ký tự bổ sung được thêm vào chúng dưới dạng bảng chữ cái quốc gia. Do đó, bảng mã ASCII có thể chứa các chữ cái tiếng Nga để sử dụng trong nước (xem ảnh chụp màn hình số 2).

Hệ thống mã hóa ASCII được sử dụng ở đâu?

Hệ thống mã hóa này không chỉ cần thiết để gõ thông tin văn bản trên bàn phím. Nó cũng được sử dụng trong đồ họa. Ví dụ: trong chương trình ASCII Art Maker, hình ảnh đồ họa của nhiều tiện ích mở rộng khác nhau bao gồm một loạt ký tự ASCII (xem ảnh chụp màn hình số 3).


Theo quy định, các chương trình như vậy có thể được chia thành các chương trình thực hiện chức năng của trình soạn thảo đồ họa, đảo ngược hình ảnh thành văn bản và các chương trình chuyển đổi hình ảnh thành đồ họa ASCII. Biểu tượng cảm xúc nổi tiếng (hay còn gọi là "khuôn mặt người cười") cũng là một ví dụ về biểu tượng mã hóa.

Phương pháp mã hóa này cũng có thể được sử dụng khi viết hoặc tạo tài liệu HTML. Ví dụ: bạn nhập một bộ ký tự cụ thể và cần thiết và khi xem chính trang đó, ký hiệu tương ứng với mã này sẽ được hiển thị trên màn hình.

Trong số những thứ khác, loại mã hóa này là cần thiết khi tạo một trang web đa ngôn ngữ, bởi vì các ký tự không có trong bảng quốc gia này hoặc bảng quốc gia khác sẽ cần phải được thay thế bằng mã ASCII. Nếu người đọc được kết nối trực tiếp với công nghệ thông tin và truyền thông (ICT), thì sẽ rất hữu ích nếu người đọc làm quen với các hệ thống như:

  • Bộ ký tự di động;
  • Nhân vật điều khiển;
  • EBCDIC;
  • VISCII;
  • YUSCII;
  • Unicode;
  • nghệ thuật ASCII;
  • KOI-8.
  • Thuộc tính bảng ASCII

    Giống như bất kỳ chương trình hệ thống nào, ASCII có những đặc tính riêng. Vì vậy, ví dụ, hệ thống số thập phân (các chữ số từ 0 đến 9) được chuyển đổi sang hệ thống số nhị phân (tức là mỗi chữ số thập phân được chuyển đổi thành 288 nhị phân tương ứng = 1001000).

    Các chữ cái nằm ở cột trên và cột dưới chỉ khác nhau một chút, điều này làm giảm đáng kể mức độ phức tạp của việc kiểm tra và chỉnh sửa trường hợp.

    Với tất cả các thuộc tính này, mã hóa ASCII hoạt động ở dạng tám bit, mặc dù ban đầu nó được dự định là bảy bit.

    Sử dụng ASCII trong các chương trình Microsoft Office:

    Nếu cần, tùy chọn mã hóa thông tin này có thể được sử dụng trong Microsoft Notepad và Microsoft Office Word. Trong các ứng dụng này, tài liệu có thể được lưu ở định dạng ASCII, nhưng trong trường hợp này, bạn sẽ không thể sử dụng một số chức năng khi nhập văn bản.

    Đặc biệt, tính năng in đậm và in đậm sẽ không khả dụng vì mã hóa chỉ giữ lại ý nghĩa của thông tin được đánh máy chứ không giữ lại hình thức và hình thức chung. Bạn có thể thêm các mã như vậy vào tài liệu bằng các ứng dụng phần mềm sau:

    • Microsoft Excel;
    • Trang trước của Microsoft;
    • Microsoft InfoPath;
    • Microsoft OneNote;
    • Microsoft Outlook;
    • Microsoft Powerpoint;
    • Dự án Microsoft.

    Điều đáng lưu ý là khi gõ mã ASCII trong các ứng dụng này, bạn phải giữ phím ALT.

    Tất nhiên, tất cả các mã cần thiết đều yêu cầu nghiên cứu lâu hơn và chi tiết hơn, nhưng điều này nằm ngoài phạm vi bài viết của chúng tôi hôm nay. Tôi hy vọng bạn thấy nó thực sự hữu ích.

    Hẹn gặp lại!

    Tốt xấu

    Lớp phủ ký tự

    Ký tự BS (backspace) cho phép máy in in một ký tự lên trên ký tự khác. ASCII cung cấp khả năng thêm dấu phụ vào các chữ cái theo cách này, ví dụ:

    • a BS "→ á
    • a BS ` → à
    • a BS ^ → â
    • o BS / → ø
    • c BS , → ç
    • n BS ~ → с

    Lưu ý: trong các phông chữ cũ hơn, dấu nháy đơn " được vẽ nghiêng sang trái và dấu ngã ~ được chuyển lên trên, để chúng chỉ vừa khít với vai trò của dấu thăng và dấu ngã ở trên.

    Nếu cùng một ký tự được chồng lên một ký tự thì kết quả là hiệu ứng phông chữ đậm và nếu gạch chân được chồng lên một ký tự thì kết quả là văn bản được gạch chân.

    • a BS a → a
    • aBS_→ Một

    Lưu ý: điều này được sử dụng, ví dụ, trong hệ thống trợ giúp của người đàn ông.

    Các biến thể ASCII quốc gia

    Tiêu chuẩn ISO 646 (ECMA-6) cho phép đặt các ký tự quốc gia thay cho @ [ \ ] ^ ` ( | ) ~ . Ngoài ra, £ có thể được đặt ở vị trí # và ¤ có thể được đặt ở vị trí $. Hệ thống này rất phù hợp với các ngôn ngữ châu Âu, nơi chỉ cần thêm một vài ký tự. Phiên bản ASCII không có ký tự quốc gia được gọi là US-ASCII hoặc "Phiên bản tham chiếu quốc tế".

    Sau đó, hóa ra sẽ thuận tiện hơn khi sử dụng mã hóa 8 bit (trang mã), trong đó nửa dưới của bảng mã (0-127) được chiếm bởi các ký tự US-ASCII và nửa trên (128-255) bằng các ký tự bổ sung, bao gồm cả bộ ký tự quốc gia. Do đó, nửa trên của bảng ASCII, trước khi sử dụng rộng rãi Unicode, đã được sử dụng tích cực để thể hiện các ký tự, chữ cái được bản địa hóa của ngôn ngữ địa phương. Việc thiếu một tiêu chuẩn thống nhất để đặt các ký tự Cyrillic trong bảng ASCII đã gây ra nhiều vấn đề về mã hóa (KOI-8, Windows-1251 và các loại khác). Các ngôn ngữ khác không có chữ viết Latinh cũng bị ảnh hưởng bởi một số cách mã hóa khác nhau.

    .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F0. 1. 2. 3. 4. 5. 6. 7. 8. 9. MỘT. B. C. D. E. F.
    KHÔNG SOM EOA EOM EQT W.R.U. RU CHUÔNG BKSP HT LF VT FF CR VÌ THẾ S.I.
    DC 0 DC 1 DC 2 DC 3 DC 4 LỖI ĐỒNG BỘ HÓA L.E.M. S 0 S 1 S 2 S 3 S 4 S5 S6 S7
    TRỐNG ! " # $ % & " ( ) * + , - . /
    0 1 2 3 4 5 6 7 8 9 : ; < = > ?
    @ MỘT B C D E F G H TÔI J K L M N
    P Q R S T bạn V. W X Y Z [ \ ]
    Một b c d e f g h Tôi j k tôi tôi N
    P q r S t bạn v w x y z THOÁT DEL

    Trên những máy tính có đơn vị bộ nhớ có thể định địa chỉ tối thiểu là từ 36 bit, ban đầu các ký tự 6 bit được sử dụng (1 từ = 6 ký tự). Sau khi chuyển đổi sang ASCII, những máy tính như vậy bắt đầu chứa 5 ký tự 7 bit (còn lại 1 bit) hoặc 4 ký tự 9 bit trong một từ.

    Mã ASCII cũng được sử dụng để xác định phím nào được nhấn trong khi lập trình. Đối với bàn phím QWERTY tiêu chuẩn, bảng mã trông như sau: