Kiểm soát các câu hỏi.  Một chút là gì

– Igor (Quản trị viên)

Trong bài viết này, tôi sẽ xem xét câu hỏi bit là gì, tại sao nó cần thiết và nó có vị trí như thế nào trong thế giới công nghệ thông tin. Tài liệu này chủ yếu nhắm đến người mới bắt đầu và người dùng thông thường, những người chỉ muốn tìm hiểu nhịp điệu là gì. Vì vậy, nếu bạn là một người đam mê máy tính dày dạn kinh nghiệm thì bài viết này không dành cho bạn, mặc dù điều đó tùy thuộc vào bạn quyết định.

Ngày nay, gần như toàn bộ ngành công nghiệp thông tin, bao gồm cả công nghệ, đều dựa trên thuật ngữ “bit”, bắt nguồn từ cụm từ “chữ số nhị phân” hoặc trong tiếng Nga là ký hiệu nhị phân (số). Vậy nhịp là gì? Về mặt kỹ thuật thuần túy, từ “bit” có nghĩa là một đơn vị thông tin chỉ có thể lấy hai giá trị 0 hoặc 1. Nói một cách đơn giản hơn và đưa ra một sự tương tự trong cuộc sống, đây là lựa chọn phổ biến giữa “Có” hoặc “Không”. ”. Không khó để nhận thấy rằng cách tiếp cận này rất dễ nhận biết và dễ hiểu, ngay cả đối với những người không rành về khoa học kỹ thuật (hầu như mỗi ngày có hàng tỷ người tương tác bằng cách này hay cách khác với các thiết bị điện tử, bao gồm cả đồng hồ báo thức). , máy tính, v.v.).

Ghi chú: Trên Internet, bạn có thể tìm thấy tài liệu tham khảo về các phương pháp đếm và tạo thiết bị điện tử khác. Tuy nhiên, do sự phức tạp trong quá trình sản xuất hàng loạt và việc tạo ra phần mềm thích hợp nên chúng chưa bao giờ root được.

Bit cho phép những gì? Bit giúp dễ dàng xây dựng các cấu trúc phức tạp hơn, chẳng hạn như mô tả thuật toán hành động, hệ thống phân loại, kho dữ liệu, v.v. Nói cách khác, sử dụng bit bạn có thể vừa lưu trữ dữ liệu vừa tạo mã chương trình cho các thiết bị điều khiển theo cùng một kiểu. Ví dụ: nếu bạn chú ý, tài liệu và chương trình chỉ là các tệp trên ổ cứng của bạn. Ngoài ra, logic nhị phân như vậy còn được sử dụng trong việc sản xuất chính thiết bị đó (tạo ra các bảng tương tự).

Trong kỹ thuật kỹ thuật, 0 thường được coi là không có dòng điện hoặc mức tín hiệu thấp và 1 được coi là mức tín hiệu cao. Nói cách khác, có dòng điện trên các tiếp điểm - nghĩa là 1, không có dòng điện - nghĩa là 0. Đơn giản, dễ hiểu và không có vấn đề gì khi tích hợp các thiết bị và khối khác nhau.

Nói chung, “một chút là gì” chúng ta có thể muốn nói đến toàn bộ ngành công nghiệp thông tin hiện đại chứ không chỉ hai giá trị 0 và 1. Do đó, bạn có thể tìm thấy từ này trong hầu hết mọi bài viết kỹ thuật, cho dù nó dành riêng cho phần cứng hoặc mã chương trình.

Ghi chú: Điều đáng biết là từ “bit” cũng có thể có nghĩa là các định nghĩa khác. Ví dụ, trong lý thuyết xác suất, một bit là logarit nhị phân của xác suất của các sự kiện có khả năng xảy ra như nhau.

Sau khi nhận được tin nhắn, nếu vấn đề này hoàn toàn rõ ràng (tức là sự không chắc chắn biến mất), thì họ nói rằng đã nhận được thông tin toàn diện. Điều này có nghĩa là không cần thêm thông tin về chủ đề này. Ngược lại, nếu sau khi nhận được tin nhắn, độ không chắc chắn vẫn giữ nguyên (thông tin được báo cáo đã được biết hoặc không liên quan) thì không nhận được thông tin nào (không có thông tin).

Chút – đơn vị trình bày thông tin nhỏ nhất. Trong khoa học máy tính, giá trị thường được sử dụng được gọi là byte và bằng 8 bit.

Byte - đơn vị xử lý và truyền thông tin nhỏ nhất.

Bit cho phép bạn chọn một tùy chọn trong số hai tùy chọn có thể; byte tương ứng là 1 trên 256 (2 8).

Cùng với byte, các đơn vị lớn hơn được sử dụng để đo lượng thông tin:

1 KB (một kilobyte) = 2 10 byte = 1024 byte;

1 MB (một megabyte) = 2 10 KB = 1024 KB;

1 GB (một gigabyte) = 2 10 MB = 1024 MB.

Gần đây, do khối lượng thông tin được xử lý ngày càng tăng nên các đơn vị dẫn xuất như:

1 Terabyte (TB) = 1024 GB = 2 40 byte,

1 Petabyte (Pb) = 1024 TB = 2 50 byte.

Ví dụ . Sắp xếp theo thứ tự tăng dần của dãy sau:

1024MB, 11 Petabyte, 2224GB, 1 Terabyte.

Giải pháp . Đầu tiên, hãy đưa các giá trị đo lượng thông tin về một giá trị duy nhất thuận tiện cho chuỗi này. Trong trường hợp này là GB.

1024 MB = 1 GB, nhỏ hơn 1 Terabyte = 1024 GB, lần lượt nhỏ hơn 2224 GB và nhỏ hơn 11 Petabyte,

Do đó, dãy được sắp xếp theo thứ tự tăng dần là:

1024 MB, 1 Terabyte, 2224 GB, 11 Petabyte

II. Mã hóa thông tin.

Máy tính chỉ có thể xử lý thông tin được trình bày ở dạng số. Tất cả các thông tin khác (văn bản, âm thanh, hình ảnh, chỉ số nhạc cụ, v.v.) phải được chuyển đổi sang dạng số để xử lý trên máy tính.

Sự chuyển đổi từ dạng biểu diễn thông tin này sang dạng biểu diễn thông tin khác, thuận tiện hơn cho việc lưu trữ, truyền tải hoặc xử lý, được gọi là mã hóa thông tin.

Mã hóa là hoạt động biến đổi dấu hiệu hoặc nhóm dấu hiệu của hệ thống ký hiệu này thành dấu hiệu hoặc nhóm dấu hiệu của hệ thống ký hiệu khác.

Theo quy định, tất cả các số trong máy tính được biểu diễn bằng số 0 và số 1, tức là công việc được thực hiện trong hệ thống số nhị phân, vì trong trường hợp này các thiết bị xử lý chúng đơn giản hơn nhiều.

1. Mã hóa văn bản.

Khi nhập vào máy tính, mỗi chữ cái được mã hóa bằng một số nhất định và khi xuất ra thiết bị bên ngoài (màn hình hoặc bản in), hình ảnh của các chữ cái được xây dựng từ những con số này để con người nhận thức. Sự tương ứng giữa một tập hợp các chữ cái và số được gọi là mã hóa ký tự.

Cách tiếp cận theo bảng chữ cái dựa trên thực tế là bất kỳ tin nhắn nào cũng có thể được mã hóa bằng cách sử dụng một chuỗi ký tự hữu hạn từ một số bảng chữ cái. Tập hợp các ký tự dùng để viết văn bản được gọi là bảng chữ cái . Số lượng ký tự trong bảng chữ cái được gọi là quyền lực .

Có một bảng chữ cái nhị phân chỉ chứa 2 ký tự và số lượng số của nó là hai.

Để thể hiện thông tin văn bản trong máy tính, bảng chữ cái có dung lượng 256 ký tự thường được sử dụng nhất. Một ký tự trong bảng chữ cái như vậy mang 8 bit thông tin, bởi vì 2 8 = 256.

8 bit tạo thành một byte, do đó mã nhị phân của mỗi ký tự chiếm 1 byte bộ nhớ máy tính. Theo truyền thống, để mã hóa một ký tự, một lượng thông tin bằng 1 byte (8 bit) được sử dụng. Tất cả các ký tự của bảng chữ cái như vậy được đánh số từ 0 đến 255 và mỗi số tương ứng với mã nhị phân 8 bit từ 00000000 đến 11111111.

Đối với các loại máy tính và hệ điều hành khác nhau, các bảng mã hóa khác nhau được sử dụng, khác nhau về thứ tự đặt các ký tự bảng chữ cái trong bảng mã hóa. Tiêu chuẩn quốc tế trên máy tính cá nhân là bảng mã hóa ASCII. Tin nhắn được viết bằng ký tự ASCII sử dụng bảng chữ cái 256 ký tự.

Ngoài ra hiện nay còn có một số bảng mã chữ Nga. Chúng bao gồm bảng mã hóa KOI8, sử dụng bảng chữ cái gồm 256 ký tự.

Tiêu chuẩn quốc tế mới UNICODE đã trở nên phổ biến, phân bổ không phải một byte mà là hai byte cho mỗi ký tự, do đó, nó có thể được sử dụng để mã hóa không phải 256 ký tự mà là 2 16 = 65536 ký tự khác nhau.

Nội dung thông tin của dãy ký tự không phụ thuộc vào nội dung của tin nhắn.

Để xác định lượng thông tin trong tin nhắn theo cách tiếp cận theo bảng chữ cái, bạn cần giải quyết tuần tự các vấn đề sau:

    Xác định lượng thông tin (i) trong một ký hiệu bằng công thức 2i = N, trong đó N là lũy thừa của bảng chữ cái,

    Xác định số lượng ký tự trong tin nhắn, có tính đến dấu câu và dấu cách (m),

    Tính lượng thông tin sử dụng công thức: V = i * m.

Ví dụ . Tin nhắn văn bản “Mười chữ cái” được mã hóa; xác định khối lượng thông tin của nó bằng hệ thống ASCII và UNICODE.

Giải pháp . Tin nhắn có 11 ký tự. Một ký tự trong bảng chữ cái ASCII mang 8 bit thông tin nên khối lượng thông tin theo hệ thống ASCII sẽ là 11 * 8 bit = 88 bit = 11 byte.

Một ký tự trong bảng chữ cái UNICODE mang 16 bit thông tin hoặc 2 byte, do đó khối lượng thông tin theo hệ thống UNICODE sẽ là 11 * 16 bit = 176 bit = 22 byte.

Đối với một thông điệp nhị phân có cùng độ dài, khối lượng thông tin là 11 bit, bởi vì N = 2, i = 1 bit, m = 11, V = 11 bit.

Bài giảng 2. Thuộc tính của thông tin. Lượng thông tin. Khái niệm về thuật toán.

Bản tóm tắt ngắn gọn

Bài giảng thảo luận các khái niệm về khoa học máy tính và thông tin hóa. Nó mô tả cách thông tin được truyền đi và nó tồn tại ở dạng nào.

Câu hỏi kiểm soát

1. Khoa học Máy tính nghiên cứu những gì?

2. Thông tin có nghĩa là gì?

3. Thế nào là quá trình thông tin?

4. Xác định phương tiện kỹ thuật là gì.

5. Xác định phần mềm là gì và nó bao gồm những gì.

6. Thuật ngữ Brainware có nghĩa là gì?

7. Xác định đối tượng thông tin.

8. Cho ví dụ về cách gửi tin nhắn.

9. Mô tả quá trình truyền tin nhắn.


Bài giảng 2. Thuộc tính của thông tin. Lượng thông tin. Khái niệm về thuật toán.

Bài giảng thảo luận về ý nghĩa chung của các khái niệm về thuật toán, lượng thông tin và các thuộc tính của thông tin. Các khái niệm về tin học hóa xã hội

Mục đích của bài giảng: Hiểu cách đo lường lượng thông tin. Bài giảng thảo luận về các khái niệm về bit và byte thông tin.

Thông tin có những đặc tính gì?

Thuộc tính thông tin:

Thông tin có độ tin cậy cao, nếu nó phản ánh đúng tình hình thực tế. Thông tin không chính xác có thể dẫn đến hiểu lầm hoặc đưa ra quyết định sai lầm.

Thông tin đáng tin cậy có thể trở nên không đáng tin cậy theo thời gian, vì nó có xu hướng trở nên lỗi thời, nghĩa là nó không còn phản ánh tình trạng thực sự của vấn đề.

Thông tin đã đầy đủ nếu nó đủ để hiểu và đưa ra quyết định. Cả thông tin không đầy đủ và dư thừa đều cản trở việc ra quyết định hoặc có thể dẫn đến sai sót.

Độ chính xác của thông tinđược xác định bởi mức độ gần gũi của nó với trạng thái thực của đối tượng, quá trình, hiện tượng, v.v.

Giá trị của thông tin phụ thuộc vào tầm quan trọng của nó trong việc giải quyết vấn đề, cũng như mức độ nó sẽ được sử dụng thêm trong bất kỳ loại hoạt động nào của con người.

Chỉ những thông tin nhận được kịp thời mới có thể mang lại lợi ích như mong đợi. Cả việc trình bày thông tin quá sớm (khi nó chưa thể được tiếp thu) và sự chậm trễ của nó đều là điều không mong muốn.

Nếu thông tin có giá trị và kịp thời được thể hiện một cách không rõ ràng, nó có thể trở nên vô dụng.

Thông tin trở nên dễ hiểu nếu nó được thể hiện bằng ngôn ngữ được sử dụng bởi những người mà thông tin này hướng tới.

Thông tin phải được trình bày dưới dạng dễ tiếp cận (theo mức độ nhận thức). Vì vậy, những câu hỏi giống nhau được trình bày theo những cách khác nhau trong sách giáo khoa và ấn phẩm khoa học ở trường.

Thông tin về cùng một vấn đề có thể được trình bày ngắn gọn (ngắn gọn, không có chi tiết không quan trọng) hoặc rộng rãi (chi tiết, dài dòng). Tính chính xác của thông tin là cần thiết trong sách tham khảo, bách khoa toàn thư, sách giáo khoa và tất cả các loại hướng dẫn.

Lượng thông tin được đo như thế nào?

Có thể đo lường một cách khách quan lượng thông tin được không? Các nhà khoa học vẫn chưa thể đưa ra câu trả lời chính xác cho câu hỏi này. Ví dụ, làm thế nào bạn có thể đo lường thông tin có trong các tác phẩm văn học của Pushkin, Lermontov, Dostoevsky. Kết quả quan trọng nhất của lý thuyết thông tin là kết luận sau: Trong những điều kiện nhất định, rất rộng, có thể bỏ qua các đặc điểm định tính của thông tin, biểu thị số lượng của nó dưới dạng một con số và cũng có thể so sánh lượng thông tin chứa trong các nhóm dữ liệu khác nhau. .

Hiện nay, các cách tiếp cận để xác định khái niệm “lượng thông tin” đã trở nên phổ biến, dựa trên thực tế là thông tin chứa trong tin nhắn có thể được giải thích một cách lỏng lẻo theo nghĩa mới lạ hay nói cách khác là làm giảm sự không chắc chắn về kiến ​​thức của chúng ta. về một đồ vật. Những phương pháp này sử dụng các khái niệm toán học xác suấtlogarit

Giả sử bạn cần đoán một số từ một dãy số từ một đến một trăm. Sử dụng công thức Hartley, bạn có thể tính toán lượng thông tin cần thiết cho việc này: I = log 2 100  6,644. Do đó, một thông báo về một số được đoán đúng sẽ chứa một lượng thông tin xấp xỉ bằng 6,644 đơn vị thông tin.

Hãy cho người khác ví dụ về các tin nhắn có khả năng xảy ra như nhau:

1. khi tung đồng xu: “ nó xuất hiện đầu", « đầu rơi xuống";

2. trên trang sách: “ số chữ cái là chẵn", « số chữ cái lẻ".

Bây giờ chúng ta hãy xác định các tin nhắn có xác suất như nhau không? "Người phụ nữ đầu tiên rời khỏi cửa tòa nhà""Người đàn ông sẽ là người đầu tiên rời khỏi cửa tòa nhà". Không thể trả lời câu hỏi này một cách rõ ràng. Tất cả phụ thuộc vào loại tòa nhà mà chúng ta đang nói đến. Ví dụ: nếu đây là ga tàu điện ngầm, thì xác suất ra khỏi cửa trước đối với nam và nữ là như nhau, còn nếu đây là doanh trại quân đội thì đối với nam, xác suất này cao hơn nhiều so với nữ .

Đối với những vấn đề thuộc loại này, nhà khoa học người Mỹ Claude Shannon đã đề xuất vào năm 1948 một công thức khác để xác định lượng thông tin, có tính đến xác suất có thể không bằng nhau của các thông điệp trong tập hợp.

Dễ dàng nhận thấy rằng nếu xác suất p 1 , ..., p N bằng nhau thì mỗi cái đều bằng nhau 1/N, và công thức Shannon trở thành công thức Hartley.

Ngoài hai phương pháp được xem xét để xác định lượng thông tin, còn có những phương pháp khác. Điều quan trọng cần nhớ là bất kỳ kết quả lý thuyết nào cũng chỉ có thể áp dụng được cho một phạm vi trường hợp nhất định, được vạch ra bởi các giả định ban đầu.

Với tư cách là một đơn vị thông tin, Claude Shannon đề xuất lấy một chút (Tiếng Anh. chút - chữ số nhị phân- chữ số nhị phân).

Bit trong lý thuyết thông tin - lượng thông tin cần thiết để phân biệt giữa hai thông báo có khả năng xảy ra như nhau (chẳng hạn như “đầu” - “đuôi”, “chẵn” - “lẻ”, v.v.).

Trong tính toán theo bit được gọi là “phần” nhỏ nhất của bộ nhớ máy tính cần thiết để lưu trữ một trong hai ký tự “0” và “1” được sử dụng để biểu diễn dữ liệu và lệnh bên trong.

Chút- Đơn vị đo quá nhỏ Trong thực tế, đơn vị lớn hơn thường được sử dụng nhiều hơn - byte , bình đẳng tám bit. Chính xác là 8 bit cần thiết để mã hóa bất kỳ ký tự nào trong số 256 ký tự của bảng chữ cái bàn phím máy tính (256 = 2 8).



Thậm chí các đơn vị thông tin dẫn xuất lớn hơn cũng được sử dụng rộng rãi:

· 1 Kilobyte (KB) = 1024 byte = 210 byte,

· 1 Megabyte (MB) = 1024 KB = 220 byte,

· 1 Gigabyte (GB) = 1024 MB = 230 byte.

Gần đây, do khối lượng thông tin được xử lý ngày càng tăng nên các đơn vị dẫn xuất như:

· 1 Terabyte (TB) = 1024 GB = 240 byte,

· 1 Petabyte (PB) = 1024 TB = 250 byte.

Trên mỗi đơn vị thông tin, người ta có thể chọn lượng thông tin cần thiết để phân biệt, chẳng hạn như mười thông điệp có khả năng xảy ra như nhau. Nó sẽ không phải là nhị phân ( chút) và số thập phân ( nói thế) đơn vị thông tin.

Điều quan trọng là phải phân biệt nhiều tiền tố nhị phân với các tiền tố thập phân tương ứng:

“một K” – 1 K=210=1024 từ “một kilo” – 103=1000,

“one M” – 1 M=220=1048576 từ “one mega” – 106=1000000, v.v.

Điều này thường bị lạm dụng bởi các nhà sản xuất thiết bị máy tính, đặc biệt là các nhà sản xuất đĩa từ cứng, khi chỉ ra dung lượng thông tin của họ, họ sử dụng đơn vị đo nhỏ hơn để giá trị kết quả được biểu thị bằng một số lớn (như trong phim hoạt hình nổi tiếng). - “Nhưng ở loài vẹt, tôi dài hơn!” ).

|

Sự đa dạng là điều cần thiết khi truyền tải thông tin. Bạn không thể sơn màu trắng trên nền trắng; chỉ trạng thái là không đủ. Nếu ô nhớ có khả năng chỉ trong một trạng thái (ban đầu) và không có khả năng thay đổi trạng thái dưới tác động bên ngoài, điều này có nghĩa là nó không có khả năng nhận thức và ghi nhớ thông tin. Dung lượng thông tin của một ô như vậy là 0.

Sự đa dạng tối thiểu được đảm bảo bởi sự hiện diện hai Những trạng thái. Nếu một ô nhớ có khả năng, tùy thuộc vào tác động bên ngoài, nhận một trong hai trạng thái, thường được chỉ định là “0” và “1”, thì nó có năng lực thông tin tối thiểu.

Dung lượng thông tin của một ô nhớ, có khả năng ở hai trạng thái khác nhau, được lấy làm đơn vị đo lượng thông tin - 1 bit.

1 chút (chút- viết tắt từ tiếng Anh. bi số nhỏ t- số nhị phân) - đơn vị đo lường năng lực thông tinlượng thông tin, cũng như một đại lượng nữa – entropy thông tin, mà chúng ta sẽ biết sau. Bit, một trong những đơn vị đo lường vô điều kiện nhất. Nếu đơn vị đo chiều dài có thể được đặt tùy ý: cubit, foot, mét, thì đơn vị đo thông tin về cơ bản không thể là đơn vị nào khác.

Ở cấp độ vật lý, các bitô nhớ, tại mỗi thời điểm thuộc một trong hai trạng thái: “ hoặc " 1".

Nếu mỗi điểm của một số hình ảnh chỉ có thể là đen, hoặc trắng, hình ảnh như vậy được gọi là bitmap vì mỗi điểm đại diện cho một ô nhớ có dung lượng 1 bit. Một bóng đèn có thể " đốt cháy", hoặc " đừng đốt" cũng tượng trưng cho bit. Một ví dụ kinh điển minh họa 1 bit thông tin - lượng thông tin thu được khi tung đồng xu - “ chim ưng" hoặc " đuôi”.

Có thể thu được lượng thông tin bằng 1 bit khi trả lời câu hỏi như “ Đúng»/ « KHÔNG" Nếu ban đầu có nhiều hơn hai phương án trả lời thì lượng thông tin nhận được trong một câu trả lời cụ thể sẽ nhiều hơn 1 bit, nếu có ít hơn hai phương án trả lời, tức là. một, thì đây không phải là một câu hỏi mà là một câu khẳng định, do đó, việc thu thập thông tin là không cần thiết, vì tính không chắc chắn KHÔNG.

Dung lượng thông tin của một ô nhớ có khả năng nhận thông tin không thể nhỏ hơn 1 bit, nhưng Số lượngđã nhận thông tin có thể ít hơn 1 bit. Điều này xảy ra khi các lựa chọn trả lời là “có” và “không”. không có khả năng xảy ra như nhau. Ngược lại, sự bất bình đẳng là hệ quả của thực tế là một số thông tin sơ bộ (tiên nghiệm) về vấn đề này đã có sẵn, chẳng hạn như thu được trên cơ sở kinh nghiệm sống trước đây. Vì vậy, trong tất cả các lý do của đoạn trước, cần phải tính đến một lưu ý rất quan trọng: chúng chỉ có giá trị đối với trường hợp có khả năng xảy ra như nhau.

    Một chút thông tin có nghĩa là gì?

    Xác định đơn vị đo thông tin byte.

    Xác định khái niệm bit trong byte.

    Liệt kê các đơn vị thông tin dẫn xuất.

    Sức mạnh của bảng chữ cái là gì?

    Bạn có thể sử dụng công thức nào để tính kích thước của bảng chữ cái?

    Các phương pháp chính để đo lường thông tin là gì?

    Viết công thức nối số sự kiện có xác suất khác nhau và lượng thông tin.

PHỤ LỤC A

VÍ DỤ VẤN ĐỀ (CÓ GIẢI PHÁP)

Ví dụ 1. Sau kỳ thi khoa học máy tính, các điểm (“5”, “4”, “3” hoặc “2”) sẽ được công bố. Bao nhiêu thông tin sẽ được chuyển tải qua thông báo về điểm của sinh viên A, người mới học được một nửa số vé, và thông báo về điểm của sinh viên B, người đã học hết tất cả các vé.

Giải pháp. Kinh nghiệm cho thấy rằng đối với học sinh A, cả bốn đánh giá (sự kiện) đều có khả năng xảy ra như nhau và khi đó lượng thông tin mang theo thông báo đánh giá có thể được tính bằng công thức Hartley:

TÔI= Iog 2 4 = 2 bit.

Theo kết quả quan sát, đối với học sinh B, điểm có khả năng cao nhất là “5” ( R 1 = 1/2), xác suất xếp hạng “4” nhỏ hơn hai lần ( R 2 = 1/4) và xác suất xếp hạng “2” và “3” vẫn ít hơn hai lần ( R 3 =P 4 = 1/8). Vì những sự kiện này có khả năng xảy ra không như nhau nên để tính lượng thông tin chúng ta sử dụng công thức Shannon:

TÔI = - ( 1/2 log 2 l/2+1/4 log 2 l/4+1/8 log 2 l/8+1/8 log 2 l/8)bit= 1,75 bit

(log 2 l/2=-1,log 2 l/4=-2,log 2 l/8=-3).

Trả lời: 2 bit; 1,75 bit.

Ví dụ 2. Có 32 quả bóng trong trống xổ số. Thông điệp về số 17 chứa bao nhiêu thông tin?

Giải pháp. Vì việc rút được bất kỳ quả bóng nào trong số 32 quả bóng đều có xác suất như nhau nên lượng thông tin về một số được rút ra được tìm thấy từ phương trình: 2 TÔI=32. Vì 32=2 5 nên TÔI= 5 bit. (Câu trả lời không phụ thuộc vào số được rút ra).

Trả lời: 5 bit

Ví dụ 3. Để đăng ký trên trang web, người dùng được yêu cầu tạo mật khẩu. Độ dài mật khẩu chính xác là 11 ký tự. Các ký tự được sử dụng là các chữ số thập phân và 12 chữ cái khác nhau trong bảng chữ cái và tất cả các chữ cái được sử dụng theo hai kiểu: cả chữ thường và chữ hoa (quan trọng là chữ cái viết hoa).

Số byte nguyên tối thiểu có thể và giống hệt nhau được phân bổ để lưu trữ từng mật khẩu như vậy trên máy tính, trong khi mã hóa từng ký tự được sử dụng và tất cả các ký tự được mã hóa với số bit giống nhau và tối thiểu có thể.

Xác định dung lượng bộ nhớ cần thiết để lưu trữ 60 mật khẩu (mật khẩu phải chiếm TOÀN BỘ số byte).

Giải pháp.

    theo điều kiện, mật khẩu có thể sử dụng 10 số (0...9) + 12 chữ in hoa + 12 chữ thường, tổng cộng 10+12+12=34 ký tự;

    để mã hóa 34 ký tự bạn cần cấp phát 6 bit bộ nhớ (5 bit là không đủ, chúng chỉ cho phép bạn mã hóa 2 5 = 32 tùy chọn);

    để lưu trữ tất cả 11 ký tự của mật khẩu bạn cần 11*6 = 66 bit;

    vì mật khẩu phải chiếm một số nguyên byte nên chúng tôi lấy giá trị lớn hơn (chính xác hơn là không nhỏ hơn) gần nhất là bội số của 8: đây là 72 = 9*8; nghĩa là, một mật khẩu chiếm 9 byte;

    do đó, 60 mật khẩu chiếm 9*60 = 540 byte.

Trả lời: 540 byte.

Ví dụ 4. Cơ sở dữ liệu lưu trữ các bản ghi chứa thông tin về sinh viên:

<Фамилия>– 16 ký tự: chữ cái tiếng Nga (đầu tiên viết hoa, còn lại viết thường);

<Имя>– 12 ký tự: chữ cái tiếng Nga (đầu tiên viết hoa, còn lại viết thường);

<Отчество>– 16 ký tự: chữ cái tiếng Nga (đầu tiên viết hoa, còn lại viết thường);

<Год рождения>– số từ 1960 đến 1997.

Mỗi trường được viết bằng cách sử dụng số bit ít nhất có thể. Xác định số byte tối thiểu (số nguyên) cần thiết để mã hóa một mục nhập nếu các chữ cái eeđược coi là giống hệt nhau.

Giải pháp.

    vì vậy, bạn cần xác định kích thước tối thiểu có thể tính bằng bit cho từng trường trong số bốn trường và cộng chúng lại;

    Được biết, các chữ cái đầu tiên của tên, họ và tên đệm luôn được viết hoa, vì vậy bạn có thể lưu chúng dưới dạng chữ thường và chỉ viết hoa khi hiển thị trên màn hình;

    Vì vậy, đối với các trường ký tự, chỉ cần sử dụng bảng chữ cái gồm 32 ký tự là đủ (các chữ cái viết thường trong tiếng Nga, “e” và “ё” giống nhau, không cần khoảng trắng);

    để mã hóa mỗi ký tự của bảng chữ cái 32 ký tự, cần 5 bit (32=2 5), vì vậy để lưu trữ họ, tên đệm và họ bạn cần (16+12+16)*5=220 bit;

    có 38 lựa chọn về năm sinh nên bạn cần cấp 6 bit cho năm sinh đó (2 6 =64 ≥38);

    do đó, cần có tổng cộng 226 bit hoặc 29 byte.

Trả lời: 29 byte.

Ví dụ 5. Văn bản có 150 trang; mỗi trang có 40 dòng, mỗi dòng có 60 ký tự (dùng bảng chữ cái 256 ký tự để ghi văn bản). Tài liệu chứa bao nhiêu thông tin tính bằng MB?

Giải pháp. Dung lượng của bảng chữ cái là 256 ký tự, do đó, một ký tự mang 1 byte thông tin. Điều này có nghĩa là trang chứa 40·60 = 2400 byte thông tin. Khối lượng của tất cả thông tin trong tài liệu (theo các đơn vị khác nhau):

2400·150 = 360.000 byte.

360000/1024 = 351,6 KB.

351,5625/1024 = 0,3 MB.

Trả lời: 0,3 MB.

Ví dụ 6 . Sức mạnh của bảng chữ cái dùng để viết tin nhắn chứa 2048 ký tự (một trang văn bản) là bao nhiêu nếu kích thước của nó là 1,25 KB?

Giải pháp. Hãy dịch thông điệp thông tin thành bit:

1,25*1024*8=10240 bit.

Hãy xác định số bit trên mỗi ký tự:

10240:2048=5 bit.

Sử dụng công thức tính lũy thừa của bảng chữ cái, chúng ta xác định số lượng ký tự trong bảng chữ cái:

N=2 Tôi=2 5 =32 ký tự.

Trả lời: 32 ký tự.