Một chút thông tin có nghĩa là gì? Bách khoa toàn thư lớn về dầu khí. Lượng thông tin được đo như thế nào?

Báo cáo về công việc trong phòng thí nghiệm

KHOA HỌC MÁY TÍNH

Khóa 1 ZEE

Hoàn thành

Baginsky M.N.

Moysyuk A.V.

Đã kiểm tra

Kostyukevich V.M.

Petrozavodsk 2015

1.1. Thuật ngữ " Tin học"và nguồn gốc của nó là gì?. 3

1.2. Những lĩnh vực kiến ​​thức và hoạt động hành chính, kinh tế nào đã được chính thức gán cho khái niệm “khoa học máy tính” từ năm 1978? 3

1.3. Những lĩnh vực hoạt động nào của con người và khoa học máy tính ảnh hưởng đến chúng ở mức độ nào? 3

1.4. Kể tên các thành phần chính của khoa học máy tính và các hướng ứng dụng chính của nó. 3

1.5. Khái niệm “thông tin” theo nghĩa hàng ngày, khoa học tự nhiên và kỹ thuật có nghĩa là gì? 4

1.6. Cho ví dụ về việc biết sự thật và biết các quy tắc. Kể tên những sự kiện mới và những quy tắc mới mà bạn đã học được hôm nay. 5

1.7. Một người nhận được thông tin từ ai (hoặc cái gì)? Thông tin được chuyển đến ai? 5

1.8. Một người lưu trữ thông tin ở đâu và như thế nào? 5

1.9. Để truyền tải thông điệp cần bổ sung thêm những gì vào hệ thống “nguồn thông tin - nơi tiếp nhận thông tin”? 6

1.10. Những loại hành động nào một người thực hiện với thông tin? 6

1.11. Cho ví dụ về các tình huống trong đó có thông tin. 6

1.12. Cho ví dụ về quá trình xử lý thông tin của con người. Kết quả của quá trình xử lý này là gì? 7

1.13. Danh sách tài liệu tham khảo………………………..17

1.1. Thuật ngữ " Tin học"và nguồn gốc của nó là gì?

Thuật ngữ " Tin học" (tiếng Pháp informatique) xuất phát từ từ tiếng Pháp thông tin ( thông tin) và tự động hóa ( tự động hóa) và có nghĩa đen là “tự động hóa thông tin

Khoa học máy tính dựa trên việc sử dụng Thiết bị máy tính một ngành nghiên cứu cấu trúc và các đặc tính chung của thông tin, cũng như các mô hình và phương pháp tạo, lưu trữ, tìm kiếm, chuyển đổi, truyền tải và ứng dụng thông tin trong nhiều lĩnh vực khác nhau hoạt động của con người.

1.2. Những lĩnh vực kiến ​​thức và hoạt động hành chính, kinh tế nào đã được chính thức gán cho khái niệm “khoa học máy tính” từ năm 1978

Năm 1978, hội nghị khoa học quốc tế chính thức gán khái niệm “khoa học máy tính” cho các lĩnh vực liên quan đến phát triển, sáng tạo, sử dụng và bảo trì hậu cần các hệ thống xử lý thông tin, bao gồm cả máy tính và các thiết bị của chúng. phần mềm, cũng như các khía cạnh tổ chức, thương mại, hành chính và chính trị xã hội của tin học hóa - thực hiện hàng loạt công nghệ máy tính trong mọi lĩnh vực của đời sống con người.

1.3. Những lĩnh vực hoạt động nào của con người và khoa học máy tính ảnh hưởng đến chúng ở mức độ nào?

Vai trò của khoa học máy tính đối với sự phát triển của xã hội là vô cùng to lớn. Sự khởi đầu của một cuộc cách mạng trong lĩnh vực tích lũy, truyền tải và xử lý thông tin gắn liền với nó. Cuộc cách mạng này, nối tiếp các cuộc cách mạng trong việc làm chủ vật chất và năng lượng, ảnh hưởng và biến đổi căn bản không chỉ lĩnh vực sản xuất vật chất mà còn cả lĩnh vực trí tuệ, tinh thần của đời sống

1.4. Kể tên các thành phần chính của khoa học máy tính và các hướng ứng dụng chính của nó.

Tin học - toàn diện kỷ luật khoa học Với phạm vi rộng nhất các ứng dụng. Cô ấy lĩnh vực ưu tiên:

Phát triển hệ thống máy tính và phần mềm;

Lý thuyết thông tin, nghiên cứu các quá trình liên quan đến việc truyền, tiếp nhận, chuyển đổi và lưu trữ thông tin;

Mô hình toán học, phương pháp toán tính toán và ứng dụng và ứng dụng của chúng vào nghiên cứu cơ bản và ứng dụng trong khu vực khác nhau kiến thức;

phương pháp trí tuệ nhân tạo, mô hình hóa các phương pháp tư duy logic và phân tích trong hoạt động trí tuệ của con người (suy luận logic, học tập, hiểu lời nói, nhận thức trực quan, trò chơi, v.v.);

Phân tích hệ thống, nghiên cứu các công cụ phương pháp được sử dụng để chuẩn bị và biện minh cho các quyết định về vấn đề phức tạp có tính chất khác nhau;

Tin sinh học, nghiên cứu các quá trình thông tin trong hệ thống sinh học;

Tin học xã hội, nghiên cứu các quá trình tin học hóa xã hội;

phương pháp đô họa may tinh, hoạt hình, đa phương tiện;

Hệ thống và mạng viễn thông, kể cả mạng toàn cầu mạng máy tính, đoàn kết toàn nhân loại thành một cộng đồng thông tin duy nhất;

Một loạt các ứng dụng bao gồm sản xuất, khoa học, giáo dục, y học, thương mại, nông nghiệp và tất cả các loại hoạt động kinh tế và xã hội khác.

1.5. Khái niệm “thông tin” theo nghĩa hàng ngày, khoa học tự nhiên và kỹ thuật có nghĩa là gì?

Thuật ngữ “thông tin” xuất phát từ từ Latinh"informatio", có nghĩa là thông tin, giải thích, trình bày. Mặc dù thuật ngữ này được sử dụng rộng rãi nhưng khái niệm thông tin vẫn là một trong những vấn đề gây tranh cãi nhất trong khoa học. Hiện nay, khoa học đang cố gắng tìm ra các đặc tính và mô hình chung vốn có trong khái niệm thông tin nhiều mặt, nhưng cho đến nay khái niệm này phần lớn vẫn mang tính trực quan và nhận được nội dung ngữ nghĩa khác nhau trong các nhánh hoạt động khác nhau của con người:

Trong cuộc sống hàng ngày, thông tin là bất kỳ dữ liệu hoặc thông tin nào mà ai đó quan tâm. Ví dụ: tin nhắn về bất kỳ sự kiện nào, về hoạt động của ai đó, v.v. "Thông báo" theo nghĩa này có nghĩa là "truyền đạt điều gì đó trước đây chưa biết";

Trong công nghệ, thông tin được hiểu là những thông điệp được truyền đi dưới dạng dấu hiệu, tín hiệu;

Trong điều khiển học, thông tin có nghĩa là một phần kiến ​​thức được sử dụng để định hướng, hành động tích cực, quản lý, tức là nhằm bảo tồn, cải tiến, phát triển hệ thống

1.6. Cho ví dụ về việc biết sự thật và biết các quy tắc. Kể tên những sự kiện mới và những quy tắc mới mà bạn đã học được hôm nay.

1.7. Một người nhận được thông tin từ ai (hoặc cái gì)? Thông tin được chuyển đến ai?

Thông tin được truyền dưới dạng tin nhắn từ một số nguồn thông tin đến người nhận thông qua kênh liên lạc giữa chúng. Nguồn gửi tin nhắn được truyền đi, được mã hóa trong tín hiệu truyền đi. Tín hiệu này được gửi qua một kênh liên lạc. Kết quả là tín hiệu nhận được sẽ xuất hiện ở máy thu, tín hiệu này được giải mã và trở thành tin nhắn nhận được.

liên kết

NGUỒN ------------- BỘ NHẬN

1. Một bản tin chứa thông tin dự báo thời tiết được truyền đến người nhận (người xem TV) từ nguồn - nhà khí tượng học - thông qua kênh liên lạc - thiết bị truyền hình và TV.

2. Một sinh vật, với các giác quan (mắt, tai, da, lưỡi, v.v.) nhận biết thông tin từ thế giới bên ngoài, xử lý nó thành một trình tự nhất định xung thần kinh, truyền xung dọc theo các sợi thần kinh, lưu trữ trong trí nhớ dưới dạng trạng thái của các cấu trúc thần kinh của não, tái tạo dưới dạng tín hiệu âm thanh, các chuyển động, v.v. được sử dụng trong quá trình sống của mình.

Việc truyền tải thông tin qua các kênh truyền thông thường đi kèm với hiện tượng nhiễu, gây biến dạng, mất mát thông tin.

1.8. Một người lưu trữ thông tin ở đâu và như thế nào?

Văn bản, hình vẽ, hình vẽ, ảnh chụp;

Tín hiệu ánh sáng hoặc âm thanh;

Sóng radio;

xung điện và thần kinh;

hồ sơ từ tính;

Cử chỉ và nét mặt;

Mùi và vị;

Nhiễm sắc thể, qua đó các đặc điểm và tính chất của sinh vật được di truyền, v.v.

1.9. Để truyền tải thông điệp cần bổ sung thêm những gì vào hệ thống “nguồn thông tin - nơi tiếp nhận thông tin”?

Thông tin được truyền dưới dạng tin nhắn từ một số nguồn thông tin đến người nhận thông qua kênh liên lạc giữa chúng.

1.10. Những loại hành động nào một người thực hiện với thông tin?

Thông tin có thể là:

1. tạo;

2. truyền tải

3. nhận thức

4. sử dụng

5. nhớ

6. chấp nhận

7. sao chép

8. chuyển đổi

9. kết hợp

10. quá trình

11. chia thành nhiều phần

12. đơn giản hóa

13. cửa hàng

14. tìm kiếm

15. đo lường

16. tiêu diệt

1.11. Cho ví dụ về các tình huống trong đó thông tin

a) một cuốn sách được tạo ra

b) sao chép: máy photocopy

c) truyền đi: đài phát thanh

d) đã xử lý: chương trình máy tính

d) nhận thức: mắt, tai

f) bị phá hủy: nhiễu tín hiệu vô tuyến

g) đã nhớ: bộ não con người

h) đo được: bit

i) đã tìm kiếm: phương tiện truyền thông internet

j) được chấp nhận: tải phim từ Internet

k) chia thành nhiều phần: một cuốn sách gồm hai tập

1.12. Cho ví dụ về quá trình xử lý thông tin của con người. Kết quả của quá trình xử lý này là gì?

A) Thu thập thông tin trong thư viện, B) phân tích và lựa chọn những thông tin cần thiết trong) viết một bài luận về chủ đề của bạn.

1.13. Cho ví dụ về thông tin:

a) đáng tin cậy và không đáng tin cậy

b) đầy đủ và không đầy đủ

Trời có tuyết (thông tin không đầy đủ).

· c) có giá trị và có giá trị thấp;

Tỷ giá đồng euro hôm nay là 40 rúp (thông tin có giá trị).

Hôm nay ở Tokyo trời mưa (thông tin có giá trị thấp).

d) kịp thời và không kịp thời

Một cơn giông bắt đầu (thông tin kịp thời).

Hôm qua ở cửa hàng có đợt giảm giá (thông tin muộn).

e) dễ hiểu và không thể hiểu được

Thông tin rõ ràng- ở Nga.

Thông tin gây nhầm lẫn là bằng tiếng Trung Quốc.

· f) có thể tiếp cận và không thể tiếp cận để đồng hóa;

Một người biết tiếng Anh được tặng một cuốn sách viết bằng tiếng Anh để đọc. tiếng anh– thông tin sẽ có sẵn cho anh ta, nhưng nếu anh ta không biết tiếng Anh thì thông tin sẽ không có sẵn.

g) ngắn và dài

Hành tây là một loại rau.

Hành tây là một loại cây trồng trong vườn hoặc cây dại thuộc họ hoa huệ, có vị cay nồng và lá hình ống ăn được.

1.14. Kể tên các hệ thống thu thập và xử lý thông tin trong cơ thể con người.

Não. Các cơ quan khứu giác, xúc giác, thính giác, thị giác.

1.15. Cho ví dụ về các thiết bị và hệ thống kỹ thuật được thiết kế để thu thập và xử lý thông tin.

Máy quay video, máy ảnh, máy ghi âm, máy tính, v.v.

1.16. Điều gì quyết định nội dung thông tin của tin nhắn mà một người nhận được?

Một tin nhắn mang tính thông tin nếu nó chứa thông tin mới và dễ hiểu đối với người nhận nó.

1.17. Tại sao việc đánh giá lượng thông tin trong một tin nhắn lại thuận tiện hơn không phải bằng mức độ hiểu biết ngày càng tăng về đối tượng mà bằng mức độ giảm đi mức độ không chắc chắn về kiến ​​thức của chúng ta về đối tượng đó?

Lượng thông tin phụ thuộc vào tính mới của thông tin về một hiện tượng mà người tiếp nhận thông tin quan tâm. Nói cách khác, sự không chắc chắn (tức là kiến ​​thức chưa đầy đủ) về vấn đề mà chúng ta quan tâm sẽ giảm đi khi nhận được thông tin. Nếu nhờ nhận được tin nhắn mà đạt được sự rõ ràng hoàn toàn trong vấn đề này(tức là sự không chắc chắn sẽ biến mất), họ nói rằng đã nhận được thông tin toàn diện. Điều này có nghĩa là nhu cầu có được thông tin thêm không về chủ đề này Ngược lại, nếu sau khi nhận được tin nhắn, độ không chắc chắn vẫn giữ nguyên (thông tin được báo cáo đã được biết hoặc không liên quan) thì không nhận được thông tin nào (không có thông tin).

1.18. Đơn vị đo lượng thông tin được xác định như thế nào?

1 bit – lượng thông tin trong một tin nhắn làm giảm đi 2 lần tính không chắc chắn về kiến ​​thức của con người.

1.19. Trong những trường hợp nào và theo công thức nào bạn có thể tính được lượng thông tin có trong một tin nhắn?

Các phương pháp xác định lượng thông tin. Công thức Hartley và Shannon .

Kỹ sư người Mỹ R. Hartley vào năm 1928 đã coi quá trình thu thập thông tin là chọn một tin nhắn từ một tập hữu hạn được xác định trước gồm N tin nhắn có khả năng xảy ra như nhau và lượng thông tin tôi chứa trong tin nhắn đã chọn được xác định là logarit nhị phân của N.

Giả sử bạn cần đoán một số từ một dãy số từ một đến một trăm. Sử dụng công thức Hartley, bạn có thể tính toán lượng thông tin cần thiết cho việc này: I = log 2 100  6,644. Do đó, một thông báo về một số được đoán đúng sẽ chứa một lượng thông tin xấp xỉ bằng 6,644 đơn vị thông tin.

Hãy cho người khác ví dụ về các tin nhắn có khả năng xảy ra như nhau:

1. khi tung đồng xu: "Nó xuất hiện", "đầu rơi";

2. trên trang sách: "số chữ cái là số chẵn", "số chữ cái là số lẻ".

Bây giờ chúng ta hãy xác định các tin nhắn có xác suất như nhau không? "Người phụ nữ đầu tiên rời khỏi cửa tòa nhà""Người đàn ông sẽ là người đầu tiên rời khỏi cửa tòa nhà". Không thể trả lời câu hỏi này một cách rõ ràng. Tất cả phụ thuộc vào tòa nhà nào Chúng ta đang nói về. Ví dụ: nếu đây là ga tàu điện ngầm, thì xác suất ra khỏi cửa trước đối với nam và nữ là như nhau, còn nếu đây là doanh trại quân đội thì đối với nam, xác suất này cao hơn nhiều so với nữ .

Đối với những vấn đề thuộc loại này, nhà khoa học Mỹ Claude Shannonđề xuất vào năm 1948 một công thức khác để xác định lượng thông tin, có tính đến xác suất không bằng nhau của các thông điệp trong tập hợp.

Dễ dàng nhận thấy rằng nếu xác suất p 1 , ..., p N 1/N

Ngoài hai phương pháp được xem xét để xác định lượng thông tin, còn có những phương pháp khác. Điều quan trọng cần nhớ là bất kỳ kết quả lý thuyết nào cũng chỉ có thể áp dụng được cho một phạm vi trường hợp nhất định, được vạch ra bởi các giả định ban đầu.

1.20. Tại sao số 2 được lấy làm cơ số của logarit trong công thức Hartley?

Bit, đơn vị thông tin, có 2 trạng thái.

1.21. Trong điều kiện nào công thức Shannon chuyển thành công thức Hartley?

Nếu xác suất p 1 , ..., p N bằng nhau thì mỗi cái đều bằng nhau 1/N, và công thức Shannon trở thành công thức Hartley.

1.22. Điều gì định nghĩa thuật ngữ "bit" trong lý thuyết thông tin và công nghệ máy tính?

Chút trong lý thuyết thông tin - lượng thông tin cần thiết để phân biệt giữa hai thông điệp có khả năng xảy ra như nhau (chẳng hạn như “ngửa” - “đuôi”, “chẵn” - “lẻ”, v.v.).

Trong điện toán Bit là “phần” nhỏ nhất của bộ nhớ máy tính cần thiết để lưu trữ một trong hai ký tự “0” và “1” được sử dụng để biểu diễn dữ liệu và lệnh bên trong.

1.23. Cho ví dụ về các tin nhắn có nội dung thông tin có thể được xác định rõ ràng.

Dự báo thời tiết ngày mai: có mây rải rác, có tuyết nhẹ, có thể có sương mù; ban đêm -11..13°, ban ngày -9..-11°, gió Tây ôn hòa.

Tỷ giá đồng euro ngày mai sẽ là 40 rúp, 13 kopecks.

1.24. Cho ví dụ về tin nhắn chứa một (hai, ba) bit thông tin.

ví dụ 1 : Bạn có tung đồng xu và tự hỏi điều gì sẽ xuất hiện: mặt ngửa hay mặt sấp?

Giải pháp: Có hai lựa chọn khả thi kết quả tung đồng xu. Cả hai tùy chọn này đều không có lợi thế hơn tùy chọn kia ( có thể xảy ra như nhau). Trước khi tung đồng xu kiến thức không chắc chắn kết quả là bằng hai.

Sau khi thực hiện hành động, độ không chắc chắn giảm đi 2 lần. Chúng tôi đã nhận được 1 chút thông tin.

Trả lời: Kết quả của việc tung đồng xu là 1 chút thông tin.

Ví dụ 2 : Một học sinh có thể nhận được một trong bốn điểm trong một kỳ thi: 5, 4, 3, 2. Học sinh đó học không đồng đều và có khả năng nhận được bất kỳ điểm nào như nhau. Sau khi vượt qua kỳ thi, đến câu hỏi: “Bạn đã nhận được gì?” - trả lời: “Bốn.” Có bao nhiêu thông tin được chứa trong câu trả lời của anh ta?

Giải pháp: Nếu khó trả lời ngay câu hỏi, bạn có thể đoán đánh giá bằng cách đặt những câu hỏi chỉ có thể trả lời “có” hoặc “không”, tức là. việc tìm kiếm được thực hiện bằng cách loại bỏ một nửa số lựa chọn.

Chúng ta sẽ đặt ra các câu hỏi sao cho mỗi câu trả lời giảm đi một nửa số phương án lựa chọn và do đó mang lại 1 bit thông tin.

1 câu hỏi: -Điểm có cao hơn điểm C không? - ĐÚNG

(số lượng tùy chọn đã giảm một nửa.) Đã nhận được 1 bit thông tin.

Câu 2: -Bạn được điểm A phải không? - KHÔNG

(một tùy chọn đã được chọn từ hai tùy chọn còn lại: điểm là “bốn”.) Nhận được thêm 1 bit.

Tổng cộng chúng ta có 2 bit.

Trả lời: Thông báo rằng một trong các sự kiện đã xảy ra bốn đều có thể xảy ra như nhau sự kiện mang theo 2 bit thông tin.

Ví dụ 3: Tủ sách có tám kệ. Cuốn sách có thể được đặt trên bất kỳ trong số họ. Tin nhắn chứa bao nhiêu thông tin về vị trí của cuốn sách?

1 câu hỏi: - Cuốn sách có nằm phía trên kệ thứ tư không? - KHÔNG (1, 2, 3, 4) - 1 bit

Câu 2: - Cuốn sách ở dưới kệ thứ ba phải không? - CÓ (1, 2) - 1 chút

Câu 3: - Cuốn sách có ở kệ thứ hai không? - KHÔNG (1) - 1 chút


Thông tin liên quan.


Bài giảng 2. Thuộc tính của thông tin. Lượng thông tin. Khái niệm về thuật toán.

Bản tóm tắt ngắn gọn

Bài giảng thảo luận các khái niệm về khoa học máy tính và thông tin hóa. Nó mô tả cách thông tin được truyền đi và nó tồn tại ở dạng nào.

Câu hỏi kiểm soát

1. Khoa học Máy tính nghiên cứu những gì?

2. Thông tin có nghĩa là gì?

3. Cái gì được gọi là quá trình thông tin?

4. Xác định phương tiện kỹ thuật là gì.

5. Xác định phần mềm là gì và nó bao gồm những gì.

6. Thuật ngữ Brainware có nghĩa là gì?

7. Xác định đối tượng thông tin.

8. Cho ví dụ về cách gửi tin nhắn.

9. Mô tả quá trình truyền tin nhắn.


Bài giảng 2. Thuộc tính của thông tin. Lượng thông tin. Khái niệm về thuật toán.

Bài giảng thảo luận Nghĩa tổng quát khái niệm về thuật toán, lượng thông tin, thông tin có những đặc tính gì. Các khái niệm về tin học hóa xã hội

Mục đích của bài giảng: Hiểu cách đo lường lượng thông tin. Bài giảng thảo luận về các khái niệm về bit và byte thông tin.

Thông tin có những đặc tính gì?

Thuộc tính thông tin:

Thông tin có độ tin cậy cao, nếu nó phản ánh đúng tình hình thực tế. Thông tin không chính xác có thể dẫn đến hiểu lầm hoặc đưa ra quyết định sai lầm.

Thông tin đáng tin cậy Theo thời gian, nó có thể trở nên không đáng tin cậy, vì nó có đặc tính trở nên lỗi thời, tức là nó không còn phản ánh tình trạng thực sự của sự việc.

Thông tin đã đầy đủ nếu nó đủ để hiểu và đưa ra quyết định. Cả thông tin không đầy đủ và dư thừa đều cản trở việc ra quyết định hoặc có thể dẫn đến sai sót.

Độ chính xác của thông tinđược xác định bởi mức độ gần gũi của nó với trạng thái thực của đối tượng, quá trình, hiện tượng, v.v.

Giá trị của thông tin phụ thuộc vào tầm quan trọng của nó trong việc giải quyết vấn đề, cũng như mức độ nó sẽ được sử dụng thêm trong bất kỳ loại hoạt động nào của con người.

Chỉ những thông tin nhận được kịp thời mới có thể mang lại lợi ích như mong đợi. Cả việc trình bày thông tin quá sớm (khi nó chưa thể được tiếp thu) và sự chậm trễ của nó đều là điều không mong muốn.

Nếu thông tin có giá trị và kịp thời được thể hiện một cách không rõ ràng, nó có thể trở nên vô dụng.

Thông tin trở nên dễ hiểu nếu nó được thể hiện bằng ngôn ngữ được sử dụng bởi những người mà thông tin này hướng tới.

Thông tin phải được trình bày dưới dạng dễ tiếp cận (theo mức độ nhận thức). Vì vậy, những câu hỏi giống nhau được trình bày theo những cách khác nhau trong sách giáo khoa và ấn phẩm khoa học ở trường.

Thông tin về cùng một vấn đề có thể được trình bày ngắn gọn (ngắn gọn, không có chi tiết không quan trọng) hoặc rộng rãi (chi tiết, dài dòng). Tính chính xác của thông tin là cần thiết trong sách tham khảo, bách khoa toàn thư, sách giáo khoa và tất cả các loại hướng dẫn.

Lượng thông tin được đo như thế nào?

Có thể đo lường một cách khách quan lượng thông tin được không? Các nhà khoa học vẫn chưa thể đưa ra câu trả lời chính xác cho câu hỏi này. Ví dụ, làm thế nào bạn có thể đo lường thông tin có trong các tác phẩm văn học của Pushkin, Lermontov, Dostoevsky. Kết quả quan trọng nhất của lý thuyết thông tin là kết luận sau: Trong những điều kiện nhất định, rất rộng, có thể bỏ qua các đặc điểm định tính của thông tin, biểu thị số lượng của nó dưới dạng một con số và cũng có thể so sánh lượng thông tin chứa trong các nhóm dữ liệu khác nhau. .

Hiện nay, các cách tiếp cận để xác định khái niệm “lượng thông tin” đã trở nên phổ biến, dựa trên thực tế là thông tin chứa trong tin nhắn có thể được giải thích một cách lỏng lẻo theo nghĩa mới lạ hay nói cách khác là làm giảm sự không chắc chắn về kiến ​​thức của chúng ta. về một đồ vật. Những cách tiếp cận này sử dụng khái niệm toán học xác suấtlogarit

Giả sử bạn cần đoán một số từ một dãy số từ một đến một trăm. Sử dụng công thức Hartley, bạn có thể tính toán lượng thông tin cần thiết cho việc này: I = log 2 100  6,644. Do đó, một thông báo về một số được đoán đúng sẽ chứa một lượng thông tin xấp xỉ bằng 6,644 đơn vị thông tin.

Hãy cho người khác ví dụ về các tin nhắn có khả năng xảy ra như nhau:

1. khi tung đồng xu: “ nó xuất hiện đầu", « đầu rơi xuống";

2. trên trang sách: “ số chữ cái là chẵn", « số chữ cái lẻ".

Bây giờ chúng ta hãy xác định các tin nhắn có xác suất như nhau không? "Người phụ nữ đầu tiên rời khỏi cửa tòa nhà""Người đàn ông sẽ là người đầu tiên rời khỏi cửa tòa nhà". Không thể trả lời câu hỏi này một cách rõ ràng. Tất cả phụ thuộc vào loại tòa nhà mà chúng ta đang nói đến. Ví dụ: nếu đây là ga tàu điện ngầm, thì xác suất ra khỏi cửa trước đối với nam và nữ là như nhau, còn nếu đây là doanh trại quân đội thì đối với nam, xác suất này cao hơn nhiều so với nữ .

Đối với những vấn đề thuộc loại này, nhà khoa học người Mỹ Claude Shannon đã đề xuất vào năm 1948 một công thức khác để xác định lượng thông tin, có tính đến xác suất có thể không bằng nhau của các thông điệp trong tập hợp.

Dễ dàng nhận thấy rằng nếu xác suất p 1 , ..., p N bằng nhau thì mỗi cái đều bằng nhau 1/N, và công thức Shannon trở thành công thức Hartley.

Ngoài hai phương pháp được xem xét để xác định lượng thông tin, còn có những phương pháp khác. Điều quan trọng cần nhớ là bất kỳ kết quả lý thuyết nào cũng chỉ có thể áp dụng được cho một phạm vi trường hợp nhất định, được vạch ra bởi các giả định ban đầu.

Với tư cách là một đơn vị thông tin, Claude Shannon đề xuất lấy một chút (Tiếng Anh. chút - chữ số nhị phân - chữ số nhị phân).

Bit trong lý thuyết thông tin - lượng thông tin cần thiết để phân biệt giữa hai thông báo có khả năng xảy ra như nhau (chẳng hạn như “ngửa” - “đuôi”, “chẵn” - “lẻ”, v.v.).

Trong tính toán theo bit được gọi là “phần” nhỏ nhất của bộ nhớ máy tính cần thiết để lưu trữ một trong hai ký tự “0” và “1” được sử dụng để biểu diễn dữ liệu và lệnh bên trong.

Chút- Đơn vị đo quá nhỏ Trong thực tế, đơn vị lớn hơn thường được sử dụng nhiều hơn - byte , bình đẳng tám bit. Chính xác là 8 bit cần thiết để mã hóa bất kỳ ký tự nào trong số 256 ký tự của bảng chữ cái bàn phím máy tính (256 = 2 8).



Thậm chí các đơn vị thông tin dẫn xuất lớn hơn cũng được sử dụng rộng rãi:

· 1 Kilobyte (KB) = 1024 byte = 210 byte,

· 1 Megabyte (MB) = 1024 KB = 220 byte,

· 1 Gigabyte (GB) = 1024 MB = 230 byte.

TRONG Gần đây Do sự gia tăng khối lượng thông tin được xử lý, các đơn vị dẫn xuất như vậy đang được sử dụng như:

· 1 Terabyte (TB) = 1024 GB = 240 byte,

· 1 Petabyte (PB) = 1024 TB = 250 byte.

Trên mỗi đơn vị thông tin, người ta có thể chọn lượng thông tin cần thiết để phân biệt, chẳng hạn như mười thông điệp có khả năng xảy ra như nhau. Nó sẽ không phải là nhị phân ( chút) và số thập phân ( nói thế) đơn vị thông tin.

Điều quan trọng là phải phân biệt nhiều tiền tố nhị phân với các tiền tố thập phân tương ứng:

“một K” – 1 K=210=1024 từ “một kilo” – 103=1000,

“one M” – 1 M=220=1048576 từ “one mega” – 106=1000000, v.v.

Điều này thường bị các nhà sản xuất thiết bị máy tính lạm dụng, đặc biệt là nhà sản xuất cứngđĩa từ, khi biểu thị dung lượng thông tin của chúng, sử dụng đơn vị đo nhỏ hơn để biểu thị giá trị kết quả một số lượng lớn(như trong phim hoạt hình nổi tiếng - “Nhưng với loài vẹt, tôi dài hơn!”).

Thông tin đề cập đến các khái niệm cơ bản, chưa được xác định của khoa học máy tính. Tuy nhiên, ý nghĩa của khái niệm này cần phải được làm rõ. Chúng ta hãy cố gắng xem xét khái niệm này từ các vị trí khác nhau.

Thuật ngữ thông tin bắt nguồn từ từ Latin thông tin, nghĩa là thông tin, giải thích, trình bày. Hiện nay, khoa học đang cố gắng tìm ra các đặc tính và mô hình chung vốn có trong khái niệm thông tin nhiều mặt, nhưng cho đến nay khái niệm này phần lớn vẫn mang tính trực quan và nhận được nội dung ngữ nghĩa khác nhau trong các nhánh hoạt động khác nhau của con người:

    Trong cuộc sống hàng ngày, thông tin là bất kỳ dữ liệu, thông tin, kiến ​​thức nào mà ai đó quan tâm. Ví dụ: tin nhắn về bất kỳ sự kiện nào, về hoạt động của ai đó, v.v.;

    trong công nghệ, thông tin được hiểu là những thông điệp được truyền đi dưới dạng dấu hiệu hoặc tín hiệu (trong trường hợp này có nguồn phát thông điệp, người nhận (nhận) thông điệp, kênh liên lạc);

    trong điều khiển học, thông tin được hiểu là một phần kiến ​​​​thức được sử dụng để định hướng, hành động tích cực, kiểm soát, tức là. nhằm bảo tồn, cải tiến và phát triển hệ thống;

    Trong lý thuyết thông tin, thông tin được hiểu là thông tin về các sự vật, hiện tượng môi trường, các tham số, tính chất và điều kiện của chúng, làm giảm mức độ không chắc chắn và kiến ​​thức không đầy đủ về chúng.

Thông tin có thể tồn tại dưới dạng:

    văn bản, hình vẽ, hình vẽ, ảnh chụp;

    tín hiệu ánh sáng hoặc âm thanh;

    sóng radio;

    xung điện và thần kinh;

    ghi âm từ tính;

    cử chỉ và nét mặt;

    mùi và cảm giác;

    nhiễm sắc thể, qua đó các đặc tính và tính chất của sinh vật được di truyền, v.v.

Thuộc tính thông tin

Thuộc tính của thông tin (theo quan điểm của cách tiếp cận định nghĩa hàng ngày);

    mức độ liên quan - khả năng thông tin đáp ứng nhu cầu của người tiêu dùng;

    sự đầy đủ;

    tính kịp thời;

    độ tin cậy;

    khả dụng;

    bảo vệ;

    Công thái học là đặc tính đặc trưng cho sự tiện lợi của hình thức hoặc khối lượng thông tin theo quan điểm của một người tiêu dùng nhất định.

Từ quan điểm này, các thuộc tính của thông tin:

    khả năng ghi nhớ;

    khả năng chuyển nhượng;

    Khả năng tái lập

    khả năng chuyển đổi

    khả năng xóa được.

Thuộc tính cơ bản của thông tin là khả năng chuyển đổi. Nó có nghĩa là thông tin có thể thay đổi cách thức và hình thức tồn tại của nó. Khả năng sao chép là một loại chuyển đổi thông tin trong đó số lượng của nó không thay đổi. TRONG trường hợp chung lượng thông tin trong quá trình chuyển đổi thay đổi nhưng không thể tăng lên. Hình thức thông tin cao nhất được biểu hiện trong quản lý trong các hệ thống xã hội là kiến ​​thức.

Quy trình thông tin

Thông tin được hiểu là một quá trình liên quan đến các hoạt động nhất định về thông tin, trong đó nội dung thông tin hoặc hình thức trình bày thông tin có thể thay đổi.

Trong khoa học máy tính, các quy trình như vậy bao gồm:

nhận,

kho,

chuyển giao, truyền tải

xử lý,

sử dụng thông tin.

Xác định lượng thông tin

Phương pháp xác suất để đo lường thông tin

Bất kỳ thông tin nào cũng có thể được coi là làm giảm sự không chắc chắn trong kiến ​​​​thức của chúng ta về thế giới xung quanh (trong lý thuyết thông tin, người ta thường nói về việc giảm thiểu sự không chắc chắn chứ không phải về việc tăng lượng kiến ​​​​thức). Tính ngẫu nhiên của một sự kiện có nghĩa là việc hiện thực hóa một kết quả cụ thể có mức độ không chắc chắn nhất định. Ví dụ, hãy để một học sinh hoàn toàn xa lạ với chúng ta làm một bài kiểm tra, kết quả của bài kiểm tra đó có thể là điểm 2, 3, 4 hoặc 5. Vì chúng ta không biết gì về học sinh này nên mức độ không chắc chắn của tất cả những điều được liệt kê kết quả thi hoàn toàn giống nhau. Ngược lại, nếu chúng ta biết anh ta học như thế nào, thì niềm tin vào một số kết quả sẽ lớn hơn những kết quả khác: ví dụ, một học sinh xuất sắc rất có thể sẽ vượt qua kỳ thi với điểm A, nhưng đạt được điểm D đối với anh ta là một điều gần như không thể tin được. Cách dễ nhất để xác định lượng thông tin trong trường hợp tất cả các kết quả của một sự kiện có thể được thực hiện bằng với xác suất bằng nhau. Trong trường hợp này, thông tin được tính toán bằng cách sử dụng Công thức Hartley.

Trong một tình huống phức tạp hơn, khi kết quả của một sự kiện được mong đợi với mức độ chắc chắn khác nhau, tính toán phức tạp Qua Công thức Shannon, thường được đưa ra ngoài phạm vi khóa học khoa học máy tính. Rõ ràng công thức Hartley là trường hợp đặc biệt của công thức Shannon tổng quát hơn.

Công thức Hartleyđược đề xuất vào năm 1928 bởi kỹ sư người Mỹ R. Hartley. Cô ấy quan hệ số trạng thái có thể xảy ra như nhau N Với lượng thông tin tôi trong một thông báo rằng bất kỳ trạng thái nào trong số này đã xảy ra.

Hầu hết mâu đơn giản cho công thức này sẽ được cố định như sau:

2 tôi = N

Và thường thì ý nghĩa Nđược biết đến nhưng TÔI bạn phải lựa chọn, điều này không hoàn toàn thuận tiện. Vì vậy, những người biết toán tốt hơn thích chuyển đổi công thức nàyđể thể hiện ngay số lượng mong muốn TÔI rõ ràng:

Tôi = log 2 N

Đơn vị thông tin được gọi là chút(từ tiếng Anh chữ số nhị phân- chữ số nhị phân); Như vậy, 1 chút- Đây là thông tin về kết quả của một thí nghiệm có hai kết quả có khả năng xảy ra như nhau.

Càng có nhiều kết quả khả thi thì thông điệp về việc thực hiện một trong số chúng càng có nhiều thông tin.

Ví dụ 1. 16 lá bài được chọn từ bộ bài (tất cả đều là “hình” và quân Át) và đặt úp xuống bàn. Lá bài trên cùng đã được lật (nữ hoàng bích). Bao nhiêu thông tin sẽ được đưa vào tin nhắn về lá bài nào ở trên cùng? Tất cả các quân bài đều giống nhau nên bất kỳ quân bài nào cũng có thể được lật với xác suất như nhau. Trong những điều kiện như vậy, công thức Hartley có thể áp dụng được. Sự kiện khai mạc thẻ hàng đầu, đối với trường hợp của chúng ta có thể có 16 kết quả có thể xảy ra. Do đó, thông tin về việc thực hiện một trong số chúng bằng

I = log 2 16 = 4 bit

Ghi chú. Nếu bạn không thích logarit, bạn có thể viết công thức Hartley dưới dạng 2 tôi = 16 và nhận được câu trả lời bằng cách chọn cái này TÔIđiều đó làm cô ấy hài lòng.

Phương pháp đo lường thông tin theo thứ tự bảng chữ cái (khối lượng)

Nó bao gồm việc xác định lượng thông tin trong mỗi ký tự của một tin nhắn rời rạc và sau đó đếm số lượng ký tự này trong tin nhắn. Hãy để tin nhắn được mã hóa bằng cách sử dụng một số bộ ký tự. thông báo rằng Nếu cho bộ này thứ tự của các dấu hiệu được thiết lập, thì nó được gọi là bảng chữ cái. Hãy để bảng chữ cái mà tất cả các tin nhắn được viết bao gồm N nhân vật. Để đơn giản, chúng tôi giả định rằng tất cả chúng đều xuất hiện trong văn bản với xác suất như nhau. Khi đó áp dụng công thức Hartley để tính toán thông tin

Đo xác suất

Một ước tính chung về lượng thông tin, được gọi là thước đo xác suất, được phát triển bởi kỹ sư và nhà khoa học truyền thông người Mỹ Claude Shannon vào năm 1948 trong các công trình nổi tiếng về lý thuyết thông tin. Kể từ đó, sự phát triển chuyên sâu của lý thuyết thông tin nói chung và nghiên cứu chuyên sâu về vấn đề đo lường đại lượng của nó trong hệ thống viễn thông nói riêng bắt đầu.

Công thức Shannon.

Ở đây: I là lượng thông tin thu được từ thí nghiệm; N – tổng số kết quả trong thí nghiệm; p i – xác suất của kết quả thứ i.

Nếu xác suất của tất cả các kết quả trong thí nghiệm bằng nhau p 1 = p 2 = . . . = p n = 1/N (ném đồng xu, xúc xắc, rút ​​quân bài từ bộ bài, v.v.), khi đó công thức của Shannon chuyển thành công thức của Hartley (1928): I = log 2 N.

Như bạn có thể thấy, nhờ thực hiện các phép tính, chúng ta đã thu được thước đo logarit mà chúng ta đã biết.

Như vậy, theo công thức của Shannon, lượng thông tin được hiểu là sự giảm đi độ không chắc chắn về trạng thái của một hệ thống.

Nhiều hình thức trình bày thông tin khác nhau được biết đến. Tuy nhiên, máy tính điện tử là một thiết bị kỹ thuật dựa trên công việc Linh kiện điện tử, có nghĩa là nó có những đặc điểm vật lý nhất định. Vì vậy, thông tin dành cho máy tính phải có biểu diễn vật lý, và cách biểu diễn này phải đơn giản nhất.

Các yêu cầu này được đáp ứng bằng cái gọi là biểu diễn thông tin bit, dựa trên hệ thống số nhị phân, trong đó mỗi hạt được lưu trữ chỉ có thể nhận hai giá trị - 0 hoặc 1. Trong thiết bị kỹ thuật hệ thống nhị phân cơ số được sử dụng để biểu thị các hệ thống có hai trạng thái có thể. Ví dụ:

1 - có lỗ, 0 - không có lỗ;

1 - kích hoạt, 0 - vô hiệu hóa;

1 - có điện áp, 0 - không có điện áp.

Hơn nữa, mỗi chữ số nhị phân chứa một chút thông tin.

Trên mỗi đơn vị thông tin 1 bit (chữ số nhị phân – đơn vị nhị phân) lượng thông tin thu được từ một thí nghiệm bao gồm việc chọn một trong hai kết quả có khả năng xảy ra như nhau được chấp nhận.

Một bit thực sự là một khối lưu trữ thông tin rất nhỏ, chỉ chứa hai trạng thái: 0, 1. Nếu bạn kết hợp hai bit thành một, thì trong khối này bạn đã có thể lưu trữ 4 trạng thái: 00, 01, 10, 11. Nếu bạn kết hợp ba, thì bạn sẽ có khả năng lưu trữ nhiều thông tin hơn nữa: 000, 001, 010, 011, 100, 101, 110, 111. V.v. Như vậy, lượng thông tin được ghi dưới dạng ký tự nhị phân (0 và 1) trong bộ nhớ máy tính hoặc trên phương tiện truyền thông bên ngoài thông tin được tính toán đơn giản bằng số ký tự nhị phân cần thiết cho bản ghi đó. Ví dụ, tám bit mã nhị phân 11001011 có khối lượng dữ liệu V= 8 bit.



Để làm cho nó rõ ràng hơn, hãy mô tả điều này trong một bảng:

Trong thực tế, đơn vị đo lường lớn hơn thường được sử dụng nhiều hơn - byte (1 byte = 8 bit), cũng như các đơn vị thông tin bắt nguồn từ nó.

Để đo lượng lớn thông tin, các đơn vị sau được sử dụng:

1 KB (một kilobyte) = 1024 byte = 2 10 byte
1 MB (một megabyte)= 1024 KB=2 10 KB=2 20 byte
1 GB (một gigabyte)= 1024 MB=2 10 MB=2 30 byte
1TB (một terabyte)=2 10 GB=1024GB=2 40 byte
1PB (một petabyte)=2 10 TB=1024TB=2 50 byte
1Ebyte (một exabyte)=2 10 PB=1024PB=2 60 byte
1Zbyte (một zettabyte)=2 10 Ebyte=1024Ebyte=2 70 byte
1Ybyte (một yatabyte)=2 10 Zbyte=1024Zbyte=2 80 byte.

Cần lưu ý rằng trong hệ thống đo lường thông tin nhị phân (máy tính), không giống như hệ thống số liệu, các đơn vị có tiền tố “kilo”, “mega”, v.v. thu được bằng cách nhân đơn vị cơ bản không phải với 10 3 = 1000, 10 6 = 1000 000, v.v., và với 2 10, 2 20, v.v.

Chữ số nhị phân, số nhị phân trong tiếng Anh Bi naryDigi t. Từ ba chữ cái của những từ này, họ đã tạo thành một từ có âm vang chút, vốn đã có sẵn bằng tiếng Anh (bit– Piece, Piece). Trong khoa học máy tính, nó có ý nghĩa tương tự như Bi naryDigi t, nhưng họ cũng thêm một ý nghĩa mới vào nó.

Bit là đơn vị thông tin và đơn vị biểu diễn thông tin trong máy tính.

Bit (một chữ số Số nhị phân) có thể nhận hai giá trị: 0 hoặc 1. Trong số thập phân, một chữ số có thể lấy giá trị từ 0 đến 9. Nếu số là một chữ số (một bit) thì 0 hoặc 1 là giá trị của số đó và các chữ số của số, trong trường hợp này trùng nhau.

Vì máy tính chỉ có thể xử lý số nhị phân nên thông tin chỉ có thể được mã hóa dưới dạng số nhị phân. Trong trường hợp này, có thể nói rằng bảng chữ cái dùng để mã hóa thông tin bao gồm hai ký hiệu (số) 0 và 1.

Số nhị phân một chữ số, tức là một bit, chỉ có thể mã hóa hai ký tự, vì nó chỉ lấy hai giá trị - 0 hoặc 1. Và số thập phân có một chữ số sẽ cho phép chúng ta mã hóa 10 ký tự, vì nó có thể có 10 giá trị - từ 0 đến 9 .

Bây giờ chúng tôi sử dụng số có hai chữ số để mã hóa. Sau đó vào hệ thống thập phân Chúng ta có thể sử dụng chữ số để mã hóa các số từ 0 đến 99, tức là 100 số. Và chúng ta có thể mã hóa được 100 ký tự, gấp 10 lần so với khi mã hóa bằng số có một chữ số.

Một mô hình tương tự xảy ra với độ sâu bit ngày càng tăng của số nhị phân. Chúng ta có thể mã hóa 4 ký tự bằng số nhị phân có hai chữ số, vì cũng có 4 số có thể có: 00, 01, 10, 11, tức là nhiều gấp đôi so với số có một chữ số. Bạn có thể kiểm tra xem số nhị phân ba bit có thể mã hóa số ký tự nhiều hơn 2 lần so với số hai bit hay không. Tổng quát hóa mẫu này, chúng ta có được một công thức đơn giản để xác định số lượng ký tự S, có thể được mã hóa N- số nhị phân bit:

S = 2 N

nhị phânN- Số chữ số dùng để mã hóa thông tin trong máy tính được gọi làbyte .

Định nghĩa này cũng bao hàm một định nghĩa khác về byte:

Byte - một đơn vị xử lý thông tin trong máy tính, vì bằng giá trị của byte, bạn có thể tìm ra ký tự nào được mã hóa bởi nó.

Nếu các số nhị phân n-bit khác được sử dụng để mã hóa thì chúng phải được lấy dưới dạng bội số của một byte.

Byte đầu tiên có 6, sau đó là 7 chữ số (bit) và bây giờ nó bằng 8 bit.

Một trong những cách dịch nghĩa của từ tiếng Anh chút cắn một mảnh. Nếu coi một phần là một phần của tổng thể thì một bit thực sự là một phần của số nhị phân. Nếu một byte mã hóa các chữ cái và ký hiệu từ đó các từ được tạo thành thì byte đó cũng biểu thị một phần của từ.

Byte cũng được sử dụng để đo dung lượng bộ nhớ, RAM, bộ nhớ ngoài và kích thước tệp. Nhưng trong trường hợp này các đơn vị đo lường lớn hơn được sử dụng. Ví dụ: Kilobyte (KB), Megabyte (MB), Gigabyte (GB), Terabyte (TB):

1 KB = 1024 byte = 2 10 byte

1 MB = 1024 KB = 2 10 KB

1 GB = 1024 MB = 2 10 MB

1 TB = 1024 GB = 2 10 GB

Mã hóa số nguyên và số thực

Các số nguyên được mã hóa dưới dạng nhị phân khá đơn giản - chỉ cần lấy một số nguyên và chia đôi cho đến khi phần còn lại bằng 0 hoặc một. Kết quả phép chia thu được lại được chia theo cách tương tự. Và chúng ta tiếp tục thủ tục chia này cho đến khi kết quả của phép chia nhỏ hơn 2. Tập hợp các số dư từ mỗi phép chia, được viết từ phải sang trái cùng với số dư cuối cùng, tạo thành dạng nhị phân tương tự của một số thập phân.

19:2 = 9 + 1 9:2=4+1 4:2=2+0 2:2 = 1

Do đó, 19 10 = 1011 2.

Để mã hóa các số nguyên từ 0 đến 255, chỉ cần có 8 bit mã nhị phân (8 bit) là đủ. Mười sáu bit cho phép bạn mã hóa các số nguyên từ 0 đến 65.535 và 24 bit cho phép bạn mã hóa hơn 16,5 triệu giá trị khác nhau.

Để mã hóa số thực, mã hóa 80 bit được sử dụng. Trong trường hợp này, số đầu tiên được chuyển đổi thành dạng chuẩn hóa:

3,1415926 = 0,31415926-10 1

300 000 = 0,3-10 6

123 456 789 = 0,123456789 10 1 /

Phần đầu tiên của số được gọi là bọ ngựa, va thu hai - đặc trưng. Hầu hết trong số 80 bit được phân bổ để lưu trữ phần định trị (cùng với dấu hiệu) và một số bit cố định nhất định được phân bổ để lưu trữ đặc tính (cũng được ký hiệu).