Mức độ của vấn đề truyền tải thông tin. Đo lường ngữ nghĩa của thông tin

Khi thực hiện các quá trình thông tin, thông tin luôn được truyền tải trong không gian và thời gian từ nguồn thông tin đến người nhận (người nhận). Trong trường hợp này, các dấu hiệu hoặc ký hiệu khác nhau được sử dụng để truyền tải thông tin, ví dụ: ngôn ngữ tự nhiên hoặc nhân tạo (trang trọng), cho phép nó được thể hiện dưới một số dạng gọi là thông điệp.

Tin nhắn– một dạng biểu diễn thông tin dưới dạng một tập hợp các dấu hiệu (ký hiệu) được sử dụng để truyền tải.

Một thông điệp như một tập hợp các dấu hiệu theo quan điểm ký hiệu học ( từ tiếng Hy Lạp setneion - ký, ký) - một ngành khoa học nghiên cứu tính chất của ký hiệu và hệ thống ký hiệu - có thể được nghiên cứu ở ba cấp độ:

1) cú pháp , trong đó các thuộc tính bên trong của thông điệp được xem xét, tức là mối quan hệ giữa các dấu hiệu, phản ánh cấu trúc của một hệ thống dấu hiệu nhất định. Các thuộc tính bên ngoài được nghiên cứu ở cấp độ ngữ nghĩa và thực dụng. Ở cấp độ này, họ xem xét các vấn đề trong việc gửi tin nhắn đến người nhận dưới dạng một tập hợp các ký tự, có tính đến loại phương tiện và phương pháp trình bày thông tin, tốc độ truyền và xử lý, kích thước của mã trình bày thông tin, độ tin cậy và độ chính xác của việc chuyển đổi các mã này, v.v., trừu tượng hóa hoàn toàn nội dung ngữ nghĩa của tin nhắn và mục đích dự định của chúng. Ở cấp độ này, thông tin chỉ được xem xét từ góc độ cú pháp thường được gọi là dữ liệu, vì khía cạnh ngữ nghĩa không quan trọng.

Lý thuyết thông tin hiện đại chủ yếu nghiên cứu các vấn đề ở cấp độ này. Nó dựa trên khái niệm “lượng thông tin”, là thước đo tần suất sử dụng các dấu hiệu, không phản ánh ý nghĩa hoặc tầm quan trọng của thông điệp được truyền đi. Về vấn đề này, đôi khi người ta cho rằng lý thuyết thông tin hiện đại ở cấp độ cú pháp.

2) ngữ nghĩa , trong đó các mối quan hệ giữa các dấu hiệu và đối tượng, hành động và phẩm chất mà chúng biểu thị được phân tích, tức là nội dung ngữ nghĩa của thông điệp, mối quan hệ của nó với nguồn thông tin. Các vấn đề ở cấp độ ngữ nghĩa liên quan đến việc hình thức hóa và tính đến ý nghĩa của thông tin được truyền đi, xác định mức độ tương ứng giữa hình ảnh của đối tượng và chính đối tượng đó. Ở cấp độ này, thông tin mà thông tin phản ánh được phân tích, các kết nối ngữ nghĩa được xem xét, các khái niệm và ý tưởng được hình thành, ý nghĩa và nội dung của thông tin được tiết lộ và việc khái quát hóa nó được thực hiện.

3) thực dụng , trong đó mối quan hệ giữa tin nhắn và người nhận được xem xét, tức là nội dung người tiêu dùng của tin nhắn, mối quan hệ của nó với người nhận.

Ở cấp độ này, hậu quả của việc người tiêu dùng nhận và sử dụng thông tin này là điều đáng quan tâm. Các vấn đề ở cấp độ này liên quan đến việc xác định giá trị và tính hữu ích của việc sử dụng thông tin khi người tiêu dùng phát triển giải pháp để đạt được mục tiêu của mình. Khó khăn chính ở đây là giá trị và tính hữu ích của thông tin có thể hoàn toàn khác nhau đối với những người nhận khác nhau và ngoài ra, nó còn phụ thuộc vào một số yếu tố, chẳng hạn như tính kịp thời của việc cung cấp và sử dụng thông tin đó.


Đối với mỗi cấp độ của vấn đề chuyển giao thông tin được thảo luận ở trên, có những cách tiếp cận khác nhau để đo lường lượng thông tin và các biện pháp đo lường thông tin khác nhau. Có các thước đo thông tin tương ứng ở cấp độ cú pháp, cấp độ ngữ nghĩa và cấp độ thực dụng.

Các thước đo thông tin ở cấp độ cú pháp.Đánh giá định lượng thông tin ở cấp độ này không liên quan đến mặt nội dung của thông tin mà hoạt động với thông tin khách quan không thể hiện mối quan hệ ngữ nghĩa với đối tượng. Về vấn đề này, biện pháp này giúp đánh giá các luồng thông tin trong các đối tượng có tính chất khác nhau như hệ thống thông tin liên lạc, máy tính, hệ thống điều khiển, hệ thống thần kinh của sinh vật sống, v.v.

Để đo lường thông tin ở cấp độ cú pháp, hai tham số được đưa ra: lượng thông tin (dữ liệu) - V d(cách tiếp cận khối lượng) và lượng thông tin – TÔI(phương pháp entropy).

Khối lượng thông tin Vd (phương pháp tiếp cận khối lượng). Khi thực hiện các quy trình thông tin, thông tin được truyền đi dưới dạng tin nhắn, là một tập hợp các ký tự của bảng chữ cái bất kỳ. Hơn nữa, mỗi ký tự mới trong tin nhắn sẽ làm tăng lượng thông tin được biểu thị bằng chuỗi ký tự của một bảng chữ cái nhất định. Nếu bây giờ lượng thông tin chứa trong tin nhắn một ký tự được lấy làm một thì khối lượng thông tin (dữ liệu) Vd trong bất kỳ tin nhắn nào khác sẽ bằng số ký tự (bit) trong tin nhắn này. Vì cùng một thông tin có thể được biểu diễn bằng nhiều cách khác nhau (sử dụng các bảng chữ cái khác nhau) nên đơn vị đo lường thông tin (dữ liệu) sẽ thay đổi tương ứng.

Như vậy, trong hệ thập phân, một chữ số có trọng số bằng 10 và theo đó đơn vị đo lường thông tin sẽ là nói thế (chữ số thập phân P P như vậy. Ví dụ: số có bốn chữ số 2009 có khối lượng dữ liệu là V d = 4 dit.

Trong hệ nhị phân, một chữ số có trọng số bằng 2 và theo đó đơn vị đo lường thông tin sẽ là chút (bit (chữ số nhị phân) – chữ số nhị phân). Trong trường hợp này, một tin nhắn có dạng N-số có khối lượng dữ liệu V d = P chút. Ví dụ: mã nhị phân 8 bit 11001011 có khối lượng dữ liệu là V d = 8 bit.

Trong điện toán hiện đại, cùng với đơn vị đo lường dữ liệu tối thiểu chútđơn vị đo mở rộng được sử dụng rộng rãi byte, bằng 8 bit. Chính xác là 8 bit cần thiết để mã hóa bất kỳ ký tự nào trong số 256 ký tự của bảng chữ cái bàn phím máy tính (256 = 2 8).

Khi làm việc với khối lượng thông tin lớn, các đơn vị đo lường lớn hơn được sử dụng để tính toán số lượng của nó:

1 Kilobyte (KB) = 1024 byte = 2 10 byte,

1 Megabyte (MB) = 1024 KB = 2 20 byte = 1.048.576 byte;

1 Gigabyte (GB) = 1024 MB = 2 30 byte = 1.073.741.824 byte;

Gần đây, do khối lượng thông tin được xử lý ngày càng tăng nên các đơn vị dẫn xuất như:

1 Terabyte (TB) = 1024 GB = 2 40 byte = 1.099.511.627.776 byte;

1 Petabyte (PB) = 1024 TB = 2 50 byte = 1.125.899.906.842.624 byte.

Cần lưu ý rằng trong hệ thống đo lường thông tin nhị phân (máy tính), không giống như hệ mét, các đơn vị có tiền tố “kilo”, “mega”, v.v. thu được bằng cách nhân đơn vị cơ bản không phải với 10 3 = 1000, 10 6 = 1.000.000, v.v., và trên 2 10 = 1024, 2 20 = 1.048.576, v.v.

Lượng thông tin I (phương pháp entropy). Trong lý thuyết thông tin và mã hóa, phương pháp entropy để đo lường thông tin được áp dụng. Cách tiếp cận này dựa trên thực tế là việc thu thập thông tin luôn gắn liền với việc giảm tính đa dạng hoặc độ không chắc chắn (entropy) của hệ thống. Dựa vào cái này, Lượng thông tin trong một tin nhắn được định nghĩa là thước đo làm giảm sự không chắc chắn về trạng thái của một hệ thống nhất định sau khi nhận được tin nhắn. Sự không chắc chắn có thể được giải thích theo nghĩa người quan sát biết ít về một hệ thống nhất định. Khi người quan sát đã xác định được thứ gì đó trong một hệ vật lý, thì entropy của hệ sẽ giảm vì đối với người quan sát, hệ thống đã trở nên có trật tự hơn.

Vì vậy, với cách tiếp cận entropy thông tin được hiểu là giá trị định lượng của độ không đảm bảo đã biến mất trong bất kỳ quá trình nào (thử nghiệm, đo lường, v.v.). Trong trường hợp này, entropy được đưa vào như thước đo độ không chắc chắn N và lượng thông tin bằng:

I = H tháng tư – H aps

trong đó, H apr – entropy tiên nghiệm về trạng thái của hệ thống hoặc quá trình đang nghiên cứu;

H aps – entropy sau.

Hậu thế (từ lat. một hậu thế – từ những gì theo sau) – bắt nguồn từ kinh nghiệm (kiểm tra, đo lường).

Một tiên nghiệm (từ lat. một tiên nghiệm - từ trước đó) là một khái niệm đặc trưng cho kiến ​​thức có trước kinh nghiệm (kiểm tra) và độc lập với nó.

Trong trường hợp khi trong quá trình thử nghiệm, độ không đảm bảo đo hiện tại được loại bỏ (thu được kết quả cụ thể, tức là H = 0), lượng thông tin nhận được trùng với entropy ban đầu

Chúng ta hãy xem hệ thống đang được nghiên cứu là một nguồn thông tin rời rạc (nguồn của các thông điệp rời rạc), theo đó chúng tôi muốn nói đến một hệ thống vật lý có một tập hợp hữu hạn các trạng thái có thể ( và tôi}, Tôi = .

Tất cả các thiết lập A = (a 1, a 2, ..., a n) Các trạng thái của một hệ thống trong lý thuyết thông tin được gọi là bảng chữ cái trừu tượng hoặc bảng chữ cái của nguồn thông báo.

Các tiểu bang riêng lẻ a 1, a 2,..., a nđược gọi là các chữ cái hoặc ký hiệu của bảng chữ cái.

Một hệ thống như vậy có thể ngẫu nhiên đảm nhận một trong số hữu hạn các trạng thái có thể có tại bất kỳ thời điểm nào. tôi. Trong trường hợp này, họ nói rằng các trạng thái khác nhau được thực hiện do nguồn lựa chọn của chúng.

Người nhận thông tin (tin nhắn) có ý tưởng nhất định về khả năng xảy ra một số sự kiện nhất định. Những ý tưởng này nói chung là không đáng tin cậy và được thể hiện bằng xác suất mà anh ta mong đợi sự kiện này hoặc sự kiện kia. Thước đo chung về độ không đảm bảo (entropy) được đặc trưng bởi một số sự phụ thuộc toán học vào các xác suất này; lượng thông tin trong thông báo được xác định bằng mức độ đo độ không chắc chắn giảm sau khi nhận được tin nhắn.

Hãy giải thích ý tưởng này bằng một ví dụ.

Giả sử chúng ta có 32 thẻ khác nhau. Khả năng chọn một quân bài từ bộ bài là 32. Trước khi lựa chọn, điều tự nhiên là giả định rằng cơ hội chọn được một quân bài nhất định là như nhau đối với tất cả các quân bài. Bằng cách đưa ra lựa chọn, chúng ta loại bỏ sự không chắc chắn này. Trong trường hợp này, độ không chắc chắn có thể được đặc trưng bởi số lượng các lựa chọn có khả năng xảy ra như nhau. Nếu bây giờ chúng ta định nghĩa lượng thông tin là thước đo để loại bỏ sự không chắc chắn, thì thông tin thu được từ sự lựa chọn có thể được mô tả bằng số 32. Tuy nhiên, sẽ thuận tiện hơn khi sử dụng không phải chính con số này mà là logarit của ước tính cơ sở 2 thu được ở trên:

trong đó m là số lượng các lựa chọn có thể xảy ra như nhau (Khi m=2, chúng ta nhận được thông tin trong một bit). Nghĩa là, trong trường hợp của chúng tôi

H = log 2 32 = 5.

Cách tiếp cận được nêu ra của nhà toán học người Anh R. Hartley (1928). Nó có một cách giải thích thú vị. Nó được đặc trưng bởi một số câu hỏi với câu trả lời “có” hoặc “không” để xác định xem một người đã chọn thẻ nào. 5 câu hỏi như vậy là đủ.

Nếu khi chọn một lá bài, khả năng xuất hiện của mỗi lá bài là không giống nhau (xác suất khác nhau), thì chúng ta thu được một phương pháp thống kê để đo lường thông tin do K. Shannon (1948) đề xuất. Trong trường hợp này, thước đo thông tin được đo bằng công thức:

Ở đâu số Pi- xác suất lựa chọn Tôi ký tự thứ của bảng chữ cái.

Dễ dàng nhận thấy rằng nếu xác suất trang 1, ..., p n bằng nhau thì mỗi cái đều bằng nhau 1/N, và công thức Shannon trở thành công thức Hartley.

Các biện pháp thông tin ở cấp độ ngữ nghĩa.Để đo lường nội dung ngữ nghĩa của thông tin, tức là số lượng của nó ở cấp độ ngữ nghĩa, phổ biến nhất là thước đo từ điển đồng nghĩa, kết nối các thuộc tính ngữ nghĩa của thông tin với khả năng chấp nhận tin nhắn đến của người dùng. Quả thực, để hiểu và sử dụng được thông tin nhận được thì người nhận phải có một lượng kiến ​​thức nhất định. Sự thiếu hiểu biết hoàn toàn về chủ đề này không cho phép chúng tôi trích xuất thông tin hữu ích từ tin nhắn nhận được về chủ đề này. Khi kiến ​​thức về một chủ đề tăng lên thì lượng thông tin hữu ích được rút ra từ tin nhắn cũng tăng theo.

Nếu chúng ta gọi kiến ​​thức của người nhận về một chủ đề nhất định là từ điển đồng nghĩa (tức là một tập hợp từ, khái niệm, tên của các đối tượng được kết nối bằng các kết nối ngữ nghĩa), thì lượng thông tin chứa trong một thông điệp nhất định có thể được đánh giá theo mức độ thay đổi. trong từ điển đồng nghĩa riêng lẻ dưới ảnh hưởng của thông điệp này.

Từ điển đồng nghĩa- một tập hợp thông tin có sẵn cho người dùng hoặc hệ thống.

Nói cách khác, lượng thông tin ngữ nghĩa được người nhận trích xuất từ ​​các tin nhắn đến phụ thuộc vào mức độ sẵn sàng của từ điển đồng nghĩa của anh ta để tiếp nhận thông tin đó.

Tùy thuộc vào mối quan hệ giữa nội dung ngữ nghĩa của thông tin S và từ điển đồng nghĩa của người dùng S p số lượng thông tin ngữ nghĩa thay đổi , được người dùng cảm nhận và sau đó được anh ta đưa vào từ điển đồng nghĩa của mình. Bản chất của sự phụ thuộc này được thể hiện trong hình. 2.1. Hãy xem xét hai trường hợp giới hạn khi lượng thông tin ngữ nghĩa I c bằng 0:

a) khi S p = 0, người dùng không nhận biết (không hiểu) thông tin đến;

b) khi S -> ∞ người dùng “biết mọi thứ” và không cần thông tin đến.

Cơm. 1.2. Sự phụ thuộc vào lượng thông tin ngữ nghĩa,

được người tiêu dùng cảm nhận từ từ điển đồng nghĩa của anh ta I c =f(Sp)

Người tiêu dùng thu được lượng thông tin ngữ nghĩa tối đa khi phối hợp nội dung ngữ nghĩa S của nó với từ điển đồng nghĩa S p (S = S p opt), khi thông tin đến có thể hiểu được đối với người dùng và cung cấp cho anh ta thông tin chưa biết trước đó (không có trong từ điển đồng nghĩa của anh ta). .

Do đó, lượng thông tin ngữ nghĩa trong một tin nhắn, lượng kiến ​​thức mới mà người dùng nhận được là một giá trị tương đối. Thông điệp tương tự có thể có nội dung có ý nghĩa đối với người dùng thành thạo và vô nghĩa đối với người dùng không đủ năng lực.

Khi đánh giá khía cạnh ngữ nghĩa (nội dung) của thông tin, cần cố gắng dung hòa các giá trị của S và Sp.

Thước đo tương đối của lượng thông tin ngữ nghĩa có thể là hệ số nội dung C, được định nghĩa là tỷ lệ giữa lượng thông tin ngữ nghĩa với khối lượng của nó:

C = I s / V d

Các biện pháp thông tin ở cấp độ thực tế. Biện pháp này xác định tính hữu ích của thông tin để đạt được mục tiêu của người dùng. Thước đo này cũng là một giá trị tương đối, được xác định bởi đặc thù của việc sử dụng thông tin này trong một hệ thống cụ thể.

Một trong những nhà khoa học Nga đầu tiên giải quyết vấn đề đánh giá thông tin ở mức độ thực dụng là A.A. Kharkevich, người đề xuất lấy lượng thông tin cần thiết để đạt được mục tiêu làm thước đo giá trị của thông tin, tức là tính toán mức tăng xác suất đạt được mục tiêu. Vì vậy, nếu trước khi nhận được thông tin, xác suất đạt được mục tiêu là p 0 và sau khi nhận được nó - p 1, thì giá trị của thông tin được xác định bằng logarit của tỷ lệ p 1 / p 0:

I = log 2 p 1 – log 2 p 0 = log 2 (p 1 /p 0)

Do đó, giá trị của thông tin được đo bằng đơn vị thông tin, trong trường hợp này là bit.

Để đo lường nội dung ngữ nghĩa của thông tin, tức là số lượng của nó ở cấp độ ngữ nghĩa, được công nhận nhiều nhất là thước đo từ điển đồng nghĩa, kết nối các thuộc tính ngữ nghĩa của thông tin với khả năng chấp nhận tin nhắn đến của người dùng. Với mục đích này, khái niệm được sử dụng từ điển đồng nghĩa của người dùng.

Từ điển đồng nghĩa là tập hợp thông tin có sẵn cho người dùng hoặc hệ thống.

Tùy thuộc vào mối quan hệ giữa nội dung ngữ nghĩa của thông tin S và từ điển đồng nghĩa của người dùng S p số lượng thông tin ngữ nghĩa thay đổi Ic,được người dùng cảm nhận và sau đó được anh ta đưa vào từ điển đồng nghĩa của mình. Bản chất của sự phụ thuộc này được thể hiện ở Hình 2.2. Chúng ta hãy xem xét hai trường hợp giới hạn khi lượng thông tin ngữ nghĩa tôi c bằng 0:

Tại S p 0 người dùng không nhận biết hoặc hiểu thông tin đến;

Tại Sp; người dùng biết mọi thứ nhưng anh ta không cần thông tin đến.

Cơm. 2.2. Sự phụ thuộc vào lượng thông tin ngữ nghĩa. được người tiêu dùng cảm nhận từ từ điển đồng nghĩa của anh ta Ic=f(Sp)

Lượng thông tin ngữ nghĩa tối đa tôi c người tiêu dùng có được bằng cách đồng ý về nội dung ngữ nghĩa của nó S với từ điển đồng nghĩa của bạn S p (S p = S p opt), khi thông tin đến có thể hiểu được đối với người dùng và cung cấp cho anh ta thông tin chưa biết trước đó (không có trong từ điển đồng nghĩa của anh ta).

Do đó, lượng thông tin ngữ nghĩa trong một tin nhắn, lượng kiến ​​thức mới mà người dùng nhận được là một giá trị tương đối. Thông báo tương tự có thể có nội dung có ý nghĩa đối với người dùng thành thạo và vô nghĩa (nhiễu ngữ nghĩa) đối với người dùng không đủ năng lực.

Khi đánh giá khía cạnh ngữ nghĩa (nội dung) của thông tin cần cố gắng hài hòa các giá trị SSp.

Một thước đo tương đối về lượng thông tin ngữ nghĩa có thể là hệ số nội dung VỚI, được định nghĩa là tỷ lệ giữa lượng thông tin ngữ nghĩa với khối lượng của nó:

Đo lường thông tin thực tế

Biện pháp này xác định tính hữu ích của thông tin (giá trị) đối với người dùng để đạt được mục tiêu của mình. Thước đo này cũng là một giá trị tương đối, được xác định bởi đặc thù của việc sử dụng thông tin này trong một hệ thống cụ thể. Nên đo giá trị của thông tin trong cùng đơn vị (hoặc gần với chúng) trong đó hàm mục tiêu được đo.



Ví dụ 2.5. Trong một hệ thống kinh tế, các đặc tính (giá trị) thực dụng của thông tin có thể được xác định bằng sự gia tăng hiệu quả kinh tế của hoạt động đạt được thông qua việc sử dụng thông tin này để quản lý hệ thống:

Inb(g)=P(g /b)-P(g),

Ở đâu Inb(g)-giá trị của thông báo thông tin b cho hệ thống điều khiển g,

P(g)- hiệu quả kinh tế dự kiến ​​trước đó của hoạt động của hệ thống điều khiển g ,

P(g/b)- tác động mong đợi của hoạt động của hệ thống g, với điều kiện là thông tin chứa trong thông báo b được sử dụng để kiểm soát.

Để so sánh, chúng tôi trình bày các thước đo thông tin được giới thiệu trong Bảng 2.1.

Bảng 2.1. Đơn vị thông tin và ví dụ

CHẤT LƯỢNG THÔNG TIN

Khả năng và hiệu quả của việc sử dụng thông tin được xác định bởi nhu cầu cơ bản của người tiêu dùng: chỉ số chất lượng, như tính đại diện, nội dung, tính đầy đủ, khả năng tiếp cận, tính phù hợp, tính kịp thời, tính chính xác, độ tin cậy, tính bền vững.

  • Tính đại diện thông tin gắn liền với tính đúng đắn của việc lựa chọn và hình thành nó nhằm phản ánh đầy đủ các đặc tính của đối tượng. Những điều quan trọng nhất ở đây là:
  • tính đúng đắn của khái niệm trên cơ sở hình thành khái niệm ban đầu;
  • giá trị của việc lựa chọn các tính năng thiết yếu và các mối liên hệ của hiện tượng được hiển thị.
  • Vi phạm tính đại diện của thông tin thường dẫn đến sai sót nghiêm trọng.
  • Nội dung thông tin phản ánh năng lực ngữ nghĩa bằng tỷ lệ giữa lượng thông tin ngữ nghĩa trong một tin nhắn với khối lượng dữ liệu được xử lý, tức là. C=Ic/Vd.

Khi nội dung thông tin tăng lên, thông lượng ngữ nghĩa của hệ thống thông tin cũng tăng lên, vì để có được cùng một thông tin cần phải chuyển đổi một lượng dữ liệu nhỏ hơn.

Cùng với hệ số nội dung C phản ánh khía cạnh ngữ nghĩa, bạn cũng có thể sử dụng hệ số nội dung thông tin, đặc trưng bằng tỷ lệ giữa lượng thông tin cú pháp (theo Shannon) và lượng dữ liệu. Y=I/Vd.

  • Đầy đủ (đầy đủ) thông tin có nghĩa là nó chứa đựng thành phần (bộ chỉ số) tối thiểu nhưng đầy đủ để đưa ra quyết định đúng đắn. Khái niệm về tính đầy đủ của thông tin gắn liền với nội dung ngữ nghĩa (ngữ nghĩa) và tính thực dụng của nó. Là không đầy đủ, tức là. Thông tin không đầy đủ để đưa ra quyết định đúng đắn và thông tin dư thừa làm giảm hiệu quả của các quyết định của người dùng.
  • khả dụng thông tin đến nhận thức của người dùng được đảm bảo bằng việc thực hiện các thủ tục thích hợp để thu thập và chuyển đổi thông tin đó. Ví dụ, trong một hệ thống thông tin, thông tin được chuyển đổi thành dạng dễ tiếp cận và thân thiện với người dùng. Đặc biệt, điều này đạt được bằng cách phối hợp hình thức ngữ nghĩa của nó với từ điển đồng nghĩa của người dùng.
  • Mức độ liên quan Thông tin được xác định bởi mức độ lưu giữ giá trị của thông tin để quản lý tại thời điểm sử dụng và phụ thuộc vào động lực thay đổi các đặc điểm của thông tin đó cũng như vào khoảng thời gian đã trôi qua kể từ khi thông tin này xuất hiện.
  • Tính kịp thời thông tin là thông tin đến không muộn hơn một thời điểm đã xác định trước, phù hợp với thời điểm giải quyết công việc.
  • Sự chính xác thông tin được xác định bởi mức độ gần gũi của thông tin nhận được với trạng thái thực của đối tượng, quá trình, hiện tượng, v.v. Đối với thông tin được hiển thị bằng mã kỹ thuật số, có bốn khái niệm phân loại về độ chính xác:
  • độ chính xác hình thức, được đo bằng giá trị đơn vị của chữ số có nghĩa nhỏ nhất của một số;
  • độ chính xác thực sự, được xác định bằng giá trị đơn vị của chữ số cuối cùng của số, độ chính xác được đảm bảo;
  • độ chính xác tối đa có thể đạt được trong các điều kiện vận hành cụ thể của hệ thống;
  • độ chính xác cần thiết, được xác định bởi mục đích chức năng của chỉ báo.

Sự uy tín thông tin được xác định bởi tính chất phản ánh sự vật có thật trong đời sống với độ chính xác cần thiết. Độ tin cậy của thông tin được đo bằng xác suất tin cậy của độ chính xác cần thiết, tức là xác suất mà giá trị của một tham số được hiển thị bằng thông tin khác với giá trị thực của tham số này trong độ chính xác yêu cầu.

Sự bền vững thông tin phản ánh khả năng đáp ứng những thay đổi trong dữ liệu nguồn mà không vi phạm độ chính xác cần thiết. Tính ổn định của thông tin cũng như tính đại diện được xác định bởi phương pháp đã chọn để lựa chọn và hình thành thông tin.

Tóm lại, cần lưu ý rằng các thông số về chất lượng thông tin như tính đại diện, nội dung, tính đầy đủ, khả năng tiếp cận, tính bền vững hoàn toàn được xác định ở cấp độ phương pháp phát triển hệ thống thông tin. Các tham số về mức độ phù hợp, kịp thời, chính xác và độ tin cậy cũng được xác định ở mức độ lớn hơn ở cấp độ phương pháp luận, nhưng giá trị của chúng bị ảnh hưởng đáng kể bởi bản chất hoạt động của hệ thống, chủ yếu là độ tin cậy của nó. Đồng thời, các thông số về mức độ phù hợp và độ chính xác có liên quan chặt chẽ với các thông số về tính kịp thời và độ tin cậy tương ứng.

MỨC ĐỘ VẤN ĐỀ TRUYỀN THÔNG TIN

Khi thực hiện các quá trình thông tin, thông tin luôn được truyền tải trong không gian và thời gian từ nguồn thông tin đến người nhận (người nhận). Trong trường hợp này, để truyền tải thông tin, nhiều dấu hiệu hoặc ký hiệu khác nhau được sử dụng, chẳng hạn như ngôn ngữ tự nhiên hoặc nhân tạo (trang trọng), cho phép thông tin được thể hiện dưới một dạng nào đó gọi là thông điệp.

Tin nhắn- một hình thức thể hiện thông tin dưới dạng một tập hợp các dấu hiệu (ký hiệu) dùng để truyền tải.

Một thông điệp như một tập hợp các dấu hiệu theo quan điểm ký hiệu học (từ tiếng Hy Lạp. semeion - ký hiệu, thuộc tính) - một ngành khoa học nghiên cứu tính chất của ký hiệu và hệ thống ký hiệu - có thể được nghiên cứu ở ba cấp độ:

1) cú pháp, trong đó các thuộc tính bên trong của thông điệp được xem xét, tức là mối quan hệ giữa các dấu hiệu, phản ánh cấu trúc của một hệ thống dấu hiệu nhất định. Các thuộc tính bên ngoài được nghiên cứu ở cấp độ ngữ nghĩa và thực dụng;

2) ngữ nghĩa, trong đó các mối quan hệ giữa các dấu hiệu và đối tượng, hành động, phẩm chất mà chúng biểu thị được phân tích, tức là nội dung ngữ nghĩa của thông điệp, mối quan hệ của nó với nguồn thông tin;

3) thực dụng, trong đó mối quan hệ giữa tin nhắn và người nhận được xem xét, tức là nội dung người tiêu dùng của tin nhắn, mối quan hệ của nó với người nhận.

Như vậy, xét đến mối quan hệ nhất định giữa vấn đề truyền tải thông tin và cấp độ nghiên cứu hệ thống ký hiệu, chúng được chia thành ba cấp độ: cú pháp, ngữ nghĩa và thực dụng.

Các vấn đề cấp độ cú pháp liên quan đến việc tạo ra nền tảng lý thuyết cho việc xây dựng hệ thống thông tin, các chỉ số hiệu suất chính sẽ gần đến mức tối đa có thể, cũng như cải tiến các hệ thống hiện có để tăng hiệu quả sử dụng chúng. Đây hoàn toàn là những vấn đề kỹ thuật nhằm cải tiến các phương pháp truyền tải thông điệp và chất mang vật chất của chúng - tín hiệu. Ở cấp độ này, họ xem xét các vấn đề trong việc gửi tin nhắn đến người nhận dưới dạng một tập hợp các ký tự, có tính đến loại phương tiện và phương pháp trình bày thông tin, tốc độ truyền và xử lý, kích thước của mã trình bày thông tin, độ tin cậy và độ chính xác của việc chuyển đổi các mã này, v.v., trừu tượng hóa hoàn toàn nội dung ngữ nghĩa của tin nhắn và mục đích dự định của chúng. Ở cấp độ này, thông tin chỉ được xem xét từ góc độ cú pháp thường được gọi là dữ liệu, vì khía cạnh ngữ nghĩa không quan trọng.

Lý thuyết thông tin hiện đại chủ yếu nghiên cứu các vấn đề ở cấp độ này. Nó dựa trên khái niệm “lượng thông tin”, là thước đo tần suất sử dụng các dấu hiệu, không phản ánh ý nghĩa hoặc tầm quan trọng của thông điệp được truyền đi. Về vấn đề này, đôi khi người ta cho rằng lý thuyết thông tin hiện đại ở cấp độ cú pháp.

Các vấn đề mức độ ngữ nghĩa gắn liền với việc hình thức hóa và tính đến ý nghĩa của thông tin được truyền đi, xác định mức độ tương ứng giữa hình ảnh của đối tượng và chính đối tượng đó. Ở cấp độ này, thông tin mà thông tin phản ánh được phân tích, các kết nối ngữ nghĩa được xem xét, các khái niệm và ý tưởng được hình thành, ý nghĩa và nội dung của thông tin được tiết lộ và việc khái quát hóa nó được thực hiện.

Các vấn đề ở cấp độ này cực kỳ phức tạp, vì nội dung ngữ nghĩa của thông tin phụ thuộc nhiều vào người nhận hơn là ngữ nghĩa của thông điệp được trình bày bằng bất kỳ ngôn ngữ nào.

Ở mức độ thực tế, chúng tôi quan tâm đến hậu quả của việc người tiêu dùng nhận và sử dụng thông tin này. Các vấn đề ở cấp độ này liên quan đến việc xác định giá trị và tính hữu ích của việc sử dụng thông tin khi người tiêu dùng phát triển giải pháp để đạt được mục tiêu của mình. Khó khăn chính ở đây là giá trị và tính hữu ích của thông tin có thể hoàn toàn khác nhau đối với những người nhận khác nhau và ngoài ra, nó còn phụ thuộc vào một số yếu tố, chẳng hạn như tính kịp thời của việc cung cấp và sử dụng thông tin đó. Yêu cầu cao về tốc độ cung cấp thông tin thường được quyết định bởi thực tế là các hành động kiểm soát phải được thực hiện trong thời gian thực, tức là ở tốc độ thay đổi trạng thái của các đối tượng hoặc quy trình được kiểm soát. Sự chậm trễ trong việc cung cấp hoặc sử dụng thông tin có thể gây ra hậu quả thảm khốc.

Số lượng và chất lượng thông tin

Mức độ của vấn đề truyền tải thông tin

Khi thực hiện các quá trình thông tin, thông tin luôn được truyền tải trong không gian và thời gian từ nguồn thông tin đến người nhận (người nhận) bằng tín hiệu. Tín hiệu - một quá trình vật lý (hiện tượng) mang thông điệp (thông tin) về một sự kiện hoặc trạng thái của đối tượng quan sát.

Tin nhắn- một hình thức thể hiện thông tin dưới dạng một tập hợp các dấu hiệu (ký hiệu) dùng để truyền tải.

Thông điệp như một tập hợp các dấu hiệu theo quan điểm ký hiệu học - một ngành khoa học nghiên cứu các đặc tính của dấu hiệu và hệ thống dấu hiệu - có thể được nghiên cứu ở ba cấp độ:

1) cú pháp, trong đó các thuộc tính bên trong của thông điệp được xem xét, tức là mối quan hệ giữa các dấu hiệu, phản ánh cấu trúc của một hệ thống dấu hiệu nhất định.

2) ngữ nghĩa, trong đó các mối quan hệ giữa các dấu hiệu và đối tượng, hành động, phẩm chất mà chúng biểu thị được phân tích, tức là nội dung ngữ nghĩa của thông điệp, mối quan hệ của nó với nguồn thông tin;

3) thực dụng, trong đó mối quan hệ giữa tin nhắn và người nhận được xem xét, tức là nội dung người tiêu dùng của tin nhắn, mối quan hệ của nó với người nhận.

Các vấn đề cấp độ cú pháp liên quan đến việc tạo ra nền tảng lý thuyết cho việc xây dựng hệ thống thông tin. Ở cấp độ này, họ xem xét các vấn đề trong việc gửi tin nhắn đến người nhận dưới dạng một tập hợp các ký tự, có tính đến loại phương tiện và phương pháp trình bày thông tin, tốc độ truyền và xử lý, kích thước của mã trình bày thông tin, độ tin cậy và độ chính xác của việc chuyển đổi các mã này, v.v., trừu tượng hóa hoàn toàn nội dung ngữ nghĩa của tin nhắn và mục đích dự định của chúng. Ở cấp độ này, thông tin chỉ được xem xét từ góc độ cú pháp thường được gọi là dữ liệu, vì khía cạnh ngữ nghĩa không quan trọng.

Các vấn đề mức độ ngữ nghĩa gắn liền với việc hình thức hóa và tính đến ý nghĩa của thông tin được truyền đi, xác định mức độ tương ứng giữa hình ảnh của đối tượng và chính đối tượng đó. Ở cấp độ này, thông tin mà thông tin phản ánh được phân tích, các kết nối ngữ nghĩa được xem xét, các khái niệm và ý tưởng được hình thành, ý nghĩa và nội dung của thông tin được tiết lộ và việc khái quát hóa nó được thực hiện.



Ở mức độ thực dụng quan tâm đến hậu quả của việc người tiêu dùng nhận và sử dụng thông tin này. Các vấn đề ở cấp độ này liên quan đến việc xác định giá trị và tính hữu ích của việc sử dụng thông tin khi người tiêu dùng phát triển giải pháp để đạt được mục tiêu của mình. Khó khăn chính ở đây là giá trị và tính hữu ích của thông tin có thể hoàn toàn khác nhau đối với những người nhận khác nhau và ngoài ra, nó còn phụ thuộc vào một số yếu tố, chẳng hạn như tính kịp thời của việc cung cấp và sử dụng thông tin đó.

Biện pháp thông tin

Các thước đo thông tin ở cấp độ cú pháp

Để đo lường thông tin ở cấp độ cú pháp, hai tham số được đưa ra: lượng thông tin (dữ liệu) - VD(cách tiếp cận khối lượng) và lượng thông tin - TÔI(phương pháp entropy).

Khối lượng thông tin V D. Khi thực hiện các quy trình thông tin, thông tin được truyền đi dưới dạng tin nhắn, là một tập hợp các ký tự của bảng chữ cái bất kỳ. Nếu lượng thông tin chứa trong tin nhắn có một ký tự được coi là một thì khối lượng thông tin (dữ liệu) VD trong bất kỳ tin nhắn nào khác sẽ bằng số ký tự (chữ số) trong tin nhắn này.

Như vậy, trong hệ thập phân, một chữ số có trọng số bằng 10 và theo đó đơn vị đo lường thông tin sẽ là dit (chữ số thập phân). Trong trường hợp này, một tin nhắn có dạng N VD= P như vậy. Ví dụ: số có bốn chữ số 2003 có khối lượng dữ liệu V D = 4 điểm.

Trong hệ số nhị phân, một chữ số có trọng số bằng 2 và theo đó đơn vị đo thông tin sẽ là bit. (bit (chữ số nhị phân)- chữ số nhị phân). Trong trường hợp này, một tin nhắn có dạng N-số kỹ thuật số có khối lượng dữ liệu V D = p chút. Ví dụ: mã nhị phân 8 bit 11001011 có khối lượng dữ liệu VD= 8 bit.

Trong điện toán hiện đại, cùng với đơn vị dữ liệu tối thiểu là bit, đơn vị byte mở rộng, bằng 8 bit, được sử dụng rộng rãi. Khi làm việc với khối lượng thông tin lớn, các đơn vị đo lường lớn hơn được sử dụng để tính toán số lượng của nó, chẳng hạn như kilobyte (KB), megabyte (MB), gigabyte (GB), terabyte (TB):

1 kbyte = 1024 byte = 2 10 byte;

1 MB = 1024 KB = 2 20 byte = 1.048.576 byte;

1 GB = 1024 MB = 2 30 byte = 1.073.741.824 byte; .

1 TB = 1024 GB = 2 40 byte = 1.099.511.627.776 byte.

Lượng thông tin I (phương pháp entropy). Trong lý thuyết thông tin và mã hóa, phương pháp entropy để đo lường thông tin được áp dụng. Cách tiếp cận này dựa trên thực tế là việc thu thập thông tin luôn gắn liền với việc giảm tính đa dạng hoặc độ không chắc chắn (entropy) của hệ thống. Dựa trên điều này, lượng thông tin trong một tin nhắn được xác định như một thước đo để giảm sự không chắc chắn về trạng thái của một hệ thống nhất định sau khi nhận được tin nhắn. Khi người quan sát đã xác định được thứ gì đó trong một hệ vật lý, thì entropy của hệ sẽ giảm vì đối với người quan sát, hệ thống đã trở nên có trật tự hơn.

Như vậy, với cách tiếp cận entropy, thông tin được hiểu là giá trị định lượng của độ không đảm bảo đã biến mất trong quá trình nào đó (thử nghiệm, đo lường, v.v.). Trong trường hợp này, entropy được đưa vào như thước đo độ không chắc chắn N, và lượng thông tin là:

Ở đâu H tháng 4 - entropy tiên nghiệm về trạng thái của hệ thống đang nghiên cứu;

Có lẽ- entropy sau.

Hậu thế- bắt nguồn từ kinh nghiệm (kiểm tra, đo lường).

Một tiên nghiệm- một khái niệm đặc trưng cho kiến ​​thức có trước kinh nghiệm (kiểm tra) và độc lập với nó.

Trong trường hợp trong quá trình thử nghiệm, độ không đảm bảo đo hiện tại được loại bỏ (thu được kết quả cụ thể, tức là Có lẽ = 0), lượng thông tin nhận được trùng với entropy ban đầu

Chúng ta hãy xem hệ thống đang được nghiên cứu là một nguồn thông tin rời rạc (nguồn của các thông điệp rời rạc), theo đó chúng ta muốn nói đến một hệ thống vật lý có một tập hợp hữu hạn các trạng thái có thể có. Đây là rất nhiều MỘT= (Một 1, Một 2 , ..., một p) Các trạng thái của một hệ thống trong lý thuyết thông tin được gọi là bảng chữ cái trừu tượng hoặc bảng chữ cái của nguồn thông báo.

Các tiểu bang riêng lẻ a 1, a 2,..., a�được gọi là các chữ cái hoặc ký hiệu của bảng chữ cái.

Một hệ thống như vậy có thể ngẫu nhiên đảm nhận một trong số hữu hạn các trạng thái có thể có tại bất kỳ thời điểm nào. và tôi.

Vì một số trạng thái được nguồn chọn thường xuyên hơn và các trạng thái khác ít thường xuyên hơn, nên trong trường hợp chung, nó được đặc trưng bởi một tập hợp MỘT, tức là một tập hợp đầy đủ các trạng thái có xác suất xảy ra cộng lại bằng một:

và (2.2)

Hãy để chúng tôi giới thiệu thước đo độ không chắc chắn trong việc lựa chọn trạng thái nguồn. Nó cũng có thể được coi là thước đo lượng thông tin thu được với việc loại bỏ hoàn toàn sự không chắc chắn về các trạng thái có thể xảy ra như nhau của nguồn.

Sau đó tại N=1 chúng tôi nhận được TRÊN)= 0.

Cách đo này được nhà khoa học người Mỹ R. Hartley đề xuất vào năm 1928. Cơ số logarit trong công thức (2.3) không có tầm quan trọng cơ bản và chỉ xác định thang đo hoặc đơn vị đo, tùy thuộc vào cơ số logarit, các đơn vị sau đây. phép đo được sử dụng.

1. Bit - trong trường hợp này cơ số của logarit bằng 2:

(2.4)

2. Nits - trong trường hợp này cơ số của logarit bằng e:

3. Dits - trong trường hợp này cơ số của logarit bằng 10:

Trong khoa học máy tính, công thức (2.4) thường được sử dụng làm thước đo độ không đảm bảo. Trong trường hợp này, đơn vị của độ không đảm bảo được gọi là đơn vị nhị phân hoặc bit và biểu thị độ không đảm bảo của việc lựa chọn từ hai sự kiện có khả năng xảy ra như nhau.

Công thức (2.4) có thể thu được bằng thực nghiệm: để loại bỏ sự không chắc chắn trong tình huống có hai sự kiện có khả năng xảy ra như nhau, thì cần một kinh nghiệm và theo đó, một bit thông tin là cần thiết trong trường hợp độ không đảm bảo bao gồm bốn sự kiện có khả năng xảy ra như nhau, thì cần có 2 bit thông tin; là đủ để đoán sự thật mong muốn. Để xác định một lá bài từ bộ bài 32 lá, 5 bit thông tin là đủ, tức là chỉ cần đặt 5 câu hỏi với câu trả lời “có” hoặc “không” là đủ để xác định lá bài bạn đang tìm kiếm.

Biện pháp đề xuất cho phép giải quyết một số vấn đề thực tế nhất định khi tất cả các trạng thái có thể có của nguồn thông tin đều có cùng xác suất.

Nói chung, mức độ không chắc chắn trong việc thực hiện trạng thái của nguồn thông tin không chỉ phụ thuộc vào số lượng trạng thái mà còn phụ thuộc vào xác suất của các trạng thái này. Ví dụ: nếu một nguồn thông tin có hai trạng thái có thể có với xác suất là 0,99 và 0,01, thì độ không đảm bảo của lựa chọn sẽ nhỏ hơn đáng kể so với nguồn có hai trạng thái có thể xảy ra như nhau, vì trong trường hợp này, kết quả thực tế đã được xác định trước ( hiện thực hóa trạng thái, xác suất bằng 0,99).

Nhà khoa học người Mỹ K. Shannon khái quát hóa khái niệm thước đo độ không chắc chắn của sự lựa chọn H trong trường hợp H không chỉ phụ thuộc vào số lượng trạng thái mà còn phụ thuộc vào xác suất của các trạng thái này (xác suất số Pi lựa chọn nhân vật và tôi, bảng chữ cái A). Biện pháp này, đại diện cho độ không đảm bảo trung bình trên mỗi trạng thái, được gọi là entropy của một nguồn thông tin rời rạc:

(2.5)

Nếu chúng ta lại tập trung vào việc đo độ không đảm bảo đo theo đơn vị nhị phân, thì cơ số của logarit sẽ được lấy bằng hai:

(2.6)

Trong các cuộc bầu cử có thể xác suất được, xác suất p tôi =1/N công thức (2.6) được chuyển thành công thức của R. Hartley (2.3):

Biện pháp đề xuất được gọi là entropy không phải ngẫu nhiên. Thực tế là cấu trúc hình thức của biểu thức (2.5) trùng khớp với entropy của hệ vật lý, được định nghĩa trước đây bởi Boltzmann.

Sử dụng công thức (2.4) và (2.6), ta có thể xác định độ dư D bảng chữ cái nguồn tin nhắn MỘT, cho thấy các ký hiệu của một bảng chữ cái nhất định được sử dụng hợp lý như thế nào:

Ở đâu N tối đa (A) - entropy cực đại có thể được xác định theo công thức (2.4);

TRÊN) - entropy của nguồn xác định theo công thức (2.6).

Bản chất của biện pháp này là với một lựa chọn có khả năng xảy ra như nhau, tải thông tin tương tự trên một dấu hiệu có thể được đảm bảo bằng cách sử dụng bảng chữ cái nhỏ hơn so với trường hợp lựa chọn không bằng nhau.

Thông tin - nó là gì? Nó dựa trên cái gì? Nó theo đuổi những mục tiêu gì và hoàn thành những nhiệm vụ gì? Chúng tôi sẽ nói về tất cả điều này trong bài viết này.

thông tin chung

Phương pháp ngữ nghĩa để đo lường thông tin được sử dụng trong trường hợp nào? Bản chất của thông tin được sử dụng, khía cạnh nội dung của tin nhắn nhận được được quan tâm - đây là những dấu hiệu cho thấy việc sử dụng nó. Nhưng trước tiên, hãy giải thích nó là gì. Cần lưu ý rằng phương pháp ngữ nghĩa để đo lường thông tin là một cách tiếp cận chính thức khó khăn và chưa được hình thành đầy đủ. Nó được sử dụng để đo lượng ý nghĩa trong dữ liệu đã được nhận. Nói cách khác, lượng thông tin nhận được là cần thiết trong trường hợp này. Cách tiếp cận này được sử dụng để xác định nội dung của thông tin nhận được. Và nếu chúng ta đang nói về một cách đo lường thông tin theo ngữ nghĩa, chúng ta sử dụng khái niệm từ điển đồng nghĩa, có mối liên hệ chặt chẽ với chủ đề đang được xem xét. Nó đại diện cho cái gì?

Từ điển đồng nghĩa

Tôi xin giới thiệu ngắn gọn và trả lời một câu hỏi về phương pháp ngữ nghĩa để đo lường thông tin. Ai đã giới thiệu nó? Người sáng lập điều khiển học, Norbert Wiener, đã đề xuất sử dụng phương pháp này, nhưng nó đã nhận được sự phát triển đáng kể dưới ảnh hưởng của người đồng hương A. Yu của chúng tôi. Tên dùng để chỉ toàn bộ thông tin mà người nhận thông tin có. Nếu bạn so sánh từ điển đồng nghĩa với nội dung của tin nhắn đã nhận được, bạn có thể biết được nó đã giảm bớt sự không chắc chắn đến mức nào. Tôi muốn sửa một lỗi thường ảnh hưởng đến nhiều người. Vì vậy, họ tin rằng phương pháp đo lường thông tin theo ngữ nghĩa đã được Claude Shannon giới thiệu. Người ta không biết chính xác quan niệm sai lầm này nảy sinh như thế nào, nhưng ý kiến ​​\u200b\u200bnày là không chính xác. Claude Shannon đã giới thiệu một phương pháp thống kê để đo lường thông tin, “kế thừa” của nó là phương pháp ngữ nghĩa.

Phương pháp đồ họa để xác định lượng thông tin ngữ nghĩa trong tin nhắn nhận được

Tại sao bạn cần vẽ một cái gì đó? Đo lường ngữ nghĩa sử dụng khả năng này để truyền đạt một cách trực quan tính hữu ích của dữ liệu bằng đồ họa dễ hiểu. Điều này có ý nghĩa gì trong thực tế? Để giải thích tình trạng của sự việc, một mối quan hệ được vẽ dưới dạng biểu đồ. Nếu người dùng không có kiến ​​​​thức về bản chất của tin nhắn đã nhận (bằng 0), thì lượng thông tin ngữ nghĩa sẽ có cùng giá trị. Có thể tìm được giá trị tối ưu không? Đúng! Đây là tên của một từ điển đồng nghĩa, nơi có lượng thông tin ngữ nghĩa tối đa. Hãy xem xét một ví dụ nhỏ. Giả sử một người dùng nhận được một tin nhắn được viết bằng một ngôn ngữ nước ngoài xa lạ hoặc một người có thể đọc những gì được viết ở đó, nhưng đây không còn là tin tức mới đối với anh ta nữa vì tất cả những điều này đều đã được biết. Trong những trường hợp như vậy, họ nói rằng tin nhắn không chứa thông tin ngữ nghĩa.

Phát triển mang tính lịch sử

Điều này đáng lẽ phải được thảo luận cao hơn một chút, nhưng vẫn chưa quá muộn để bắt kịp. Phương pháp ngữ nghĩa để đo lường thông tin được Ralph Hartley giới thiệu lần đầu tiên vào năm 1928. Trước đây người ta đã đề cập rằng Claude Shannon thường được coi là người sáng lập. Tại sao lại có sự nhầm lẫn như vậy? Thực tế là, mặc dù phương pháp ngữ nghĩa để đo lường thông tin được Ralph Hartley giới thiệu vào năm 1928, nhưng chính Claude Shannon và Warren Weaver mới là người khái quát hóa nó vào năm 1948. Sau đó, người sáng lập điều khiển học, Norbert Wiener, đã hình thành ý tưởng về phương pháp từ điển đồng nghĩa, phương pháp này đã nhận được sự công nhận lớn nhất dưới dạng thước đo do Yu I. Schneider phát triển. Cần lưu ý rằng để hiểu được điều này, cần phải có trình độ kiến ​​\u200b\u200bthức khá cao.

Hiệu quả

Phương pháp từ điển đồng nghĩa mang lại cho chúng ta điều gì trong thực tế? Đó là một sự xác nhận thực sự cho luận điểm rằng thông tin có một tính chất như tính tương đối. Cần lưu ý rằng nó có giá trị tương đối (hoặc chủ quan). Để có thể đánh giá khách quan thông tin khoa học, khái niệm từ điển đồng nghĩa phổ quát đã được đưa ra. Mức độ thay đổi của nó cho thấy tầm quan trọng của những tri thức mà nhân loại tiếp nhận được. Đồng thời, không thể nói chính xác kết quả cuối cùng (hoặc trung gian) có thể thu được từ thông tin đó là gì. Hãy lấy máy tính làm ví dụ. Công nghệ máy tính được tạo ra trên cơ sở công nghệ đèn và trạng thái bit của từng phần tử kết cấu và ban đầu được sử dụng để thực hiện các phép tính. Bây giờ hầu hết mọi người đều có thứ gì đó hoạt động dựa trên công nghệ này: radio, điện thoại, máy tính, TV, máy tính xách tay. Ngay cả tủ lạnh, bếp nấu và chậu rửa hiện đại cũng chứa một số thiết bị điện tử, cơ sở của chúng là thông tin về việc giúp một người sử dụng các thiết bị gia dụng này dễ dàng hơn.

Cách tiếp cận khoa học

Phương pháp đo lường thông tin ngữ nghĩa được nghiên cứu ở đâu? Khoa học máy tính là ngành khoa học giải quyết các khía cạnh khác nhau của vấn đề này. Điểm đặc biệt là gì? Phương pháp này dựa trên việc sử dụng hệ thống “đúng/sai” hoặc hệ thống bit “một/không”. Khi một thông tin nhất định đến, nó sẽ được chia thành các khối riêng biệt, được đặt tên giống như các đơn vị lời nói: từ, âm tiết và những thứ tương tự. Mỗi khối nhận được một giá trị cụ thể. Hãy xem xét một ví dụ nhỏ. Hai người bạn đang đứng gần đó. Người ta quay sang người thứ hai với dòng chữ: “Ngày mai chúng ta có một ngày nghỉ”. Mọi người đều biết khi nào là ngày để nghỉ ngơi. Vì vậy, giá trị của thông tin này là bằng không. Nhưng nếu người thứ hai nói rằng ngày mai anh ấy sẽ làm việc, thì đối với người thứ nhất, đó sẽ là một điều bất ngờ. Thật vậy, trong trường hợp này, có thể các kế hoạch mà một người đã thực hiện, chẳng hạn như đi chơi bowling hoặc lục lọi trong xưởng, sẽ bị gián đoạn. Mỗi phần của ví dụ được mô tả có thể được mô tả bằng cách sử dụng số một và số không.

Hoạt động với các khái niệm

Nhưng những gì khác được sử dụng ngoài từ điển đồng nghĩa? Bạn cần biết điều gì khác để hiểu cách đo lường thông tin theo ngữ nghĩa? Các khái niệm cơ bản có thể được nghiên cứu sâu hơn là hệ thống ký hiệu. Chúng được hiểu là phương tiện biểu đạt ý nghĩa, chẳng hạn như các quy tắc diễn giải các dấu hiệu hoặc sự kết hợp của chúng. Hãy xem một ví dụ khác từ khoa học máy tính. Máy tính hoạt động với các số 0 và số 1 thông thường. Về cơ bản, đây là điện áp cao và thấp được cung cấp cho các bộ phận của thiết bị. Hơn nữa, họ truyền tải những số 1 và số 0 này một cách vô tận. Công nghệ có thể phân biệt chúng như thế nào? Câu trả lời cho điều này đã được tìm thấy - sự gián đoạn. Khi thông tin tương tự này được truyền đi, sẽ thu được nhiều khối khác nhau như từ, cụm từ và ý nghĩa riêng lẻ. Trong lời nói của con người, các khoảng dừng cũng được sử dụng để chia dữ liệu thành các khối riêng biệt. Chúng vô hình đến mức chúng ta tự động nhận thấy hầu hết chúng. Trong văn bản, dấu chấm và dấu phẩy được sử dụng cho mục đích này.

Đặc thù

Chúng ta cũng hãy đề cập đến chủ đề về các thuộc tính mà phương pháp đo lường thông tin ngữ nghĩa có. Chúng ta đã biết rằng đây là tên của một phương pháp đặc biệt nhằm đánh giá tầm quan trọng của thông tin. Chúng ta có thể nói rằng dữ liệu được đánh giá theo cách này sẽ khách quan không? Không, điều đó không đúng. Thông tin mang tính chủ quan. Hãy xem xét điều này bằng cách sử dụng một trường học làm ví dụ. Có một học sinh xuất sắc vượt chương trình đã được phê duyệt, và một học sinh trung bình học những gì được dạy trên lớp. Đầu tiên, hầu hết thông tin trẻ nhận được ở trường sẽ ít được quan tâm vì trẻ đã biết thông tin đó và chưa nghe/đọc nó lần đầu tiên. Vì vậy, ở mức độ chủ quan, nó sẽ không có giá trị lắm đối với anh ấy (có lẽ do một số nhận xét của giáo viên mà anh ấy nhận thấy khi trình bày môn học của mình). Trong khi một người bình thường chỉ nghe được thông tin mới từ xa, thì đối với anh ta, giá trị của dữ liệu được trình bày trong bài học còn lớn hơn nhiều.

Phần kết luận

Cần lưu ý rằng trong khoa học máy tính, phương pháp đo lường thông tin ngữ nghĩa không phải là lựa chọn duy nhất để giải quyết các vấn đề hiện có. Sự lựa chọn nên phụ thuộc vào mục tiêu đặt ra và các cơ hội hiện có. Do đó, nếu bạn quan tâm đến chủ đề này hoặc có nhu cầu về nó, thì chúng tôi thực sự khuyên bạn nên nghiên cứu nó chi tiết hơn và tìm hiểu xem còn tồn tại những phương pháp đo lường thông tin nào khác ngoài ngữ nghĩa.