Mức độ của vấn đề truyền tải thông tin. Các biện pháp cú pháp, ngữ nghĩa và thực dụng của thông tin

Chuyên đề 2. Cơ bản về biểu diễn và xử lý thông tin trên máy tính

Văn học

1. Tin học kinh tế: Sách giáo khoa/Ed. LÀ. Odintsova, A.N. Romanova. – M.: Sách giáo khoa đại học, 2008.

2. Khoa học máy tính: Khóa học cơ bản: Sách giáo khoa/Ed. S.V. Simonovich. – St.Petersburg: Peter, 2009.

3. Khoa học máy tính. Khóa học tổng quát: Sách giáo khoa/Đồng tác giả: A.N. Guda, MA Butakova, N.M. Nechitailo, A.V. Chernov; Dưới sự chung chung biên tập. TRONG VA. Kolesnikova. – M.: Dashkov và K, 2009.

4. Tin học dành cho nhà kinh tế: Sách giáo khoa/Ed. Matyushka V.M. - M.: Infra-M, 2006.

5. Tin học kinh tế: Nhập môn phân tích kinh tế hệ thống thông tin - M.: INFRA-M, 2005.

Các biện pháp thông tin (cú pháp, ngữ nghĩa, thực dụng)

Có thể sử dụng nhiều phương pháp khác nhau để đo lường thông tin, nhưng phương pháp được sử dụng rộng rãi nhất là thống kê(xác suất), ngữ nghĩa và P thực dụng phương pháp.

Thống kê Phương pháp đo lường thông tin (xác suất) được phát triển bởi K. Shannon vào năm 1948, người đã đề xuất coi lượng thông tin là thước đo độ không chắc chắn về trạng thái của hệ thống, trạng thái này bị loại bỏ do nhận được thông tin. Biểu thức định lượng của độ không đảm bảo được gọi là entropy. Nếu sau khi nhận được một tin nhắn nhất định, người quan sát đã có được thông tin bổ sung về hệ thống X, thì độ không chắc chắn đã giảm. Lượng thông tin bổ sung nhận được được xác định là:

lượng thông tin bổ sung về hệ thống ở đâu X, nhận được dưới dạng tin nhắn;

Độ không đảm bảo ban đầu (entropy) của hệ thống X;

Độ không đảm bảo hữu hạn (entropy) của hệ thống X, xảy ra sau khi nhận được tin nhắn.

Nếu hệ thống X có thể ở một trong những trạng thái rời rạc, số lượng trạng thái đó N và xác suất tìm thấy hệ thống trong mỗi trạng thái đó bằng nhau và tổng xác suất của tất cả các trạng thái bằng 1, khi đó entropy được tính bằng công thức của Shannon:

entropy của hệ X ở đâu;

MỘT- cơ số logarit, xác định đơn vị đo thông tin;

N– số trạng thái (giá trị) mà hệ thống có thể có.

Entropy là một đại lượng dương và vì xác suất luôn nhỏ hơn một và logarit của chúng âm nên dấu trừ trong công thức của K. Shannon làm cho entropy dương. Do đó, cùng một entropy nhưng có dấu ngược lại được lấy làm thước đo lượng thông tin.

Mối quan hệ giữa thông tin và entropy có thể được hiểu như sau: thu được thông tin (sự gia tăng của nó) đồng thời đồng nghĩa với việc giảm thiểu sự thiếu hiểu biết hoặc sự không chắc chắn về thông tin (entropy)

Do đó, phương pháp thống kê sẽ tính đến khả năng xuất hiện của thông báo: thông báo ít có khả năng được coi là có nhiều thông tin hơn, tức là. Ít nhất mong đợi. Lượng thông tin đạt giá trị tối đa nếu các sự kiện có khả năng xảy ra như nhau.

R. Hartley đề xuất công thức sau để đo lường thông tin:

Tôi=log2n ,

Ở đâu N- số lượng các sự kiện có thể xảy ra như nhau;

TÔI– thước đo thông tin trong bản tin về sự xuất hiện của một trong các N sự kiện

Việc đo lường thông tin được thể hiện ở khối lượng của nó. Thông thường điều này liên quan đến dung lượng bộ nhớ máy tính và lượng dữ liệu được truyền qua các kênh liên lạc. Một đơn vị được coi là lượng thông tin mà tại đó độ không đảm bảo đo giảm đi một nửa; đơn vị thông tin đó được gọi là chút .

Nếu logarit tự nhiên () được dùng làm cơ số của logarit trong công thức Hartley thì đơn vị đo thông tin là tự nhiên ( 1 bit = ln2 ≈ 0,693 nat). Nếu số 3 được dùng làm cơ số của logarit thì - đối xử, nếu 10 thì - như vậy (Hartley).

Trong thực tế, đơn vị lớn hơn thường được sử dụng nhiều hơn - byte(byte) bằng 8 bit. Đơn vị này được chọn vì nó có thể được sử dụng để mã hóa bất kỳ ký tự nào trong số 256 ký tự của bảng chữ cái bàn phím máy tính (256=28).

Ngoài byte, thông tin còn được đo bằng nửa từ (2 byte), từ (4 byte) và từ kép (8 byte). Thậm chí các đơn vị đo lường thông tin lớn hơn cũng được sử dụng rộng rãi:

1 Kilobyte (KB - kilobyte) = 1024 byte = 210 byte,

1 Megabyte (MB - megabyte) = 1024 KB = 220 byte,

1 Gigabyte (GB - gigabyte) = 1024 MB = 230 byte.

1 Terabyte (TB - terabyte) = 1024 GB = 240 byte,

1 Petabyte (PByte - petabyte) = 1024 TB = 250 byte.

Năm 1980, nhà toán học người Nga Yu. Manin đề xuất ý tưởng xây dựng một máy tính lượng tử, nhờ đó một đơn vị thông tin như vậy xuất hiện dưới dạng qubit ( bit lượng tử, qubit ) – “bit lượng tử” là thước đo lượng bộ nhớ trong một dạng máy tính có thể có về mặt lý thuyết sử dụng môi trường lượng tử, ví dụ như spin electron. Một qubit không thể có hai giá trị khác nhau (“0” và “1”) mà là một số giá trị, tương ứng với sự kết hợp chuẩn hóa của hai trạng thái quay mặt đất, mang lại số lượng kết hợp có thể lớn hơn. Như vậy, 32 qubit có thể mã hóa khoảng 4 tỷ trạng thái.

Cách tiếp cận ngữ nghĩa. Biện pháp cú pháp là không đủ nếu bạn không cần xác định khối lượng dữ liệu mà là lượng thông tin cần thiết trong tin nhắn. Trong trường hợp này, khía cạnh ngữ nghĩa được xem xét, cho phép chúng tôi xác định nội dung của thông tin.

Để đo lường nội dung ngữ nghĩa của thông tin, bạn có thể sử dụng từ điển đồng nghĩa của người nhận (người tiêu dùng). Ý tưởng về phương pháp từ điển đồng nghĩa được đề xuất bởi N. Wiener và được phát triển bởi nhà khoa học trong nước A.Yu của chúng tôi. Schrader.

Từ điển đồng nghĩa gọi điện nội dung thông tin mà người nhận thông tin có. Việc liên kết từ điển đồng nghĩa với nội dung của tin nhắn nhận được cho phép bạn tìm hiểu xem nó làm giảm mức độ không chắc chắn đến mức nào.

Sự phụ thuộc của khối lượng thông tin ngữ nghĩa của tin nhắn vào từ điển đồng nghĩa của người nhận

Theo sự phụ thuộc được trình bày trên biểu đồ, nếu người dùng không có bất kỳ từ điển đồng nghĩa nào (kiến thức về bản chất của tin nhắn nhận được là = 0) hoặc sự hiện diện của một từ điển đồng nghĩa như vậy không thay đổi do việc đến của thông báo (), thì lượng thông tin ngữ nghĩa trong đó bằng 0. Từ điển đồng nghĩa tối ưu () sẽ là từ điển trong đó khối lượng thông tin ngữ nghĩa sẽ đạt mức tối đa (). Ví dụ: thông tin ngữ nghĩa trong một tin nhắn đến trên bằng một ngôn ngữ nước ngoài xa lạ sẽ không có, nhưng tình huống tương tự sẽ xảy ra trong trường hợp nếu tin nhắn không còn là tin tức nữa, vì người dùng đã biết mọi thứ.

Biện pháp thực dụng thông tin xác định tính hữu dụng của nó trong việc đạt được mục tiêu của người tiêu dùng. Để làm được điều này, chỉ cần xác định xác suất đạt được mục tiêu trước và sau khi nhận được tin nhắn rồi so sánh chúng là đủ. Giá trị của thông tin (theo A.A. Kharkevich) được tính bằng công thức:

xác suất đạt được mục tiêu trước khi nhận được tin nhắn là bao nhiêu;

Xác suất đạt được mục tiêu là trường nhận được tin nhắn;

Thước đo cú pháp của thông tin

Cơm. 1.1. Biện pháp thông tin

Thước đo cú pháp hoạt động dựa trên khối lượng dữ liệu và lượng thông tin I được biểu thị thông qua entropy (khái niệm về độ không chắc chắn về trạng thái của hệ thống).

Thước đo ngữ nghĩa hoạt động dựa trên lượng thông tin được thể hiện thông qua khối lượng và mức độ nội dung của nó.

Một biện pháp thực dụng được xác định bởi tính hữu dụng của nó, thể hiện thông qua hiệu quả kinh tế tương ứng.

Thước đo cú pháp của thông tin

Thước đo lượng thông tin này hoạt động với thông tin khách quan không thể hiện mối quan hệ ngữ nghĩa với đối tượng.

Ngày nay, các phương pháp đo lường định lượng thông tin sau đây được biết đến nhiều nhất: thể tích, entropy, thuật toán.

Thể tích là cách đơn giản và thô sơ nhất để đo lường thông tin. Việc đánh giá định lượng tương ứng của thông tin đương nhiên có thể được gọi là khối lượng thông tin.

Lượng thông tin là số ký tự trong tin nhắn. Vì cùng một số có thể được viết theo nhiều cách khác nhau, tức là sử dụng các bảng chữ cái khác nhau, ví dụ 21 - 21 - XXI - 11001, phương pháp này rất nhạy cảm với hình thức trình bày (ghi âm) của thông điệp. Trong điện toán, tất cả thông tin được xử lý và lưu trữ, bất kể bản chất của nó (số, văn bản, hiển thị), đều được trình bày dưới dạng nhị phân (sử dụng bảng chữ cái chỉ gồm hai ký tự “0” và “1”).

Trong hệ số nhị phân, đơn vị đo là bit (bit – chữ số nhị phân – chữ số nhị phân).

Trong lý thuyết thông tin, một bit là lượng thông tin cần thiết để phân biệt giữa hai thông điệp có khả năng xảy ra như nhau; và trong điện toán, một bit là “phần” bộ nhớ nhỏ nhất cần thiết để lưu trữ một trong hai ký tự “0” và “1” được sử dụng để biểu diễn dữ liệu và lệnh bên trong máy. Đây là một đơn vị đo lường quá nhỏ; trong thực tế, đơn vị lớn hơn thường được sử dụng - một byte - bằng 8 bit cần thiết để mã hóa bất kỳ ký tự nào trong số 256 ký tự của bảng chữ cái bàn phím máy tính (256 = 2 8).

Thậm chí các đơn vị thông tin dẫn xuất lớn hơn cũng được sử dụng rộng rãi:

1 kilobyte (kbyte) = 1024 byte = 2 10 byte;

1 Megabyte (MB) = 1024 KB = 2 20 byte;

1 Gigabyte (GB) = 1024 MB = 2 30 byte.

Gần đây, do khối lượng thông tin được xử lý tăng lên, các đơn vị phái sinh sau đã được đưa vào sử dụng:

1 Terabyte (TB) = 1024 GB = 2 40 byte;

1 Petabyte (PB) = 1024 TB = 2 50 byte.

Trong hệ thập phân, đơn vị đo là dit (chữ số thập phân).

Một thông báo trong hệ nhị phân ở dạng mã nhị phân 8 bit 1011 1011 có khối lượng dữ liệu V D = 8 bit.

Một thông báo trong hệ thập phân dưới dạng số có sáu chữ số 275 903 có khối lượng dữ liệu V D = 6 bit.

Trong lý thuyết thông tin và mã hóa, phương pháp entropy để đo lường thông tin được áp dụng. Việc thu thập thông tin về một hệ thống luôn gắn liền với sự thay đổi về mức độ thiếu hiểu biết của người nhận về trạng thái của hệ thống này. Phương pháp đo lường này xuất phát từ mô hình sau.

Hãy để người tiêu dùng có một số thông tin sơ bộ (tiên nghiệm) về hệ thống α trước khi nhận được thông tin. Sau khi nhận được tin nhắn b, người nhận đã có thêm một số thông tin I(b), giúp giảm bớt sự thiếu hiểu biết của anh ta. Thông tin này nói chung là không đáng tin cậy và được thể hiện bằng xác suất mà anh ta mong đợi sự kiện này hoặc sự kiện kia. Thước đo chung của độ không đảm bảo (entropy) được đặc trưng bởi một số sự phụ thuộc toán học vào tổng các xác suất này. Lượng thông tin trong một tin nhắn được xác định bằng mức độ giảm đi của biện pháp này sau khi nhận được tin nhắn.

Do đó, kỹ sư người Mỹ R. Hartley (1928) coi quá trình thu thập thông tin là việc lựa chọn một thông báo từ một tập hợp hữu hạn N thông báo có khả năng xảy ra như nhau và lượng thông tin tôi chứa trong thông báo đã chọn được định nghĩa là nhị phân. logarit của N (công thức Hartley):

Giả sử bạn cần đoán một số từ một dãy số từ một đến một trăm. Sử dụng công thức của Hartley, bạn có thể tính toán lượng thông tin cần thiết cho việc này: , tức là, một thông báo về một số được đoán đúng chứa một lượng thông tin xấp xỉ bằng 6,644 đơn vị thông tin.

Các ví dụ khác về các tin nhắn có khả năng tương đương:

1) khi tung một đồng xu, “nó ngửa”, “ngưng”;

2) trên trang sách “số chữ cái là số chẵn”, “số chữ cái là số lẻ”.

Không thể trả lời một cách dứt khoát câu hỏi liệu thông điệp “người phụ nữ sẽ là người đầu tiên rời khỏi cửa tòa nhà” và “người đàn ông sẽ là người đầu tiên rời khỏi cửa tòa nhà” có khả năng xảy ra như nhau hay không. Tất cả phụ thuộc vào loại tòa nhà mà chúng ta đang nói đến. Ví dụ: nếu đây là ga tàu điện ngầm, thì xác suất ra khỏi cửa trước đối với nam và nữ là như nhau, còn nếu đây là doanh trại quân đội thì đối với nam, xác suất này cao hơn nhiều so với nữ .

Đối với những vấn đề thuộc loại này, nhà khoa học người Mỹ Claude Shannon đã đề xuất vào năm 1948 một công thức khác để xác định lượng thông tin, có tính đến xác suất có thể không bằng nhau của các thông điệp trong một tập hợp (công thức của Shannon):

xác suất để thông báo thứ i được chọn trong tập hợp N thông báo là bao nhiêu.

Dễ dàng nhận thấy rằng nếu các xác suất ... bằng nhau thì mỗi xác suất đó bằng nhau và công thức Shannon trở thành công thức Hartley.

Ngoài hai phương pháp được xem xét để xác định lượng thông tin, còn có những phương pháp khác. Điều quan trọng cần nhớ là bất kỳ kết quả lý thuyết nào cũng chỉ có thể áp dụng được cho một phạm vi trường hợp nhất định, được vạch ra bởi các giả định ban đầu.

Lý thuyết thông tin thuật toán (một phần của lý thuyết thuật toán) đề xuất một phương pháp thuật toán để đánh giá thông tin trong một tin nhắn. Bất kỳ thông báo nào cũng có thể được gán một đặc tính định lượng phản ánh độ phức tạp (kích thước) của chương trình cho phép tạo ra nó.

Hệ số (mức độ) nội dung thông tin (sự ngắn gọn) của một tin nhắn được xác định bằng tỷ lệ giữa lượng thông tin trên tổng khối lượng dữ liệu nhận được:

và 0< Y < 1.

Khi Y tăng lên, khối lượng công việc chuyển đổi thông tin (dữ liệu) trong hệ thống sẽ giảm đi. Vì vậy, cần phải cố gắng nâng cao nội dung thông tin, theo đó các phương pháp đặc biệt để mã hóa thông tin tối ưu đang được phát triển.

1.4.2.2 Đo lường ngữ nghĩa của thông tin

Ngữ nghĩa là khoa học về ý nghĩa, nội dung của thông tin.

Để đo lường nội dung ngữ nghĩa của thông tin, tức là số lượng của nó ở cấp độ ngữ nghĩa, thước đo từ điển đồng nghĩa, kết nối các thuộc tính ngữ nghĩa của thông tin với khả năng chấp nhận tin nhắn đến của người dùng, đã nhận được sự công nhận lớn nhất. Cùng một thông điệp thông tin (bài báo, quảng cáo, thư, điện tín, chứng chỉ, câu chuyện, hình vẽ, phát thanh, v.v.) có thể chứa lượng thông tin khác nhau đối với những người khác nhau tùy thuộc vào kiến ​​thức trước đây của họ, mức độ hiểu biết về thông điệp này và sự quan tâm đến anh ta.

Để đo lượng thông tin ngữ nghĩa, khái niệm “từ điển đồng nghĩa của người dùng” được sử dụng, tức là tổng số thông tin có sẵn cho người dùng hoặc hệ thống.

Tùy thuộc vào mối quan hệ giữa nội dung ngữ nghĩa của thông tin S và từ điển đồng nghĩa S p của người dùng, lượng thông tin ngữ nghĩa mà người dùng cảm nhận được và sau đó được anh ta đưa vào từ điển đồng nghĩa của mình sẽ thay đổi. Bản chất của sự phụ thuộc này được thể hiện trong Hình 1.2.

Cơm. 1. 2. Sự phụ thuộc của lượng thông tin ngữ nghĩa mà người tiêu dùng cảm nhận được vào từ điển đồng nghĩa I C = f(S p)

Hãy xem xét hai trường hợp giới hạn khi lượng thông tin ngữ nghĩa I C bằng 0:

Tại người dùng không nhận biết hoặc hiểu thông tin đến;

Tại người dùng biết mọi thứ và không cần thông tin đến.

Người tiêu dùng thu được lượng thông tin ngữ nghĩa tối đa khi phối hợp nội dung ngữ nghĩa S của nó với từ điển đồng nghĩa của mình ( ), khi thông tin đến có thể hiểu được đối với người dùng và cung cấp cho anh ta thông tin chưa biết trước đó (không có trong từ điển đồng nghĩa của anh ta).

Vì vậy, lượng thông tin ngữ nghĩa và kiến ​​thức mới trong một thông điệp mà người dùng nhận được là một giá trị tương đối.

Một thước đo tương đối về lượng thông tin ngữ nghĩa có thể là hệ số nội dung C, được định nghĩa là tỷ lệ giữa lượng thông tin ngữ nghĩa với khối lượng của nó.

Để đo lường nội dung ngữ nghĩa của thông tin, tức là số lượng của nó ở cấp độ ngữ nghĩa, được công nhận nhiều nhất là thước đo từ điển đồng nghĩa, kết nối các thuộc tính ngữ nghĩa của thông tin với khả năng chấp nhận tin nhắn đến của người dùng. Với mục đích này, khái niệm được sử dụng từ điển đồng nghĩa của người dùng.

Từ điển đồng nghĩa là tập hợp thông tin có sẵn cho người dùng hoặc hệ thống.

Tùy thuộc vào mối quan hệ giữa nội dung ngữ nghĩa của thông tin S và từ điển đồng nghĩa của người dùng S p số lượng thông tin ngữ nghĩa thay đổi Ic,được người dùng cảm nhận và sau đó được anh ta đưa vào từ điển đồng nghĩa của mình. Bản chất của sự phụ thuộc này được thể hiện ở Hình 2.2. Chúng ta hãy xem xét hai trường hợp giới hạn khi lượng thông tin ngữ nghĩa Ic bằng 0:

Tại S p 0 người dùng không nhận biết hoặc hiểu thông tin đến;

Tại Sp; người dùng biết mọi thứ nhưng anh ta không cần thông tin đến.

Cơm. 2.2. Sự phụ thuộc của lượng thông tin ngữ nghĩa. được người tiêu dùng cảm nhận từ từ điển đồng nghĩa của anh ta Ic=f(Sp)

Lượng thông tin ngữ nghĩa tối đa Ic người tiêu dùng có được bằng cách đồng ý về nội dung ngữ nghĩa của nó S với từ điển đồng nghĩa của bạn S p (S p = S p opt), khi thông tin đến có thể hiểu được đối với người dùng và cung cấp cho anh ta thông tin chưa biết trước đó (không có trong từ điển đồng nghĩa của anh ta).

Do đó, lượng thông tin ngữ nghĩa trong một tin nhắn, lượng kiến ​​thức mới mà người dùng nhận được là một giá trị tương đối. Thông báo tương tự có thể có nội dung có ý nghĩa đối với người dùng thành thạo và vô nghĩa (nhiễu ngữ nghĩa) đối với người dùng không đủ năng lực.

Khi đánh giá khía cạnh ngữ nghĩa (nội dung) của thông tin cần cố gắng hài hòa các giá trị SSp.

Một thước đo tương đối về lượng thông tin ngữ nghĩa có thể là hệ số nội dung VỚI, được định nghĩa là tỷ lệ giữa lượng thông tin ngữ nghĩa với khối lượng của nó:

Đo lường thông tin thực tế

Biện pháp này xác định tính hữu ích của thông tin (giá trị) đối với người dùng để đạt được mục tiêu của mình. Thước đo này cũng là một giá trị tương đối, được xác định bởi đặc thù của việc sử dụng thông tin này trong một hệ thống cụ thể. Nên đo giá trị của thông tin trong cùng đơn vị (hoặc gần với chúng) trong đó hàm mục tiêu được đo.



Ví dụ 2.5. Trong một hệ thống kinh tế, các đặc tính (giá trị) thực dụng của thông tin có thể được xác định bằng sự gia tăng hiệu quả kinh tế của hoạt động đạt được thông qua việc sử dụng thông tin này để quản lý hệ thống:

Inb(g)=P(g /b)-P(g),

Ở đâu Inb(g)-giá trị của thông báo thông tin b cho hệ thống điều khiển g,

P(g)- hiệu quả kinh tế dự kiến ​​trước đây của hoạt động của hệ thống điều khiển g ,

P(g/b)- tác động mong đợi của hoạt động của hệ thống g, với điều kiện là thông tin chứa trong thông báo b được sử dụng để kiểm soát.

Để so sánh, chúng tôi trình bày các thước đo thông tin được giới thiệu trong Bảng 2.1.

Bảng 2.1. Đơn vị thông tin và ví dụ

CHẤT LƯỢNG THÔNG TIN

Khả năng và hiệu quả của việc sử dụng thông tin được xác định bởi nhu cầu cơ bản của người tiêu dùng: chỉ số chất lượng, như tính đại diện, ý nghĩa, tính đầy đủ, khả năng tiếp cận, tính phù hợp, tính kịp thời, tính chính xác, độ tin cậy, tính bền vững.

  • Tính đại diện thông tin gắn liền với tính đúng đắn của việc lựa chọn và hình thành nó nhằm phản ánh đầy đủ các đặc tính của đối tượng. Những điều quan trọng nhất ở đây là:
  • tính đúng đắn của khái niệm trên cơ sở hình thành khái niệm ban đầu;
  • giá trị của việc lựa chọn các tính năng thiết yếu và các mối liên hệ của hiện tượng được hiển thị.
  • Vi phạm tính đại diện của thông tin thường dẫn đến sai sót nghiêm trọng.
  • Nội dung thông tin phản ánh năng lực ngữ nghĩa bằng tỷ lệ giữa lượng thông tin ngữ nghĩa trong một tin nhắn với khối lượng dữ liệu được xử lý, tức là. C=Ic/Vd.

Khi nội dung thông tin tăng lên, thông lượng ngữ nghĩa của hệ thống thông tin cũng tăng lên, vì để có được cùng một thông tin cần phải chuyển đổi một lượng dữ liệu nhỏ hơn.

Cùng với hệ số nội dung C phản ánh khía cạnh ngữ nghĩa, bạn cũng có thể sử dụng hệ số nội dung thông tin, đặc trưng bằng tỷ lệ giữa lượng thông tin cú pháp (theo Shannon) và lượng dữ liệu. Y=I/Vd.

  • Đầy đủ (đầy đủ) thông tin có nghĩa là nó chứa đựng thành phần (bộ chỉ số) tối thiểu nhưng đầy đủ để đưa ra quyết định đúng đắn. Khái niệm về tính đầy đủ của thông tin gắn liền với nội dung ngữ nghĩa (ngữ nghĩa) và tính thực dụng của nó. Là không đầy đủ, tức là. Thông tin không đầy đủ để đưa ra quyết định đúng đắn và thông tin dư thừa làm giảm hiệu quả của các quyết định của người dùng.
  • khả dụng thông tin đến nhận thức của người dùng được đảm bảo bằng việc thực hiện các thủ tục thích hợp để thu thập và chuyển đổi thông tin đó. Ví dụ, trong một hệ thống thông tin, thông tin được chuyển đổi thành dạng dễ tiếp cận và thân thiện với người dùng. Đặc biệt, điều này đạt được bằng cách phối hợp hình thức ngữ nghĩa của nó với từ điển đồng nghĩa của người dùng.
  • Mức độ liên quan Thông tin được xác định bởi mức độ lưu giữ giá trị của thông tin để quản lý tại thời điểm sử dụng và phụ thuộc vào động lực thay đổi các đặc điểm của thông tin đó cũng như vào khoảng thời gian đã trôi qua kể từ khi thông tin này xuất hiện.
  • Tính kịp thời thông tin là thông tin đến không muộn hơn một thời điểm đã xác định trước, phù hợp với thời điểm giải quyết công việc.
  • Sự chính xác thông tin được xác định bởi mức độ gần gũi của thông tin nhận được với trạng thái thực của đối tượng, quá trình, hiện tượng, v.v. Đối với thông tin được hiển thị bằng mã kỹ thuật số, có bốn khái niệm phân loại về độ chính xác:
  • độ chính xác hình thức, được đo bằng giá trị đơn vị của chữ số có nghĩa nhỏ nhất của một số;
  • độ chính xác thực sự, được xác định bằng giá trị đơn vị của chữ số cuối cùng của số, độ chính xác được đảm bảo;
  • độ chính xác tối đa có thể đạt được trong các điều kiện vận hành cụ thể của hệ thống;
  • độ chính xác cần thiết, được xác định bởi mục đích chức năng của chỉ báo.

Sự uy tín thông tin được xác định bởi tính chất phản ánh sự vật có thật trong đời sống với độ chính xác cần thiết. Độ tin cậy của thông tin được đo bằng xác suất tin cậy của độ chính xác cần thiết, tức là xác suất mà giá trị của một tham số được hiển thị bằng thông tin khác với giá trị thực của tham số này trong độ chính xác yêu cầu.

Sự bền vững thông tin phản ánh khả năng đáp ứng những thay đổi trong dữ liệu nguồn mà không vi phạm độ chính xác cần thiết. Tính ổn định của thông tin cũng như tính đại diện được xác định bởi phương pháp đã chọn để lựa chọn và hình thành thông tin.

Tóm lại, cần lưu ý rằng các thông số về chất lượng thông tin như tính đại diện, nội dung, tính đầy đủ, khả năng tiếp cận, tính bền vững hoàn toàn được xác định ở cấp độ phương pháp phát triển hệ thống thông tin. Các tham số về mức độ phù hợp, kịp thời, chính xác và độ tin cậy cũng được xác định ở mức độ lớn hơn ở cấp độ phương pháp luận, nhưng giá trị của chúng bị ảnh hưởng đáng kể bởi bản chất hoạt động của hệ thống, chủ yếu là độ tin cậy của nó. Đồng thời, các thông số về mức độ phù hợp và độ chính xác có liên quan chặt chẽ với các thông số về tính kịp thời và độ tin cậy tương ứng.

Như đã lưu ý, khái niệm thông tin có thể được xem xét dưới nhiều hạn chế khác nhau áp đặt lên các thuộc tính của nó, tức là ở những mức độ xem xét khác nhau. Chủ yếu có ba cấp độ - cú pháp, ngữ nghĩa và thực dụng. Theo đó, tại mỗi người trong số họ, các ước tính khác nhau được sử dụng để xác định lượng thông tin.

Ở cấp độ cú pháp, để ước tính lượng thông tin, các phương pháp xác suất được sử dụng, chỉ tính đến các thuộc tính xác suất của thông tin và không tính đến các thuộc tính khác (nội dung ngữ nghĩa, tính hữu ích, mức độ liên quan, v.v.). Được phát triển vào giữa thế kỷ 20. toán học và đặc biệt là các phương pháp xác suất giúp hình thành một cách tiếp cận để đánh giá lượng thông tin như một thước đo làm giảm độ không chắc chắn của kiến ​​thức.

Cách tiếp cận này, còn được gọi là xác suất, đưa ra nguyên tắc: nếu một thông điệp nào đó làm giảm đi tính không chắc chắn trong kiến ​​thức của chúng ta, thì chúng ta có thể nói rằng thông điệp đó chứa thông tin. Trong trường hợp này, tin nhắn chứa thông tin về bất kỳ sự kiện nào có thể xảy ra với xác suất khác nhau.

Một công thức xác định lượng thông tin cho các sự kiện có xác suất khác nhau và nhận được từ một nguồn thông tin rời rạc được nhà khoa học người Mỹ K. Shannon đề xuất vào năm 1948. Theo công thức này, lượng thông tin có thể được xác định như sau:

Ở đâu TÔI- lượng thông tin; N– số lượng các sự kiện có thể xảy ra (thông điệp); số Pi– xác suất của các sự kiện riêng lẻ (thông điệp).

Lượng thông tin được xác định bằng công thức (2.1) chỉ lấy giá trị dương. Vì xác suất của các sự kiện riêng lẻ nhỏ hơn một nên biểu thức log 2, - là giá trị âm và để thu được giá trị dương cho lượng thông tin trong công thức (2.1), cần có dấu “trừ” trước dấu tổng.

Nếu xác suất xảy ra của các sự kiện riêng lẻ là như nhau và chúng tạo thành một nhóm sự kiện hoàn chỉnh, tức là:

thì công thức (2.1) được chuyển thành công thức của R. Hartley:

Trong công thức (2.1) và (2.2), mối quan hệ giữa lượng thông tin TÔI và theo đó, xác suất (hoặc số lượng) của các sự kiện riêng lẻ được biểu thị bằng logarit.

Việc sử dụng logarit trong các công thức (2.1) và (2.2) có thể được giải thích như sau. Để đơn giản cho việc suy luận, chúng ta sử dụng quan hệ (2.2). Chúng ta sẽ tuần tự gán cho đối số N các giá trị được chọn, ví dụ: từ một dãy số: 1, 2, 4, 8, 16, 32, 64, v.v. Để xác định sự kiện nào N các sự kiện có khả năng xảy ra như nhau đã xảy ra, đối với mỗi số trong chuỗi cần phải thực hiện tuần tự các thao tác chọn từ hai sự kiện có thể xảy ra.

Vâng khi nào N= 1 thì số thao tác sẽ bằng 0 (xác suất xảy ra sự kiện bằng 1), với N= 2 thì số thao tác sẽ bằng 1, khi N= 4 thì số thao tác sẽ bằng 2, khi N= 8 thì số thao tác sẽ là 3, v.v. Như vậy, ta thu được dãy số sau: 0, 1, 2, 3, 4, 5, 6, v.v., có thể coi là tương ứng với các giá trị của hàm TÔI trong quan hệ (2.2).

Chuỗi giá trị số mà đối số lấy N, là một chuỗi được biết đến trong toán học là một chuỗi các số tạo thành một cấp số nhân và dãy các giá trị số mà hàm số lấy TÔI, sẽ là một chuỗi tạo thành một cấp số cộng. Như vậy, logarit trong các công thức (2.1) và (2.2) thiết lập mối quan hệ giữa chuỗi biểu diễn cấp số nhân và cấp số cộng, vốn khá nổi tiếng trong toán học.

Để định lượng (đánh giá) bất kỳ đại lượng vật lý nào, cần xác định đơn vị đo mà trong lý thuyết đo lường gọi là đơn vị đo đo .


Như đã lưu ý, thông tin phải được mã hóa trước khi xử lý, truyền tải và lưu trữ.

Việc mã hóa được thực hiện bằng cách sử dụng các bảng chữ cái đặc biệt (hệ thống ký hiệu). Trong khoa học máy tính, nghiên cứu các quá trình nhận, xử lý, truyền và lưu trữ thông tin bằng hệ thống máy tính (máy tính), mã hóa nhị phân chủ yếu được sử dụng, sử dụng hệ thống ký hiệu gồm hai ký hiệu 0 và 1. Vì lý do này, trong các công thức ( 2.1) và (2.2) số 2 được dùng làm cơ số của logarit.

Dựa trên cách tiếp cận xác suất để xác định lượng thông tin, hai ký hiệu này của hệ thống ký hiệu nhị phân có thể được coi là hai sự kiện có thể xảy ra khác nhau, do đó, một đơn vị lượng thông tin được lấy là lượng thông tin chứa đựng một thông điệp làm giảm độ không đảm bảo của kiến ​​thức giảm một nửa (trước khi nhận sự kiện, xác suất của chúng là 0,5, sau khi nhận – 1, độ không chắc chắn giảm tương ứng: 1/0,5 = 2, tức là 2 lần). Đơn vị đo lường thông tin này được gọi là bit (từ tiếng Anh chữ số nhị phân– chữ số nhị phân). Do đó, một bit được lấy làm thước đo để ước tính lượng thông tin ở cấp độ cú pháp, giả sử mã hóa nhị phân.

Đơn vị đo lượng thông tin lớn nhất tiếp theo là byte, là một chuỗi gồm 8 bit, tức là:

1 byte = 2 3 bit = 8 bit.

Trong khoa học máy tính, các đơn vị đo lượng thông tin là bội số của byte cũng được sử dụng rộng rãi, nhưng trái ngược với hệ đo lường số liệu, trong đó hệ số 10n được sử dụng làm bội số của nhiều đơn vị, trong đó n = 3, 6, 9, v.v., trong nhiều đơn vị đo lượng thông tin, hệ số 2n được sử dụng. Sự lựa chọn này được giải thích là do máy tính chủ yếu hoạt động với các số không thuộc hệ thống số thập phân mà thuộc hệ thống số nhị phân.

Đơn vị đo lượng thông tin là bội số của một byte được nhập như sau:

1 kilobyte (KB) = 210 byte = 1024 byte;

1 megabyte (MB) = 210 KB = 1024 KB;

1 gigabyte (GB) = 210 MB = 1024 MB;

1 terabyte (TB) = 210 GB = 1024 GB;

1 petabyte (PB) = 210 TB = 1024 TB;

1 exabyte (Ebyte) = 210 PB = 1024 PB.

Các đơn vị đo lượng thông tin, tên của chúng chứa các tiền tố “kilo”, “mega”, v.v., không đúng theo quan điểm của lý thuyết đo lường, vì các tiền tố này được sử dụng trong hệ thống đo lường số liệu , trong đó hệ số được sử dụng làm bội số của nhiều đơn vị 10 n, trong đó n = 3, 6, 9, v.v. Để loại bỏ sự sai trái này, tổ chức quốc tế Ủy ban kỹ thuật điện quốc tế Công ty đang xây dựng tiêu chuẩn cho ngành công nghệ điện tử vừa phê duyệt một số tiền tố mới cho đơn vị đo lượng thông tin: kibi, mebi, gibi, tebi, peti, exbi. Tuy nhiên, các tên gọi cũ cho các đơn vị đo lượng thông tin vẫn được sử dụng và sẽ mất thời gian để các tên mới được sử dụng rộng rãi.

Phương pháp xác suất cũng được sử dụng để xác định lượng thông tin được trình bày bằng hệ thống ký hiệu. Nếu chúng ta coi các ký tự của bảng chữ cái là một tập hợp các thông điệp có thể có N thì lượng thông tin mang theo một ký tự trong bảng chữ cái có thể được xác định bằng công thức (2.1). Nếu mỗi ký tự trong bảng chữ cái xuất hiện có khả năng như nhau trong nội dung của tin nhắn thì có thể sử dụng công thức (2.2) để xác định lượng thông tin.

Lượng thông tin mà một ký tự trong bảng chữ cái mang theo càng nhiều thì số lượng ký tự có trong bảng chữ cái này càng lớn. Số lượng ký tự có trong bảng chữ cái được gọi là sức mạnh của bảng chữ cái. Lượng thông tin (khối lượng thông tin) chứa trong một thông điệp được mã hóa bằng hệ thống ký hiệu và chứa một số ký tự (ký hiệu) nhất định được xác định bằng công thức:

Ở đâu V.– khối lượng thông tin của tin nhắn; TÔI= log2N, khối lượng thông tin của một ký hiệu (dấu hiệu); ĐẾN– số lượng ký hiệu (dấu hiệu) trong tin nhắn; N– sức mạnh của bảng chữ cái (số ký tự trong bảng chữ cái).

Tương tác thông tin. Các phương thức truyền tải thông tin. Phân loại thông tin.

Khái niệm về thông tin. Thuộc tính của thông tin. Các hình thức trình bày thông tin.

Thông tin (từ tiếng Latin informatio - “giải thích, trình bày, nhận thức”) - thông tin về một cái gì đó, bất kể hình thức trình bày của nó.

Thông tin có thể được chia thành các loại theo các tiêu chí khác nhau:

bằng nhận thức:

Thị giác - được cảm nhận bởi các cơ quan thị giác.

Thính giác - được cảm nhận bởi cơ quan thính giác.

Xúc giác - được cảm nhận bởi các thụ thể xúc giác.

Khứu giác - được cảm nhận bởi các thụ thể khứu giác.

Vị giác - được cảm nhận bởi vị giác.

theo hình thức trình bày:

Văn bản - được truyền dưới dạng ký hiệu nhằm biểu thị các từ vựng của ngôn ngữ.

Số - ở dạng số và dấu hiệu biểu thị các phép toán.

Đồ họa - ở dạng hình ảnh, đồ vật, đồ thị.

Âm thanh - truyền miệng hoặc dưới hình thức ghi âm và truyền tải các từ vựng ngôn ngữ bằng phương tiện thính giác.

theo mục đích:

Khối lượng - chứa thông tin tầm thường và hoạt động với một tập hợp các khái niệm dễ hiểu đối với hầu hết xã hội.

Đặc biệt - chứa một tập hợp các khái niệm cụ thể; khi được sử dụng, thông tin được truyền đi có thể không thể hiểu được đối với phần lớn xã hội, nhưng cần thiết và dễ hiểu trong nhóm xã hội hẹp nơi thông tin này được sử dụng.

Bí mật - được truyền đến một nhóm người hẹp và thông qua các kênh kín (được bảo vệ).

Cá nhân (riêng tư) - một tập hợp thông tin về một người xác định địa vị xã hội và các loại tương tác xã hội trong dân số.

theo giá trị:

Có liên quan - thông tin có giá trị tại một thời điểm nhất định.

Đáng tin cậy - thông tin thu được mà không bị bóp méo.

Có thể hiểu được - thông tin được thể hiện bằng ngôn ngữ dễ hiểu đối với những người dự kiến.

Hoàn thành - thông tin đủ để đưa ra quyết định hoặc hiểu biết chính xác.

Hữu ích - tính hữu ích của thông tin được xác định bởi chủ thể nhận được thông tin tùy thuộc vào phạm vi khả năng sử dụng thông tin đó.

trong sự thật:

ĐÚNG VẬY

Trong khoa học máy tính, chủ đề nghiên cứu thông tin chính xác là dữ liệu: các phương pháp tạo, lưu trữ, xử lý và truyền tải chúng.

Truyền thông tin là quá trình truyền không gian từ nguồn đến người nhận (người nhận). Con người đã học cách truyền và nhận thông tin thậm chí còn sớm hơn cả việc lưu trữ nó. Lời nói là một phương thức truyền tải mà tổ tiên xa xưa của chúng ta đã sử dụng trong tiếp xúc trực tiếp (hội thoại) - đến nay chúng ta vẫn sử dụng nó. Để truyền thông tin qua khoảng cách xa cần phải sử dụng các quy trình thông tin phức tạp hơn nhiều.



Để thực hiện quá trình này, thông tin phải được định dạng (trình bày) theo một cách nào đó. Để trình bày thông tin, nhiều hệ thống ký hiệu khác nhau được sử dụng - bộ ký hiệu ngữ nghĩa được xác định trước: đồ vật, hình ảnh, chữ viết hoặc chữ in của ngôn ngữ tự nhiên. Thông tin ngữ nghĩa về bất kỳ đối tượng, hiện tượng hoặc quá trình nào được trình bày với sự trợ giúp của chúng được gọi là thông điệp.

Rõ ràng, để truyền tải một thông điệp đi xa, thông tin phải được truyền tới một loại phương tiện di động nào đó. Người vận chuyển có thể di chuyển trong không gian bằng các phương tiện, như trường hợp gửi thư qua đường bưu điện. Phương pháp này đảm bảo độ tin cậy hoàn toàn của việc truyền thông tin, vì người nhận nhận được tin nhắn ban đầu, nhưng cần thời gian truyền đáng kể. Kể từ giữa thế kỷ 19, các phương pháp truyền thông tin đã trở nên phổ biến bằng cách sử dụng chất mang thông tin lan truyền tự nhiên - rung động điện từ (dao động điện, sóng vô tuyến, ánh sáng). Các thiết bị thực hiện quá trình truyền dữ liệu từ hệ thống truyền thông. Tùy thuộc vào phương pháp trình bày thông tin, hệ thống thông tin liên lạc có thể được chia thành hệ thống tín hiệu (điện báo, telefax), âm thanh (điện thoại), video và hệ thống kết hợp (truyền hình). Hệ thống thông tin liên lạc phát triển nhất trong thời đại chúng ta là Internet.

Đơn vị thông tin được sử dụng để đo lường các đặc điểm khác nhau liên quan đến thông tin.

Thông thường, đo lường thông tin liên quan đến việc đo dung lượng bộ nhớ máy tính (thiết bị lưu trữ) và đo lượng dữ liệu được truyền qua các kênh truyền thông kỹ thuật số. Lượng thông tin ít được đo lường phổ biến hơn.

Bit (chữ số nhị phân tiếng Anh - số nhị phân; còn là cách chơi chữ: tiếng Anh bit - mảnh, hạt) - đơn vị đo lượng thông tin, bằng một chữ số trong hệ thống số nhị phân. Được chỉ định theo GOST 8.417-2002

Claude Shannon năm 1948 đề xuất sử dụng từ bit để biểu thị đơn vị thông tin nhỏ nhất:

Một bit là logarit nhị phân của xác suất xảy ra các sự kiện có khả năng xảy ra như nhau hoặc tổng các tích của xác suất bằng logarit nhị phân của xác suất xảy ra các sự kiện có khả năng xảy ra như nhau; xem entropy thông tin.

Bit - đơn vị đo lường cơ bản của lượng thông tin, bằng lượng thông tin có trong một trải nghiệm có hai kết quả có thể xảy ra như nhau; xem entropy thông tin. Điều này giống với lượng thông tin trong câu trả lời cho một câu hỏi cho phép bạn trả lời “có” hoặc “không” và không có gì khác (nghĩa là lượng thông tin cho phép bạn trả lời rõ ràng câu hỏi được đặt ra).

Thước đo cú pháp của thông tin

Sự xuất hiện của khoa học thông tin với tư cách là một khoa học có thể bắt nguồn từ cuối những năm 50 của thế kỷ chúng ta, khi kỹ sư người Mỹ R. Hartley cố gắng giới thiệu một thước đo định lượng cho thông tin được truyền qua các kênh truyền thông. Hãy xem xét một tình huống trò chơi đơn giản. Trước khi nhận được thông báo về kết quả của việc tung đồng xu, một người ở trong trạng thái không chắc chắn về kết quả của lần tung đồng xu tiếp theo. Tin nhắn của đối tác cung cấp thông tin loại bỏ sự không chắc chắn này. Lưu ý rằng số kết quả có thể xảy ra trong tình huống được mô tả là 2, chúng bằng nhau (xác suất như nhau) và mỗi lần thông tin được truyền đi sẽ loại bỏ hoàn toàn sự không chắc chắn nảy sinh. Hartley lấy “lượng thông tin” được truyền qua một kênh liên lạc về hai kết quả như nhau và loại bỏ sự không chắc chắn bằng cách tác động đến một trong số chúng, dưới dạng một đơn vị thông tin được gọi là “bit”.

Đo lường ngữ nghĩa của thông tin

Một giai đoạn mới trong việc mở rộng lý thuyết về khái niệm thông tin gắn liền với điều khiển học - khoa học về điều khiển và giao tiếp trong các sinh vật sống, xã hội và máy móc. Giữ nguyên quan điểm của cách tiếp cận Shannon, điều khiển học hình thành nguyên tắc thống nhất giữa thông tin và kiểm soát, điều này đặc biệt quan trọng để phân tích bản chất của các quá trình xảy ra trong các hệ thống sinh học và xã hội tự quản, tự tổ chức. Khái niệm được phát triển trong các tác phẩm của N. Wiener giả định rằng quy trình điều khiển trong các hệ thống được đề cập là một quá trình xử lý (chuyển đổi) bởi một số thiết bị trung tâm thông tin nhận được từ các nguồn thông tin chính (thụ thể cảm giác) và truyền nó đến các bộ phận đó của cơ thể. hệ thống mà các phần tử của nó coi nó như một mệnh lệnh để thực hiện hành động này hoặc hành động kia. Sau hành động đó, các cơ quan thụ cảm sẵn sàng truyền thông tin về tình huống đã thay đổi để thực hiện một chu trình điều khiển mới. Đây là cách tổ chức một thuật toán tuần hoàn (chuỗi hành động) để quản lý và lưu thông thông tin trong hệ thống. Điều quan trọng là vai trò chính ở đây được thực hiện bởi nội dung thông tin được truyền bởi các thụ thể và thiết bị trung tâm. Theo Wiener, thông tin là “sự chỉ định nội dung nhận được từ thế giới bên ngoài trong quá trình chúng ta thích ứng với nó và sự thích ứng của các giác quan của chúng ta với nó”.

Đo lường thông tin thực tế

Trong các khái niệm thực dụng về thông tin, khía cạnh này là trung tâm, dẫn đến nhu cầu tính đến giá trị, tính hữu ích, hiệu quả, tính kinh tế của thông tin, tức là. những phẩm chất của nó có ảnh hưởng quyết định đến hành vi của các hệ thống điều khiển học có mục đích, tự tổ chức, tự quản lý (sinh học, xã hội, con người-máy móc).

Một trong những đại diện sáng giá nhất của lý thuyết thông tin thực dụng là mô hình giao tiếp hành vi - mô hình Ackoff-Miles của nhà hành vi. Điểm khởi đầu trong mô hình này là mong muốn mục tiêu của người nhận thông tin trong việc giải quyết một vấn đề cụ thể. Người nhận sẽ ở trong “trạng thái hướng đến mục tiêu” nếu anh ta phấn đấu vì điều gì đó và có những con đường thay thế có hiệu quả không đồng đều để đạt được mục tiêu. Một thông điệp được truyền đến người nhận sẽ mang tính thông tin nếu nó thay đổi "trạng thái có mục đích" của người đó.

Vì “trạng thái hướng đến mục tiêu” được đặc trưng bởi một chuỗi các hành động có thể thực hiện được (các lựa chọn thay thế), tính hiệu quả của hành động và tầm quan trọng của kết quả, nên thông điệp được truyền đến người nhận có thể ảnh hưởng đến cả ba thành phần ở các mức độ khác nhau. Theo đó, thông tin được truyền tải khác nhau theo loại thành “thông báo”, “hướng dẫn” và “động viên”. Vì vậy, đối với người nhận, giá trị thực dụng của thông điệp nằm ở chỗ nó cho phép anh ta vạch ra chiến lược hành vi để đạt được mục tiêu bằng cách xây dựng câu trả lời cho các câu hỏi: phải làm gì, như thế nào và tại sao ở mỗi bước tiếp theo? Đối với mỗi loại thông tin, mô hình hành vi đưa ra thước đo riêng và giá trị thực dụng tổng thể của thông tin được xác định là hàm của sự khác biệt giữa các đại lượng này trong “trạng thái hướng mục tiêu” trước và sau khi thay đổi sang “mục tiêu” mới. trạng thái định hướng.”