WWW – Mạng toàn cầu. Internet khác với World Wide Web như thế nào?

Internet ngày nay đã đi vào cuộc sống của chúng ta một cách vững chắc. Nhưng ít người biết đến cái tên Tim Berners Lee. Trong khi đó, đây chính xác là người đã tạo ra Internet - World Wide Web, nếu không có nó thì nhiều người thậm chí không thể tưởng tượng được cuộc sống của mình.

Tiểu sử của Timothy khá đơn giản: ông sinh năm 1955, vào tháng 6, ngày 8. Quê hương của anh là London. Cha mẹ của Tim là nhà toán học-lập trình viên Conway Berners-Lee (cha) và Mary Lee Woods (mẹ). Cả cha và mẹ đều làm việc tại cùng một trường đại học (Manchester) để tạo ra một máy tính điện tử có bộ nhớ truy cập ngẫu nhiên - Manchester Mark I.

Không cần phải nói rằng cậu bé Tim, khi nhìn thấy người lớn làm việc, đã chơi đùa, chế tạo những mô hình máy tính nhỏ từ những chiếc hộp rỗng. Đúng vậy, và Tim chủ yếu vẽ trên thẻ đục lỗ trên máy tính - loại bìa cứng có lỗ, phương tiện lưu trữ đầu tiên.

Năm học

Tim Berners học tại Trường Emanuel danh tiếng, nơi niềm đam mê thiết kế và toán học của anh, cũng như thành công trong học tập của anh đã khiến mọi người ngạc nhiên. Tiểu sử của ông có đoạn sau: “Những năm học ở trường - 1969-1973”

Tuy nhiên, sau khi tốt nghiệp ra trường năm 1973, khi vào King's College thuộc Đại học Oxford, Tim Berners quyết định trở thành nhà vật lý.

Và tại đây, niềm khao khát máy tính thời thơ ấu của Tim Berners-Lee lại trỗi dậy - một sự thật thú vị xuất hiện trong tiểu sử của người phát hiện ra Internet trong tương lai. Sử dụng bộ xử lý Motorola M6800 và một chiếc TV thông thường, Tim đã hàn chúng vào chiếc máy tính đầu tiên của mình.

Giống như tiểu sử của bất kỳ cậu bé tinh nghịch nào, tiểu sử của Timothy John Berners-Lee có những trang hấp dẫn bộc lộ tính cách từ một khía cạnh không hoàn toàn hấp dẫn. Thực ra, việc lên án chàng trai trẻ hack cơ sở dữ liệu máy tính của trường đại học là liều lĩnh - đây chỉ là sự tò mò và kiểm tra sức mạnh của anh ta. Nhưng kết quả là Tim nhận được lời cảnh cáo nghiêm khắc từ hiệu trưởng và lệnh cấm sử dụng máy tính ở trường đại học.

Công việc


Năm 1976, Timothy Berners-Lee tốt nghiệp loại xuất sắc tại Đại học Oxford và nhận bằng cử nhân vật lý. Sau khi chuyển đến Dorset, người tạo ra Internet trong tương lai có được một công việc tại tập đoàn Plessey. Ở đây Tim Berners đang lập trình hệ thống truyền tải thông tin, phân phối giao dịch và tạo ra công nghệ mã vạch.

Năm 1978, Timothy John Berners-Lee thay đổi công việc. Tại D.G Nash Ltd, trách nhiệm của ông cũng đang thay đổi: Tim Berners hiện tạo ra các chương trình cho máy in và hệ thống đa nhiệm.

Tim Berners-Lee được mời đến Thụy Sĩ vào năm 1980, nơi người sáng tạo ra Internet trong tương lai làm cố vấn phần mềm tại Tổ chức Nghiên cứu Hạt nhân Châu Âu. Chính tại Thụy Sĩ, Tim Berners, sau giờ làm việc, bắt đầu làm việc trên chương trình Inquire - nền tảng của World Wide Web.

Năm 1981, Tim Berners-Lee gia nhập Image Computer Systems Ltd, nơi ông làm việc thành công về phần mềm đồ họa và truyền thông cũng như kiến ​​trúc hệ thống thời gian thực. Sau đó, vào năm 1984, người tạo ra Internet trong tương lai bắt đầu phát triển một hệ thống thời gian thực được thiết kế để thu thập thông tin khoa học. Song song đó, Tim Berners-Lee phát triển các ứng dụng công nghệ máy tính giúp tăng tốc các hạt cũng như các thiết bị khoa học khác.

Khi được hỏi World Wide Web được tạo ra vào năm nào, câu trả lời có thể là năm 1989. Sau đó, Tim Berners-Lee đã đề xuất với ban quản lý của mình ý tưởng về World Wide Web, dựa trên khái niệm Inquire. Đây là sự khởi đầu của việc phát minh ra Internet. Anh ấy đã tự mình nghĩ ra cái tên “World Wide Web”, dựa trên việc liên kết nhiều trang web siêu văn bản khác nhau bằng cách sử dụng các siêu liên kết và giao thức truyền dữ liệu. Trước đây, các giao thức này đã được sử dụng trong mạng ARPANET của quân đội Hoa Kỳ. Điều này, cũng như giao thức mạng đại học NSFNET, đã trở thành tiền thân của World Wide Web, nhờ đó Internet xuất hiện.

Và bây giờ là bài phát biểu của người tạo ra Internet trong video (bằng tiếng Anh nhưng có phụ đề):

Sự ra đời của World Wide Web


Vào năm tuyệt vời 1989, giao thức này đã nhận được một lĩnh vực hoạt động mới: nó bắt đầu được sử dụng để trao đổi thư và liên lạc thời gian thực, cho mục đích thương mại và đọc các nhóm tin. Ý tưởng do Tim Berners-Lee đề xuất đã được đạo diễn Mike Sandell chấp nhận. Nhưng Tim Berners không nhận được số tiền lớn cho công việc của mình mà chỉ nhận được lời đề nghị tiến hành thí nghiệm trên một trong những máy tính cá nhân NeXT.

Bất chấp những khó khăn, Tim Berners vẫn hoàn thành thành công nhiệm vụ đặt ra cho mình: anh phát triển máy chủ web đầu tiên và trình duyệt web đầu tiên. Trình chỉnh sửa trang WorldWideWeb, một cách viết địa chỉ trang web được tiêu chuẩn hóa trên Internet, ngôn ngữ HTML và giao thức truyền dữ liệu lớp ứng dụng có được nhờ tài năng của anh ấy với tư cách là một nhà phát triển.

Năm sau, Tim Berners-Lee nhận được trợ lý - Robert Caillot người Bỉ. Nhờ anh ấy, dự án Internet đã nhận được tài trợ. Robert cũng tự mình đảm nhận mọi vấn đề về tổ chức. Mặc dù tham gia tích cực vào việc phát triển và quảng bá dự án, nhưng người sáng tạo chính của Internet, Tim Berners-Lee, cái tên được tất cả các lập trình viên trên thế giới tôn kính, vẫn đi vào lịch sử. Robert Caillot không có quyền thu phí sử dụng phát minh và đã bị lãng quên một cách không đáng có.

Sau đó, vào năm 1993, Tim Berners-Lee đã tạo ra một số trình duyệt cho các hệ điều hành khác nhau, giúp tăng thị phần của World Wide Web (WWW) trong tổng lưu lượng truy cập Internet.

Một sự thật thú vị là Đại học Minnesota trước đây đã phát triển giao thức Gopher, giao thức này có thể trở thành một giải pháp thay thế cho Internet hiện đại. Nhưng Tim Berners-Lee phản đối thực tế này, đưa ra quan điểm rằng giao thức đó sẽ không thể chịu được sự cạnh tranh với World Wide Web (WWW) do những người tạo ra dự án này yêu cầu một khoản phí để thực hiện nó.

World Wide Web (viết tắt Mạng toàn cầu hoặc WWW) là sự thống nhất của các tài nguyên thông tin được kết nối với nhau bằng phương tiện viễn thông và dựa trên sự thể hiện siêu văn bản của dữ liệu rải rác trên khắp thế giới.

Năm ra đời của World Wide Web được coi là năm 1989. Chính trong năm nay, Tim Berners-Lee đã đề xuất một dự án siêu văn bản chung, sau này được biết đến với tên gọi World Wide Web.

Người tạo ra “web” Tim Bernes-Lee, làm việc trong phòng thí nghiệm vật lý hạt cơ bản của Trung tâm Nghiên cứu Hạt nhân Châu Âu “CERN” ở Geneva (Thụy Sĩ), cùng với đối tác Robert Caillot, đã nghiên cứu các vấn đề áp dụng các ý tưởng siêu văn bản để xây dựng một môi trường thông tin giúp đơn giản hóa việc trao đổi thông tin giữa các nhà vật lý.

Kết quả của công việc này là một tài liệu kiểm tra các khái niệm cơ bản của “web” ở dạng hiện đại và các URI, giao thức HTTP và ngôn ngữ HTML được đề xuất. Nếu không có những công nghệ này thì không thể tưởng tượng được Internet hiện đại nữa.

Berners-Lee đã tạo ra máy chủ web đầu tiên trên thế giới và trình duyệt web siêu văn bản đầu tiên trên thế giới. Trên trang web đầu tiên trên thế giới, ông đã mô tả World Wide Web là gì và cách thiết lập máy chủ web, cách sử dụng trình duyệt, v.v. Trang web này cũng là danh mục Internet đầu tiên trên thế giới.

Từ năm 1994, các nhiệm vụ quan trọng nhất cho sự phát triển của World Wide Web đã được World Wide Web Consortium đảm nhận ( Hiệp hội Web Toàn cầu, WZS), được tổ chức và vẫn do Kim Bernes-Lee đứng đầu. Liên minh này phát triển và triển khai các tiêu chuẩn công nghệ cho Internet và World Wide Web. Sứ mệnh của WZS: “Giải phóng toàn bộ tiềm năng của World Wide Web bằng cách tạo ra các giao thức và nguyên tắc đảm bảo sự phát triển lâu dài của Mạng.” WZS đang phát triển “Khuyến nghị” để đạt được khả năng tương thích giữa các sản phẩm phần mềm và thiết bị của nhiều công ty khác nhau, giúp World Wide Web trở nên tiên tiến, phổ quát và thuận tiện hơn.

Công cụ tìm kiếm: thành phần, chức năng, nguyên lý hoạt động.

Hệ thống tìm kiếm là một tổ hợp phần mềm và phần cứng được thiết kế để tìm kiếm trên Internet và đáp ứng yêu cầu của người dùng, được chỉ định dưới dạng cụm từ văn bản (truy vấn tìm kiếm), bằng cách tạo danh sách các liên kết đến các nguồn thông tin, theo thứ tự mức độ liên quan (theo yêu cầu). Các công cụ tìm kiếm quốc tế lớn nhất: "Google", "Yahoo", "MSN". Trên Internet Nga nó là - "Yandex", "Người đi lang thang", "Sân bay".

Hãy mô tả đặc điểm chính của công cụ tìm kiếm :

    Tính đầy đủ

Tính đầy đủ là một trong những đặc điểm chính của hệ thống tìm kiếm, là tỷ lệ giữa số lượng tài liệu được tìm thấy theo yêu cầu trên tổng số tài liệu trên Internet thỏa mãn yêu cầu nhất định. Ví dụ: nếu có 100 trang trên Internet chứa cụm từ “cách chọn ô tô” và chỉ tìm thấy 60 trang trong số đó cho truy vấn tương ứng thì mức độ đầy đủ của tìm kiếm sẽ là 0,6. Rõ ràng, việc tìm kiếm càng đầy đủ thì khả năng người dùng không tìm thấy tài liệu mình cần càng ít, miễn là nó tồn tại trên Internet.

    Sự chính xác

Độ chính xác là một đặc điểm chính khác của công cụ tìm kiếm, được xác định bởi mức độ tài liệu tìm thấy phù hợp với truy vấn của người dùng. Ví dụ: nếu truy vấn “cách chọn ô tô” chứa 100 tài liệu, thì 50 tài liệu trong số đó chứa cụm từ “cách chọn ô tô” và phần còn lại chỉ chứa những từ này (“cách chọn đài phù hợp và lắp đặt nó trong một chiếc ô tô”) thì độ chính xác của tìm kiếm được coi là bằng 50/100 (=0,5). Tìm kiếm càng chính xác, người dùng sẽ tìm thấy tài liệu mình cần càng nhanh, càng ít loại “rác” khác nhau được tìm thấy trong số đó, tần suất các tài liệu được tìm thấy sẽ không tương ứng với yêu cầu càng ít.

    Mức độ liên quan

Mức độ liên quan là một thành phần quan trọng không kém của tìm kiếm, được đặc trưng bởi thời gian trôi qua từ thời điểm tài liệu được xuất bản trên Internet cho đến khi chúng được nhập vào cơ sở dữ liệu chỉ mục của công cụ tìm kiếm. Ví dụ: một ngày sau khi tin tức thú vị xuất hiện, một lượng lớn người dùng đã chuyển sang các công cụ tìm kiếm với các truy vấn liên quan. Khách quan mà nói, chưa đầy một ngày trôi qua kể từ khi tin tức về chủ đề này được công bố, nhưng các tài liệu chính đã được lập chỉ mục và có sẵn để tìm kiếm, nhờ sự tồn tại của cái gọi là “cơ sở dữ liệu nhanh” của các công cụ tìm kiếm lớn, được cập nhật nhiều lần trong ngày.

    Tốc độ tìm kiếm

Tốc độ tìm kiếm có liên quan chặt chẽ đến khả năng chịu tải của nó. Ví dụ, theo Rambler Internet Holding LLC, ngày nay, trong giờ làm việc, công cụ tìm kiếm Rambler nhận được khoảng 60 yêu cầu mỗi giây. Khối lượng công việc như vậy đòi hỏi phải giảm thời gian xử lý một yêu cầu riêng lẻ. Ở đây, lợi ích của người dùng và công cụ tìm kiếm trùng nhau: khách truy cập muốn nhận được kết quả nhanh nhất có thể và công cụ tìm kiếm phải xử lý yêu cầu càng nhanh càng tốt để không làm chậm quá trình tính toán các truy vấn tiếp theo.

    Hiển thị

Trình bày kết quả trực quan là một thành phần quan trọng của tìm kiếm thuận tiện. Đối với hầu hết các truy vấn, công cụ tìm kiếm sẽ tìm thấy hàng trăm, thậm chí hàng nghìn tài liệu. Do truy vấn không rõ ràng hoặc tìm kiếm không chính xác, ngay cả những trang đầu tiên của kết quả tìm kiếm không phải lúc nào cũng chỉ chứa những thông tin cần thiết. Điều này có nghĩa là người dùng thường phải tự thực hiện tìm kiếm trong danh sách tìm thấy. Các thành phần khác nhau của trang kết quả của công cụ tìm kiếm giúp bạn điều hướng kết quả tìm kiếm có thể được tìm thấy tại liên kết. http://help.yandex.ru/search/?id=481937.

Tóm tắt lịch sử phát triển của công cụ tìm kiếm

Trong thời kỳ đầu phát triển Internet, số lượng người dùng còn ít và lượng thông tin có sẵn tương đối ít. Phần lớn chỉ có nhân viên nghiên cứu mới có quyền truy cập Internet. Vào thời điểm đó, nhiệm vụ tìm kiếm thông tin trên Internet chưa cấp bách như bây giờ.

Một trong những cách đầu tiên để tổ chức quyền truy cập vào tài nguyên thông tin mạng là tạo các thư mục mở của các trang web, liên kết đến các tài nguyên được nhóm theo chủ đề. Dự án đầu tiên như vậy là trang web Yahoo.com, được khai trương vào mùa xuân năm 1994. Sau khi số lượng trang web trong thư mục Yahoo tăng lên đáng kể, khả năng tìm kiếm thông tin cần thiết trong thư mục đã được thêm vào. Theo nghĩa đầy đủ, nó vẫn chưa phải là một công cụ tìm kiếm, vì khu vực tìm kiếm chỉ giới hạn ở các tài nguyên có trong danh mục chứ không phải tất cả các tài nguyên Internet.

Trước đây, các thư mục liên kết đã được sử dụng rộng rãi nhưng hiện tại gần như đã mất đi sự phổ biến hoàn toàn. Vì ngay cả những danh mục hiện đại, có khối lượng khổng lồ, cũng chỉ chứa thông tin về một phần không đáng kể của Internet. Thư mục lớn nhất của mạng DMOZ (còn gọi là Dự án thư mục mở) chứa thông tin về 5 triệu tài nguyên, trong khi cơ sở dữ liệu của công cụ tìm kiếm Google bao gồm hơn 8 tỷ tài liệu.

Công cụ tìm kiếm chính thức đầu tiên là dự án WebCrawler, được xuất bản năm 1994.

Năm 1995, công cụ tìm kiếm Lycos và AltaVista xuất hiện. Sau này đã dẫn đầu trong lĩnh vực tìm kiếm thông tin trên Internet trong nhiều năm.

Năm 1997, Sergey Brin và Larry Page đã tạo ra công cụ tìm kiếm Google như một phần của dự án nghiên cứu tại Đại học Stanford. Google hiện là công cụ tìm kiếm phổ biến nhất trên thế giới!

Vào tháng 9 năm 1997, công cụ tìm kiếm Yandex, công cụ phổ biến nhất trên Internet tiếng Nga, đã chính thức được công bố.

Hiện nay, có ba công cụ tìm kiếm quốc tế chính - Google, Yahoo và MSN, có cơ sở dữ liệu và thuật toán tìm kiếm riêng. Hầu hết các công cụ tìm kiếm khác (trong đó có một số lượng lớn) sử dụng dưới dạng này hay dạng khác các kết quả của ba loại được liệt kê. Ví dụ: tìm kiếm AOL (search.aol.com) sử dụng cơ sở dữ liệu Google, trong khi AltaVista, Lycos và AllTheWeb sử dụng cơ sở dữ liệu Yahoo.

Thành phần và nguyên lý hoạt động của hệ thống tìm kiếm

Ở Nga, công cụ tìm kiếm chính là Yandex, tiếp theo là Rambler.ru, Google.ru, Aport.ru, Mail.ru. Hơn nữa, hiện tại, Mail.ru sử dụng cơ sở dữ liệu và công cụ tìm kiếm Yandex.

Hầu như tất cả các công cụ tìm kiếm lớn đều có cấu trúc riêng, khác với các công cụ khác. Tuy nhiên, có thể xác định các thành phần chính chung cho tất cả các công cụ tìm kiếm. Sự khác biệt về cấu trúc chỉ có thể ở dạng thực hiện cơ chế tương tác của các thành phần này.

Mô-đun lập chỉ mục

Mô-đun lập chỉ mục bao gồm ba chương trình phụ trợ (robot):

nhện – một chương trình được thiết kế để tải xuống các trang web. Con nhện tải trang xuống và lấy tất cả các liên kết nội bộ từ trang đó. Mã html của mỗi trang được tải xuống. Robot sử dụng giao thức HTTP để tải xuống các trang. Con nhện hoạt động như sau. Robot gửi yêu cầu “get/path/document” và một số lệnh yêu cầu HTTP khác tới máy chủ. Để phản hồi, robot sẽ nhận được một luồng văn bản chứa thông tin dịch vụ và chính tài liệu đó.

    URL trang

    ngày trang được tải xuống

    Tiêu đề http phản hồi của máy chủ

    nội dung trang (mã html)

Trình thu thập thông tin (nhện “du lịch”) – một chương trình tự động theo dõi tất cả các liên kết được tìm thấy trên trang. Chọn tất cả các liên kết có trên trang. Công việc của nó là xác định nơi con nhện sẽ đi tiếp theo, dựa trên các liên kết hoặc dựa trên danh sách địa chỉ được xác định trước. Trình thu thập thông tin, theo các liên kết được tìm thấy, tìm kiếm các tài liệu mới mà công cụ tìm kiếm vẫn chưa biết.

Người lập chỉ mục (người lập chỉ mục robot) - một chương trình phân tích các trang web được tải xuống bởi nhện. Bộ chỉ mục phân tích trang thành các phần cấu thành của nó và phân tích chúng bằng các thuật toán từ vựng và hình thái riêng của nó. Các thành phần trang khác nhau được phân tích, chẳng hạn như văn bản, tiêu đề, liên kết, tính năng cấu trúc và kiểu dáng, thẻ HTML dịch vụ đặc biệt, v.v.

Do đó, mô-đun lập chỉ mục cho phép bạn thu thập dữ liệu một nhóm tài nguyên nhất định bằng cách sử dụng các liên kết, tải xuống các trang gặp phải, trích xuất liên kết đến các trang mới từ các tài liệu đã nhận và thực hiện phân tích đầy đủ các tài liệu này.

Cơ sở dữ liệu

Cơ sở dữ liệu, hay chỉ mục của công cụ tìm kiếm, là một hệ thống lưu trữ dữ liệu, một mảng thông tin trong đó lưu trữ các tham số được chuyển đổi đặc biệt của tất cả các tài liệu được mô-đun lập chỉ mục tải xuống và xử lý.

Máy chủ tìm kiếm

Máy chủ tìm kiếm là thành phần quan trọng nhất của toàn bộ hệ thống, vì chất lượng và tốc độ tìm kiếm phụ thuộc trực tiếp vào các thuật toán làm nền tảng cho chức năng của nó.

Máy chủ tìm kiếm hoạt động như sau:

    Yêu cầu nhận được từ người dùng sẽ được phân tích hình thái. Môi trường thông tin của từng tài liệu có trong cơ sở dữ liệu được tạo ra (sau đó sẽ được hiển thị dưới dạng đoạn trích, tức là thông tin văn bản tương ứng với yêu cầu trên trang kết quả tìm kiếm).

    Dữ liệu nhận được sẽ được chuyển dưới dạng tham số đầu vào cho mô-đun xếp hạng đặc biệt. Dữ liệu được xử lý cho tất cả tài liệu, do đó mỗi tài liệu có xếp hạng riêng đặc trưng cho mức độ liên quan của truy vấn do người dùng nhập và các thành phần khác nhau của tài liệu này được lưu trữ trong chỉ mục của công cụ tìm kiếm.

    Tùy thuộc vào lựa chọn của người dùng, xếp hạng này có thể được điều chỉnh theo các điều kiện bổ sung (ví dụ: cái gọi là “tìm kiếm nâng cao”).

    Tiếp theo, một đoạn mã được tạo, nghĩa là đối với mỗi tài liệu được tìm thấy, tiêu đề, một bản tóm tắt ngắn phù hợp nhất với truy vấn và một liên kết đến chính tài liệu đó sẽ được trích xuất từ ​​bảng tài liệu và các từ tìm thấy sẽ được đánh dấu.

    Kết quả tìm kiếm thu được được truyền tới người dùng dưới dạng SERP (Trang kết quả của Công cụ tìm kiếm) – trang kết quả tìm kiếm.

Như bạn có thể thấy, tất cả các thành phần này có liên quan chặt chẽ với nhau và hoạt động tương tác, tạo thành một cơ chế rõ ràng, khá phức tạp cho hoạt động của hệ thống tìm kiếm, đòi hỏi lượng tài nguyên khổng lồ.

Không có công cụ tìm kiếm nào bao gồm tất cả các tài nguyên Internet.

Mỗi công cụ tìm kiếm thu thập thông tin về tài nguyên Internet bằng các phương pháp riêng và tạo cơ sở dữ liệu được cập nhật định kỳ của riêng mình. Quyền truy cập vào cơ sở dữ liệu này được cấp cho người dùng.

Công cụ tìm kiếm thực hiện hai cách để tìm kiếm tài nguyên:

    Tìm kiếm theo chủ đề catalog - thông tinđược trình bày dưới dạng cấu trúc phân cấp. Ở cấp độ cao nhất có các danh mục chung (“Internet”, “Kinh doanh”, “Nghệ thuật”, “Giáo dục”, v.v.), ở cấp độ tiếp theo, các danh mục được chia thành các phần, v.v. Mức thấp nhất là liên kết đến các trang web cụ thể hoặc các nguồn thông tin khác.

    Tìm kiếm từ khóa (tìm kiếm chỉ mục hoặc tìm kiếm chi tiết) - người dùng gửi đến công cụ tìm kiếm lời yêu cầu, bao gồm các từ khóa. Hệ thống trả lại cho người dùng một danh sách các tài nguyên được tìm thấy theo yêu cầu.

Hầu hết các công cụ tìm kiếm đều kết hợp cả hai phương pháp tìm kiếm.

Công cụ tìm kiếm có thể mang tính địa phương, toàn cầu, khu vực và chuyên biệt.

Ở phần Internet của Nga (Runet), các công cụ tìm kiếm có mục đích chung phổ biến nhất là Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. google.ru).

Hầu hết các công cụ tìm kiếmđược thực hiện dưới dạng cổng thông tin.

Cổng thông tin (từ tiếng Anh.cổng thông tin- cổng chính, cổng) là website tích hợp nhiều dịch vụ Internet: công cụ tìm kiếm, mail, tin tức, từ điển...

Cổng thông tin có thể được chuyên biệt hóa (như,www. bảo tàng. ru) và tổng quát (ví dụ:www. km. ru).

Tìm kiếm theo từ khóa

Tập hợp từ khóa dùng để tìm kiếm còn được gọi là tiêu chí tìm kiếm hoặc chủ đề tìm kiếm.

Một yêu cầu có thể bao gồm một từ hoặc tổ hợp các từ được kết hợp bởi các toán tử - ký hiệu mà hệ thống xác định hành động nào cần thực hiện. Ví dụ: yêu cầu “Moscow St. Petersburg” chứa toán tử AND (đây là cách cảm nhận khoảng trắng), cho biết rằng người ta nên tìm kiếm các tài liệu có chứa cả hai từ - Moscow và St. Petersburg.

Để tìm kiếm có liên quan (từ tiếng Anh có liên quan - có liên quan), cần tính đến một số quy tắc chung:

    Bất kể từ được sử dụng trong truy vấn dưới dạng nào, tìm kiếm sẽ tính đến tất cả các dạng từ của nó theo các quy tắc của tiếng Nga. Ví dụ: truy vấn “ticket” cũng sẽ tìm thấy các từ “ticket”, “ticket”, v.v.

    Chỉ nên sử dụng chữ in hoa trong tên riêng để tránh xem những tài liệu tham khảo không cần thiết. Ví dụ: theo yêu cầu của “thợ rèn”, người ta sẽ tìm thấy các tài liệu nói về cả thợ rèn và Kuznetsov.

    Bạn nên thu hẹp tìm kiếm của mình bằng cách sử dụng một vài từ khóa.

    Nếu địa chỉ được yêu cầu không nằm trong số 20 địa chỉ đầu tiên được tìm thấy, bạn nên thay đổi yêu cầu.

Mỗi công cụ tìm kiếm sử dụng ngôn ngữ truy vấn riêng của mình. Để làm quen với nó, hãy sử dụng sự trợ giúp tích hợp của công cụ tìm kiếm

Các trang web lớn có thể có hệ thống truy xuất thông tin tích hợp trong trang web của họ.

Các truy vấn trong các hệ thống tìm kiếm như vậy, theo quy luật, được xây dựng theo các quy tắc giống như trong các công cụ tìm kiếm toàn cầu, tuy nhiên, việc làm quen với sự trợ giúp ở đây sẽ không thừa.

tìm kiếm nâng cao

Công cụ tìm kiếm có thể cung cấp cơ chế để người dùng tạo một truy vấn phức tạp. Theo một liên kết tìm kiếm nâng cao cho phép chỉnh sửa các tham số tìm kiếm, chỉ định các tham số bổ sung và chọn hình thức thuận tiện nhất để hiển thị kết quả tìm kiếm. Phần sau đây mô tả các tham số có thể được đặt trong quá trình tìm kiếm nâng cao trong hệ thống Yanex và Rambler.

Mô tả về Thông Số

Tên trong Yandex

Tên trongNgười nói huyên thuyên

Nơi tìm từ khóa (tiêu đề tài liệu, nội dung văn bản, v.v.)

Bộ lọc từ điển

Tìm kiếm theo văn bản...

Những từ nào nên hoặc không nên có trong tài liệu và mức độ chính xác của sự trùng khớp

Bộ lọc từ điển

Tìm kiếm các từ truy vấn... Loại trừ các tài liệu có chứa các từ sau...

Các từ khóa nên được đặt cách nhau bao xa?

Bộ lọc từ điển

Khoảng cách giữa các từ truy vấn...

Hạn chế về ngày lập tài liệu

Ngày lập hồ sơ...

Giới hạn tìm kiếm của bạn ở một hoặc nhiều trang web

Trang web/Hàng đầu

Chỉ tìm kiếm tài liệu trên các trang web sau...

Giới hạn tìm kiếm theo ngôn ngữ tài liệu

Ngôn ngữ tài liệu...

Tìm kiếm tài liệu có chứa ảnh có tên hoặc chữ ký cụ thể

Hình ảnh

Tìm các trang có chứa đối tượng

Đồ vật đặc biệt

Mẫu trình bày kết quả tìm kiếm

Định dạng vấn đề

Hiển thị kết quả tìm kiếm

Một số công cụ tìm kiếm (ví dụ: Yandex) cho phép bạn nhập truy vấn bằng ngôn ngữ tự nhiên. Bạn viết những gì bạn cần tìm (ví dụ: đặt vé tàu từ Moscow đến St. Petersburg). Hệ thống phân tích yêu cầu và đưa ra kết quả. Nếu bạn không hài lòng với nó, hãy chuyển sang ngôn ngữ truy vấn.

Mạng toàn cầu (www)

Khi Internet phát triển, ngày càng có nhiều thông tin được đưa vào lưu thông và việc điều hướng trên Internet ngày càng trở nên khó khăn. Sau đó, nhiệm vụ nảy sinh là tạo ra một cách đơn giản và dễ hiểu để sắp xếp thông tin được đăng trên các trang Internet. Dịch vụ www (world wide web) mới đã hoàn toàn đáp ứng được nhiệm vụ này.

Mạng toàn cầu là hệ thống các tài liệu có thông tin dạng văn bản và đồ họa được đưa lên các trang Internet và được kết nối với nhau bằng các siêu liên kết. Có lẽ dịch vụ cụ thể này là phổ biến nhất và đối với nhiều người dùng, nó đồng nghĩa với chính từ INTERNET. Thông thường, người dùng mới làm quen nhầm lẫn giữa hai khái niệm - Internet và WWW (hoặc Web). Cần nhắc lại rằng WWW chỉ là một trong rất nhiều dịch vụ được cung cấp cho người dùng Internet.

Ý tưởng chính được sử dụng trong quá trình phát triển hệ thống www là là ý tưởng truy cập thông tin bằng các liên kết siêu văn bản. Bản chất của nó là đưa vào văn bản của tài liệu các liên kết đến các tài liệu khác, có thể được đặt trên cùng một máy chủ thông tin hoặc trên các máy chủ thông tin từ xa.

Lịch sử của www bắt đầu từ thời điểm vào năm 1989, một nhân viên của tổ chức khoa học nổi tiếng CErN Berners-Lee đã đề xuất với ban quản lý của mình tạo ra một cơ sở dữ liệu dưới dạng mạng thông tin bao gồm các tài liệu bao gồm cả thông tin đó. và liên kết đến các tài liệu khác. Những tài liệu như vậy không gì khác hơn là siêu văn bản.

Một tính năng khác khiến www khác biệt với các loại dịch vụ khác là thông qua hệ thống này, bạn có thể truy cập hầu hết các loại dịch vụ Internet khác, chẳng hạn như FTP, Gopher, Telnet.

WWW là một hệ thống đa phương tiện. Điều này có nghĩa là bằng cách sử dụng www, bạn có thể xem video về các di tích lịch sử hoặc tìm hiểu thông tin về World Cup chẳng hạn. Có thể truy cập thông tin thư viện và các bức ảnh gần đây về địa cầu được chụp cách đây 5 phút bởi các vệ tinh khí tượng, cùng với.

Ý tưởng tổ chức thông tin dưới dạng siêu văn bản không phải là mới. Siêu văn bản tồn tại rất lâu trước khi máy tính ra đời. Ví dụ đơn giản nhất về siêu văn bản phi máy tính là bách khoa toàn thư. Một số từ trong bài viết được đánh dấu in nghiêng. Điều này có nghĩa là bạn có thể tham khảo bài viết liên quan và nhận được thông tin chi tiết hơn. Nhưng nếu trong siêu văn bản không phải máy tính, bạn cần lật trang, thì trên màn hình điều khiển, việc theo dõi liên kết siêu văn bản sẽ diễn ra ngay lập tức. Bạn chỉ cần nhấp vào từ liên kết.

Công lao chính của Tim Berners-Lee nói trên là ông không chỉ đưa ra ý tưởng tạo ra một hệ thống thông tin dựa trên siêu văn bản mà còn đề xuất một số phương pháp hình thành nên nền tảng của dịch vụ www trong tương lai .

Năm 1991, những ý tưởng bắt nguồn từ CErN bắt đầu được Trung tâm Ứng dụng Siêu máy tính (NCSA) tích cực phát triển. Chính NCSA đã tạo ra ngôn ngữ tài liệu siêu văn bản html, cũng như chương trình Khảm được thiết kế để xem chúng. Khảm, được phát triển bởi Mark Andersen, đã trở thành trình duyệt đầu tiên và mở ra một loại sản phẩm phần mềm mới.

Năm 1994, số lượng máy chủ www bắt đầu tăng nhanh và dịch vụ Internet mới không chỉ nhận được sự công nhận trên toàn thế giới mà còn thu hút một lượng lớn người dùng mới vào Internet.

Bây giờ hãy đưa ra các định nghĩa cơ bản.

www– đây là tập hợp các trang web nằm trên các trang Internet và được kết nối với nhau bằng các siêu liên kết (hoặc đơn giản là các liên kết).

trang web là đơn vị cấu trúc của www, bao gồm thông tin thực tế (văn bản và đồ họa) và các liên kết đến các trang khác.

trang mạng– đây là những trang web nằm trên một nút Internet.

Hệ thống siêu liên kết www dựa trên thực tế là một số khu vực được chọn của một tài liệu (có thể là các phần của văn bản hoặc hình minh họa) hoạt động như các liên kết đến các tài liệu khác có liên quan một cách hợp lý với chúng.

Trong trường hợp này, những tài liệu được tạo liên kết có thể được đặt trên cả máy tính cục bộ và máy tính từ xa. Ngoài ra, các liên kết siêu văn bản truyền thống cũng có thể thực hiện được - đây là những liên kết trong cùng một tài liệu.

Ngược lại, các tài liệu được liên kết có thể chứa các tham chiếu chéo với nhau và với các nguồn thông tin khác. Vì vậy, có thể thu thập tài liệu về các chủ đề tương tự vào một không gian thông tin duy nhất. (Ví dụ: tài liệu chứa thông tin y tế.)

Kiến trúc www

Kiến trúc của www, giống như kiến ​​trúc của nhiều loại dịch vụ Internet khác, được xây dựng trên nguyên tắc máy khách-máy chủ.

Nhiệm vụ chính của chương trình máy chủ là tổ chức truy cập thông tin được lưu trữ trên máy tính mà chương trình này đang chạy. Sau khi khởi động, chương trình máy chủ hoạt động ở chế độ chờ yêu cầu từ chương trình máy khách. Thông thường, các trình duyệt web được sử dụng làm chương trình máy khách, được người dùng www thông thường sử dụng. Khi một chương trình như vậy cần lấy một số thông tin từ máy chủ (thường là các tài liệu được lưu trữ ở đó), nó sẽ gửi yêu cầu tương ứng đến máy chủ. Với đủ quyền truy cập, kết nối được thiết lập giữa các chương trình và chương trình máy chủ sẽ gửi phản hồi yêu cầu đến chương trình máy khách. Sau đó, kết nối được thiết lập giữa họ bị phá vỡ.

Để truyền thông tin giữa các chương trình, giao thức HTTP (Giao thức truyền siêu văn bản) được sử dụng.

chức năng máy chủ www

máy chủ www là một chương trình chạy trên máy chủ và xử lý các yêu cầu đến từ máy khách www. Khi nhận được yêu cầu từ máy khách www, chương trình này sẽ thiết lập kết nối dựa trên giao thức truyền tải TCP/IP và trao đổi thông tin bằng giao thức HTTP. Ngoài ra, máy chủ xác định quyền truy cập vào các tài liệu nằm trên đó.

Để truy cập thông tin mà máy chủ không thể xử lý trực tiếp, nó được sử dụng hệ thống khóa. Sử dụng giao diện CGI (Giao diện cổng chung) đặc biệt để trao đổi thông tin với các cổng, máy chủ www có khả năng nhận thông tin từ các nguồn mà các loại dịch vụ Internet khác không thể truy cập được. Đồng thời, đối với người dùng cuối, hoạt động của các cổng là “minh bạch”, tức là khi xem tài nguyên web trên trình duyệt yêu thích của mình, người dùng thiếu kinh nghiệm thậm chí sẽ không nhận thấy rằng một số thông tin được hiển thị cho anh ta bằng hệ thống cổng



www chức năng khách hàng

Có hai loại máy khách www chính: trình duyệt web và ứng dụng tiện ích.

trình duyệt webđược sử dụng để làm việc trực tiếp với www và lấy thông tin từ đó.

Ứng dụng web dịch vụ có thể liên lạc với máy chủ để lấy một số số liệu thống kê hoặc lập chỉ mục thông tin chứa trong đó. (Đây là cách thông tin được đưa vào cơ sở dữ liệu của công cụ tìm kiếm.) Ngoài ra, còn có các máy khách web dịch vụ, công việc của chúng liên quan đến khía cạnh kỹ thuật lưu trữ thông tin trên một máy chủ nhất định.

Những người phát minh ra World Wide Web là quý ngài Ti-mô-thê John Berners- (sinh ngày 8 tháng 6 năm 1955) và ở mức độ thấp hơn, Robert Kayo. Tim Berners-Lee là một nhà sáng tạo công nghệ HTTP, URI/URLHTML. Năm 1980, ông làm việc cho Hội đồng Nghiên cứu Hạt nhân Châu Âu (Conseil Européen pour la Recherche Nucléaire, CERN) với vai trò cố vấn phần mềm. Chính tại Geneva (Thụy Sĩ), vì nhu cầu riêng của mình, ông đã viết chương trình Enquirer, chương trình đặt nền tảng khái niệm cho World Wide Web.

TRONG 1989 năm Khi làm việc tại CERN về mạng nội bộ của tổ chức, Tim Berners-Lee đã đề xuất dự án siêu văn bản toàn cầu hiện được gọi là World Wide Web.

Là một phần của dự án, Berners-Lee đã viết máy chủ web đầu tiên trên thế giới và trình duyệt web siêu văn bản đầu tiên trên thế giới, được gọi là "WorldWideWeb".

Berners-Lee đã tạo ra trang web đầu tiên trên thế giới tại http://info.cern.ch/, trang web này hiện đã được lưu trữ. Trang web này đã xuất hiện trên Internet 6 Tháng tám 1991 của năm. Trang web này mô tả World Wide Web là gì, cách cài đặt máy chủ web và cách sử dụng trình duyệt. Trang web này cũng là thư mục Internet đầu tiên trên thế giới vì sau này Tim Berners-Lee đã đăng và duy trì một danh sách các liên kết đến các trang web khác ở đó.

Tuy nhiên, nền tảng lý thuyết của web đã được đặt ra sớm hơn nhiều. Trở lại năm 1945, Vanniver Bush đã phát triển khái niệm "Memex" - một công cụ hỗ trợ "mở rộng trí nhớ con người". Memex là một thiết bị trong đó một người lưu trữ tất cả sổ sách và hồ sơ của mình (và lý tưởng nhất là tất cả kiến ​​thức của anh ta có thể được mô tả chính thức) và cung cấp thông tin cần thiết với tốc độ vừa đủ và tính linh hoạt. Bush còn dự đoán khả năng lập chỉ mục toàn diện các tài nguyên văn bản và đa phương tiện với khả năng tìm kiếm nhanh chóng những thông tin cần thiết. Bước quan trọng tiếp theo đối với World Wide Web là việc tạo ra siêu văn bản (thuật ngữ do Ted Nelson đặt ra vào năm 1965).

Cơm. 75. Logo Hiệp hội World Wide Web

Từ năm 1994, công việc chính về phát triển World Wide Web đã được đảm nhận bởi Tập đoàn Thế giới mạng nhện, được thành lập và vẫn lãnh đạo bởi Tim Berners-Lee là một tổ chức phát triển và triển khai các tiêu chuẩn công nghệ cho Internet và World Wide Web.
        1. Triển vọng phát triển

Khái niệm hiện tại về sự phát triển của World Wide Web ngày nay là tạo ra một trang web ngữ nghĩa (có ý nghĩa). Tác giả của khái niệm web ngữ nghĩa còn có Tim Berners-Lee. Ngữ nghĩa mạng lưới (ngữ nghĩa mạng lưới) là một tiện ích bổ sung cho World Wide Web hiện có, được thiết kế để làm cho thông tin được đăng trên mạng trở nên hấp dẫn hơn. có thể hiểu được máy tính.

Hiện nay, máy tính chiếm vai trò khá hạn chế trong việc tạo và xử lý thông tin trên Internet. Chức năng của máy tính chủ yếu giới hạn ở việc lưu trữ, hiển thị và truy xuất thông tin. Đồng thời, việc tạo ra thông tin, đánh giá, phân loại và cập nhật thông tin - tất cả những điều này vẫn được thực hiện bởi con người. Làm thế nào để đưa máy tính vào các quy trình này? Nếu máy tính chưa thể được dạy để hiểu ngôn ngữ của con người thì cần phải sử dụng ngôn ngữ mà máy tính có thể hiểu được. Đó là, lý tưởng nhất, tất cả thông tin trên Internet phải được đăng bằng hai ngôn ngữ: bằng ngôn ngữ của con người để một người có thể hiểu được và bằng ngôn ngữ máy tính để máy tính có thể hiểu được. Web ngữ nghĩa là một khái niệm về một mạng trong đó mọi tài nguyên bằng ngôn ngữ của con người sẽ được cung cấp một mô tả mà máy tính có thể hiểu được.

Các chương trình sẽ có thể tự tìm kiếm các tài nguyên cần thiết, xử lý thông tin, phân loại dữ liệu, xác định các kết nối logic, đưa ra kết luận và đưa ra quyết định dựa trên những kết luận này. Nếu được áp dụng rộng rãi và triển khai một cách khôn ngoan, Web ngữ nghĩa có tiềm năng khơi dậy một cuộc cách mạng trên Internet.

Tác phẩm quan trọng nhất về Web ngữ nghĩa là cuốn sách năm 2005 của Berners-Lee, Xoay chuyển Web ngữ nghĩa: Mở khóa toàn bộ tiềm năng của World Wide Web.

    Mạng máy tính toàn cầu đầu tiên được đặt tên:

    Nhà cung cấp Internet là:

    Tổ chức cung cấp dịch vụ Internet;

    một tổ chức tạo ra các trang web;

    một thiết bị ngoại vi được sử dụng để giao tiếp với một máy tính khác

    ứng dụng thư khách;

    chương trình điện thoại IP;

    Giao thức truyền tập tin.

    URL trang web đã cho là: http://www.sgzt.com/sgzt/archive/content/2005/03/043. Tên của giao thức truy cập tài nguyên thông tin này là gì?

    sgzt/archive/content/2005/03/043;

    Pháp nhân đã đăng ký tại Liên bang Nga có thể mua tên miền ở vùng nào trong số các vùng tên miền cấp 1 nêu trên?

    ở cả hai.

    Trong số các mục dưới đây, hãy cho biết địa chỉ IP chính xác của máy tính:

  • http://www.ipc.ru;

    www.ip-address.com.

    Địa chỉ email nào sau đây là đúng?

    HTML là gì?

    Một trong các giao thức họ TCP/IP;

    Ngôn ngữ đánh dấu siêu văn bản tài liệu;

    Ngôn ngữ lập trình.

Mạng toàn cầu

World Wide Web là một hệ thống phân tán cung cấp quyền truy cập vào các tài liệu được kết nối với nhau nằm trên nhiều máy tính khác nhau được kết nối Internet. Từ “web” (dịch từ tiếng Anh web có nghĩa là “web”) và từ viết tắt WWW cũng được dùng để chỉ World Wide Web. World Wide Web được tạo thành từ hàng trăm triệu máy chủ web. Hầu hết các tài nguyên trên World Wide Web đều dựa trên công nghệ siêu văn bản. Các tài liệu siêu văn bản được đăng trên World Wide Web được gọi là các trang web. Một số trang web có chung chủ đề, thiết kế và liên kết và thường nằm trên cùng một máy chủ web được gọi là trang web. Để tải xuống và xem các trang web, các chương trình đặc biệt được sử dụng - trình duyệt. World Wide Web đã gây ra một cuộc cách mạng thực sự về công nghệ thông tin và sự bùng nổ trong sự phát triển của Internet. Thông thường, khi nói về Internet, chúng có nghĩa là World Wide Web, nhưng điều quan trọng là phải hiểu rằng chúng không giống nhau.

Lịch sử của World Wide Web

Tim Berners-Lee và ở mức độ thấp hơn là Robert Cayo được coi là những người phát minh ra World Wide Web. Tim Berners-Lee là người sáng tạo ra công nghệ HTTP, URI/URL và HTML. Năm 1980, ông làm việc cho Hội đồng Nghiên cứu Hạt nhân Châu Âu với vai trò cố vấn phần mềm. Chính tại Geneva (Thụy Sĩ), ông đã viết chương trình Enquirer cho nhu cầu riêng của mình, chương trình này sử dụng các liên kết ngẫu nhiên để lưu trữ dữ liệu và đặt nền tảng khái niệm cho World Wide Web. Năm 1989, khi đang làm việc tại CERN về mạng nội bộ của tổ chức, Tim Berners-Lee đã đề xuất dự án siêu văn bản toàn cầu mà ngày nay được gọi là World Wide Web.

Dự án liên quan đến việc xuất bản các tài liệu siêu văn bản được liên kết bằng các siêu liên kết, điều này sẽ tạo điều kiện thuận lợi cho việc tìm kiếm và tổng hợp thông tin cho các nhà khoa học CERN. Để thực hiện dự án, Tim Berners-Lee đã phát minh ra URI, giao thức HTTP và ngôn ngữ HTML. Đây là những công nghệ mà không có nó thì không thể tưởng tượng được Internet hiện đại nữa. Giữa năm 1991 và 1993, Berners-Lee đã cải tiến các thông số kỹ thuật của các tiêu chuẩn này và công bố chúng. Tuy nhiên, năm chính thức ra đời của World Wide Web nên được coi là năm 1989. Là một phần của dự án, Berners-Lee đã viết máy chủ web đầu tiên trên thế giới, httpd, và trình duyệt web siêu văn bản đầu tiên trên thế giới, được gọi là WorldWideWeb. Trình duyệt này cũng là một trình soạn thảo WYSIWYG; quá trình phát triển của nó bắt đầu vào tháng 10 năm 1990 và hoàn thành vào tháng 12 cùng năm.