Công cụ tìm kiếm thế giới bằng tiếng Nga. Công cụ tìm kiếm

Nhiều người dùng cần có Internet để nhận được câu trả lời cho các truy vấn (câu hỏi) mà họ nhập vào.

Nếu không có công cụ tìm kiếm, người dùng sẽ phải tự mình tìm kiếm các trang web họ cần, ghi nhớ và viết chúng ra. Trong nhiều trường hợp, việc tìm kiếm thứ gì đó phù hợp “thủ công” sẽ rất khó và thường đơn giản là không thể.

Các công cụ tìm kiếm thực hiện tất cả công việc thường ngày này là tìm kiếm, lưu trữ và sắp xếp thông tin trên các trang web cho chúng ta.

Hãy bắt đầu với công cụ tìm kiếm Runet nổi tiếng.

Công cụ tìm kiếm trên Internet bằng tiếng Nga

1) Hãy bắt đầu với công cụ tìm kiếm trong nước. Yandex không chỉ hoạt động ở Nga mà còn hoạt động ở Belarus và Kazakhstan, Ukraine và Thổ Nhĩ Kỳ. Ngoài ra còn có Yandex bằng tiếng Anh.

2) Công cụ tìm kiếm Google đến với chúng tôi từ Mỹ và có bản địa hóa tiếng Nga:

3) Công cụ tìm kiếm trong nước Mail ru, đồng thời đại diện cho mạng xã hội VKontakte, Odnoklassniki, My World, Answers Mail.ru nổi tiếng và các dự án khác.

4) Công cụ tìm kiếm thông minh

Nigma (Nigma) http://www.nigma.ru/

Kể từ ngày 19 tháng 9 năm 2017, “trí thức” nigma đã không còn hoạt động. Nó không còn là mối quan tâm tài chính đối với những người tạo ra nó; họ chuyển sang một công cụ tìm kiếm khác có tên CocCoc.

5) Công ty nổi tiếng Rostelecom đã tạo ra công cụ tìm kiếm Sputnik.

Có một công cụ tìm kiếm tên là Sputnik, được thiết kế dành riêng cho trẻ em mà tôi đã viết về nó.

6) Rambler là một trong những công cụ tìm kiếm trong nước đầu tiên:

Có những công cụ tìm kiếm nổi tiếng khác trên thế giới:

  • Bing,
  • Yahoo!,
  • VịtDuckGo,
  • Baidu,
  • sinh thái,

Chúng ta hãy thử tìm hiểu cách hoạt động của một công cụ tìm kiếm, cụ thể là cách các trang web được lập chỉ mục, phân tích kết quả lập chỉ mục và tạo ra kết quả tìm kiếm. Nguyên tắc hoạt động của các công cụ tìm kiếm gần như giống nhau: tìm kiếm thông tin trên Internet, lưu trữ và sắp xếp thông tin để phân phối theo yêu cầu của người dùng. Nhưng các thuật toán mà công cụ tìm kiếm sử dụng có thể khác nhau rất nhiều. Các thuật toán này được giữ bí mật và việc tiết lộ nó bị cấm.

Bằng cách nhập cùng một truy vấn vào chuỗi tìm kiếm của các công cụ tìm kiếm khác nhau, bạn có thể nhận được các câu trả lời khác nhau. Lý do là tất cả các công cụ tìm kiếm đều sử dụng thuật toán riêng của mình.

Mục đích của công cụ tìm kiếm

Trước hết, bạn cần biết rằng công cụ tìm kiếm là tổ chức thương mại. Mục tiêu của họ là kiếm lợi nhuận. Bạn có thể kiếm lợi nhuận từ quảng cáo theo ngữ cảnh, các loại quảng cáo khác và từ việc quảng bá các trang web cần thiết lên đầu kết quả tìm kiếm. Nói chung có nhiều cách.

Nó phụ thuộc vào quy mô khán giả, tức là có bao nhiêu người sử dụng công cụ tìm kiếm này. Lượng khán giả càng lớn thì quảng cáo sẽ được hiển thị cho càng nhiều người. Theo đó, quảng cáo này sẽ có giá cao hơn. Các công cụ tìm kiếm có thể tăng lượng khán giả thông qua quảng cáo của chính họ, cũng như bằng cách thu hút người dùng bằng cách cải thiện chất lượng dịch vụ, thuật toán và sự thuận tiện trong tìm kiếm.

Điều quan trọng và khó khăn nhất ở đây là việc phát triển một thuật toán tìm kiếm có đầy đủ chức năng để cung cấp kết quả phù hợp cho phần lớn các truy vấn của người dùng.

Công việc của công cụ tìm kiếm và hành động của quản trị viên web

Mỗi công cụ tìm kiếm có thuật toán riêng, thuật toán này phải tính đến rất nhiều yếu tố khác nhau khi phân tích thông tin và tổng hợp kết quả theo yêu cầu của người dùng:

  • tuổi của một trang web cụ thể,
  • đặc điểm tên miền trang web,
  • chất lượng nội dung trên trang web và các loại của nó,
  • các tính năng của điều hướng và cấu trúc trang web,
  • khả năng sử dụng (tiện lợi cho người dùng),
  • các yếu tố hành vi (công cụ tìm kiếm có thể xác định xem người dùng có tìm thấy những gì mình đang tìm kiếm trên trang web hay người dùng quay lại công cụ tìm kiếm một lần nữa và ở đó lại tìm kiếm câu trả lời cho cùng một truy vấn)
  • vân vân.

Tất cả điều này là cần thiết một cách chính xác để kết quả theo yêu cầu của người dùng phù hợp nhất có thể, đáp ứng yêu cầu của người dùng. Đồng thời, các thuật toán của công cụ tìm kiếm liên tục thay đổi và được cải tiến. Như họ nói, không có giới hạn cho sự hoàn hảo.

Mặt khác, quản trị viên web và người tối ưu hóa liên tục phát minh ra những cách mới để quảng bá trang web của họ, điều này không phải lúc nào cũng trung thực. Nhiệm vụ của các nhà phát triển thuật toán công cụ tìm kiếm là thực hiện các thay đổi đối với thuật toán đó để không cho phép các trang web “xấu” của những trình tối ưu hóa không trung thực xuất hiện trong TOP.

Công cụ tìm kiếm hoạt động như thế nào?

Bây giờ hãy nói về cách công cụ tìm kiếm thực sự hoạt động. Nó bao gồm ít nhất ba giai đoạn:

  • quét,
  • lập chỉ mục,
  • khác nhau.

Số lượng các trang web trên Internet đơn giản là vô cùng lớn. Và mỗi trang web đều là thông tin, nội dung thông tin được tạo ra cho người đọc (người sống).

Đang quét

Đây là một công cụ tìm kiếm lang thang khắp Internet để thu thập thông tin mới, phân tích các liên kết và tìm kiếm nội dung mới có thể được sử dụng để trả lại cho người dùng theo yêu cầu của họ. Để quét, các công cụ tìm kiếm có các robot đặc biệt được gọi là robot tìm kiếm hoặc nhện.

Robot tìm kiếm là các chương trình tự động truy cập các trang web và thu thập thông tin từ chúng. Việc thu thập thông tin có thể là chính (robot truy cập một trang web mới lần đầu tiên). Sau khi thu thập thông tin ban đầu từ trang web và nhập nó vào cơ sở dữ liệu của công cụ tìm kiếm, robot bắt đầu truy cập các trang của nó một cách đều đặn. Nếu có bất kỳ thay đổi nào xảy ra (nội dung mới đã được thêm vào, nội dung cũ đã bị xóa) thì tất cả những thay đổi này sẽ được công cụ tìm kiếm ghi lại.

Nhiệm vụ chính của nhện tìm kiếm là tìm thông tin mới và gửi nó đến công cụ tìm kiếm cho giai đoạn xử lý tiếp theo, tức là lập chỉ mục.

Lập chỉ mục

Công cụ tìm kiếm chỉ có thể tìm kiếm thông tin trong số những trang web đã có trong cơ sở dữ liệu của nó (được nó lập chỉ mục). Nếu thu thập thông tin là quá trình tìm kiếm và thu thập thông tin có sẵn trên một trang web cụ thể thì lập chỉ mục là quá trình nhập thông tin này vào cơ sở dữ liệu của công cụ tìm kiếm. Ở giai đoạn này, công cụ tìm kiếm sẽ tự động quyết định nên nhập thông tin này hay thông tin kia vào cơ sở dữ liệu của nó và nhập thông tin đó vào đâu, vào phần nào của cơ sở dữ liệu. Ví dụ: Google lập chỉ mục gần như tất cả thông tin được tìm thấy bởi robot của nó trên Internet, trong khi Yandex kén chọn hơn và không lập chỉ mục mọi thứ.

Đối với các trang web mới, giai đoạn lập chỉ mục có thể kéo dài, vì vậy khách truy cập từ các công cụ tìm kiếm có thể đợi rất lâu để truy cập các trang web mới. Và thông tin mới xuất hiện trên các trang web cũ, được quảng bá tốt có thể được lập chỉ mục gần như ngay lập tức và gần như ngay lập tức xuất hiện trong “chỉ mục”, tức là trong cơ sở dữ liệu của công cụ tìm kiếm.

Khác nhau

Xếp hạng là sự sắp xếp thông tin đã được lập chỉ mục trước đó và nhập vào cơ sở dữ liệu của một công cụ tìm kiếm cụ thể, theo thứ hạng, tức là công cụ tìm kiếm sẽ hiển thị thông tin gì cho người dùng ở vị trí đầu tiên và thông tin nào sẽ được đặt “ xếp hạng” thấp hơn. Xếp hạng có thể được quy cho giai đoạn dịch vụ của công cụ tìm kiếm đối với khách hàng của nó – người dùng.

Trên các máy chủ của công cụ tìm kiếm, thông tin nhận được sẽ được xử lý và tạo ra kết quả cho rất nhiều loại truy vấn. Đây là nơi các thuật toán của công cụ tìm kiếm phát huy tác dụng. Tất cả các trang web có trong cơ sở dữ liệu đều được phân loại theo chủ đề và các chủ đề được chia thành các nhóm yêu cầu. Đối với mỗi nhóm yêu cầu, một vấn đề sơ bộ có thể được biên soạn, sau đó sẽ được điều chỉnh.

Bất cứ khi nào bạn duyệt một trang web, địa chỉ IP và MAC của bạn sẽ được ghi lại để theo dõi hoạt động của bạn. Để bảo vệ chính mình, bạn cần duyệt ẩn danh nhiều trang web khác nhau. Về vấn đề này, chúng tôi cung cấp danh sách các công cụ tìm kiếm ẩn danh sẽ không theo dõi truy vấn của bạn.

1. Wolfram Alpha

Đây là một trong những công cụ tìm kiếm tốt nhất và được các chuyên gia bảo mật biết đến. WolframAlpha cung cấp một cách mới về cơ bản để thu thập kiến ​​thức và câu trả lời - thông qua các phép tính động dựa trên lượng lớn dữ liệu, thuật toán và phương pháp tích hợp.

2.Privatelee


Đây là công cụ tìm kiếm dựa trên HTTPS sử dụng mã hóa SSL và không ghi lại các truy vấn của người dùng.

3.DuckDuckGo


Đây là một công cụ tìm kiếm nổi tiếng mà bạn có thể đã sử dụng. Công cụ tìm kiếm ẩn danh DuckDuckGo không thu thập hoặc chia sẻ thông tin cá nhân của người dùng. Đây là chính sách bảo mật được sử dụng bởi dịch vụ này.

4 Yippy


Đây là một trong những công cụ tìm kiếm mà qua đó bạn có thể dễ dàng lọc kết quả và sắp xếp danh sách theo mong muốn của mình. Hơn nữa, công cụ tìm kiếm này hoạt động với các tìm kiếm phù hợp của người dùng để cung cấp cho người dùng kết quả tốt nhất và không bao giờ lưu lịch sử tìm kiếm.

5. GIBIRU


Gibiru không liên kết với bất kỳ dữ liệu cá nhân nào và không theo dõi cookie. Công cụ tìm kiếm cung cấp một mạng ẩn danh không bị kiểm duyệt và ẩn danh để bạn có thể lướt Internet một cách an toàn.

6.Trang bắt đầu


Đây là một công cụ tìm kiếm mạnh mẽ hiển thị kết quả của Google đồng thời bảo vệ các truy vấn của người dùng và tránh các bước của bạn bị theo dõi. Nó cung cấp khả năng duyệt qua máy chủ proxy để ngăn địa chỉ IP hoặc vị trí bị theo dõi.

7. Hulbee


Hulbee.com là một giải pháp thay thế thông minh dành cho những người coi trọng tính toàn vẹn và quyền riêng tư của dữ liệu. Không giống như các công cụ tìm kiếm thông thường, người dùng Hulbee.com không để lại dấu vết. Hulbee.com thậm chí không đếm số lượng khách truy cập. Yêu cầu, địa chỉ IP và thông tin cá nhân của họ không được lưu trữ.

8. Ngắt kết nối tìm kiếm


Dịch vụ này sử dụng Google, Bing và Yahoo để tìm kiếm nội dung. Nhưng nó không bao giờ theo dõi yêu cầu hoặc địa chỉ IP của bạn. Nó thậm chí còn cho phép người dùng chọn vị trí của họ trước khi bắt đầu tìm kiếm.

9.Lukol


Lukol là một trong những công cụ tìm kiếm tốt nhất bảo vệ người dùng khỏi những kẻ lừa đảo và gửi thư rác trực tuyến. Sử dụng Google để hiển thị kết quả tìm kiếm. Nhưng một máy chủ proxy được sử dụng để cung cấp kết quả tìm kiếm.

Chúng tôi đã xem xét các công cụ tìm kiếm ẩn danh tốt nhất không theo dõi yêu cầu của người dùng. Sử dụng chúng, bạn có thể dễ dàng thực hiện các tìm kiếm ẩn danh mà không phải lo lắng về sự an toàn của mình.

Dịch bài viết" 10 công cụ tìm kiếm riêng tư hàng đầu không theo dõi bạn» được chuẩn bị bởi nhóm dự án thân thiện Xây dựng website từ A đến Z.

Tốt xấu

Hầu hết thời gian người dùng dành trên Internet là để tìm kiếm thông tin mà họ quan tâm. Đồng thời, có nhiều cách để có được dữ liệu này - bạn có thể xem bách khoa toàn thư trực tuyến và cố gắng tìm câu trả lời ở đó, bạn có thể đăng ký nhận bản tin về chủ đề quan tâm và nghiên cứu kỹ thư từ gửi đến hoặc bạn có thể tham khảo với những người có năng lực trên diễn đàn bằng cách đặt câu hỏi cho họ. Nhưng cách phổ biến nhất để tìm thứ gì đó trên Internet là sử dụng một trong nhiều công cụ tìm kiếm. Các dịch vụ tìm kiếm hàng triệu triệu trang web có lẽ là liên kết cơ bản của World Wide Web. Nếu không có Google, Yahoo, Yandex và nhiều công cụ tìm kiếm quen thuộc khác ngày nay, thời gian truy cập Internet của người dùng sẽ giống như một người mù đi xuyên rừng. Tầm quan trọng của các công cụ tìm kiếm khi làm việc trên Internet khó có thể được đánh giá quá cao - nhiều người dùng lấy địa chỉ công cụ tìm kiếm làm trang bắt đầu và chính từ đó, đối với nhiều người, một cuộc hành trình bất tận qua các tài nguyên mạng khác nhau bắt đầu. Tuy nhiên, hiệu quả của việc khai thác trên Internet đối với mỗi người là khác nhau - một người tìm thấy thông tin ngay lập tức, người khác mất rất nhiều thời gian và người thứ ba có thể không tìm thấy bất cứ điều gì hữu ích cho mình. Lý do là gì? Câu trả lời rất đơn giản: tìm kiếm trên Internet cũng giống như câu cá - bạn cần biết nơi câu cá và câu cá để làm gì, tức là. nhìn ở đâu và nhìn như thế nào. Trong bài viết hôm nay, chúng tôi sẽ nói về cách tốt nhất để tìm kiếm trên Internet và cho bạn biết những công cụ tìm kiếm nào tồn tại cho việc này, bên cạnh những công cụ “trên môi mọi người”.

Tuy nhiên, chúng tôi sẽ bắt đầu với những hệ thống mà bạn biết. Nếu người dùng biết địa chỉ của công cụ tìm kiếm, điều này không có nghĩa là họ biết cách sử dụng nó. Hãy kiểm tra xem bạn hiểu rõ công nghệ truy vấn tìm kiếm đến mức nào. Trước hết, kết quả bạn sẽ nhận được chính xác đến mức nào phụ thuộc vào mức độ khéo léo của bạn trong việc hình thành truy vấn tìm kiếm. Ví dụ: nếu bạn đang tìm kiếm thông tin để viết một bài luận học kỳ, bạn không cần phải nhập nguyên văn chủ đề của nó, đặc biệt nếu tác phẩm có chuyên môn hẹp. Bạn sẽ tìm thấy nhiều thông tin có giá trị hơn nếu bạn cố gắng chọn từ khóa, tức là những từ đó chắc chắn sẽ xuất hiện trong tác phẩm của bạn. Nếu bạn đang tìm kiếm sách hướng dẫn sử dụng radio ô tô bị thất lạc, thì bằng cách nhập số kiểu máy, bạn có thể sẽ nhận được một số lượng lớn các trang web chào bán nó. Để loại bỏ các liên kết không cần thiết, bạn có thể sử dụng chức năng tìm kiếm trong tìm kiếm hoặc loại trừ một số từ khỏi tìm kiếm. Trong hầu hết mọi công cụ tìm kiếm, bạn sẽ tìm thấy chức năng tìm kiếm nâng cao. Đây là một cách tốt khác để lọc ra những kết quả không cần thiết. Các chức năng này có thể bao gồm tìm kiếm các trang được cập nhật gần đây, chỉ tìm kiếm các trang bằng ngôn ngữ nhất định hoặc trên các trang web nằm trong vùng miền mà bạn chỉ định. Thời gian tìm kiếm có thể được tiết kiệm đáng kể nếu bạn biết và sử dụng cú pháp ngôn ngữ truy vấn. Mỗi công cụ tìm kiếm đều có những đặc điểm riêng. Ví dụ: khi bạn đang tìm kiếm thứ gì đó trên Yandex, bạn nên sử dụng các kỹ thuật sau:

  • Để tìm kiếm các từ sẽ xuất hiện trên trang trong một câu, hãy đặt ký hiệu & giữa chúng
  • Để loại trừ một từ cụ thể khỏi kết quả tìm kiếm, hãy thêm từ đó vào truy vấn của bạn bằng cách thêm tiền tố ~~
  • Để tìm các trang chứa ít nhất một trong các từ được chỉ định trong truy vấn tìm kiếm, hãy phân tách chúng bằng |
  • Để tìm kiếm một từ ở dạng đã chỉ định, hãy đặt dấu chấm than trước từ đó
Công cụ tìm kiếm Google cũng có những bí mật của nó. Đây chỉ là một vài trong số họ:
  • Để tìm kiếm thông tin trên một trang web cụ thể (và chỉ trên trang web đó), hãy nhập địa chỉ của trang web đó vào trường truy vấn, trước từ site và dấu hai chấm (ví dụ: site:http://www.site)
  • Để tìm kiếm một cụm từ sẽ xuất hiện toàn bộ trên trang, hãy đặt cụm từ đó trong dấu ngoặc kép
  • Để loại trừ các trang chứa một từ cụ thể khỏi kết quả tìm kiếm, hãy thêm từ đó vào truy vấn của bạn bằng cách đặt dấu trừ trước từ đó
Đây chỉ là một vài thao tác có thể giúp bạn tìm kiếm trên Internet hiệu quả hơn. Nếu bạn muốn đạt được kết quả tối ưu, chúng tôi khuyên bạn nên làm quen hơn với cú pháp của ngôn ngữ truy vấn, được mô tả chi tiết trong hệ thống trợ giúp của công cụ tìm kiếm yêu thích của bạn. Không còn nghi ngờ gì nữa, Google và Yandex là những công cụ không thể thiếu để tìm kiếm trên Internet - việc tìm kiếm trong các hệ thống này rất tiện lợi, linh hoạt và rất chính xác. Tuy nhiên, điều này không có nghĩa là các công cụ tìm kiếm thay thế không có quyền tồn tại. Có - họ lập chỉ mục ít trang hơn, vâng - phương pháp lựa chọn tài nguyên của họ phần lớn gây tranh cãi. Nhưng những công cụ tìm kiếm như vậy có một lợi thế không thể phủ nhận - chúng cung cấp những điều mới mẻ, khác với những tiêu chuẩn được chấp nhận. Vì các dịch vụ tìm kiếm thay thế sử dụng cách tiếp cận khác để chọn tài nguyên phù hợp với truy vấn nên kết quả tìm kiếm sẽ hoàn toàn khác so với trường hợp của các công cụ tìm kiếm thông thường. Vì vậy, nếu tìm kiếm lâu dài trên các dịch vụ nổi tiếng không dẫn đến bất cứ điều gì, điều này có nghĩa là một điều - bạn cần thay đổi chiến thuật và thử các phương pháp tìm kiếm thông tin khác bằng các công cụ tìm kiếm thay thế. Thông thường, các công cụ tìm kiếm thay thế sử dụng một hoặc nhiều danh sách tài nguyên đã được Google, Yahoo và các hệ thống lớn khác tìm thấy để thu thập kết quả. Những kết quả này được lọc, những kết quả tốt nhất được chọn và thường được trực quan hóa để hiểu rõ hơn bằng cách sử dụng sơ đồ, sơ đồ trang web, đám mây thẻ, v.v. Các nhà phát triển công cụ tìm kiếm thay thế đôi khi đi quá xa trong việc tìm kiếm một giao diện phổ quát mới đến mức đôi khi rất khó nhận ra công cụ tìm kiếm trong một trang web. Chưa hết, đây là những công cụ tìm kiếm. Không bình thường và lạ lùng, thoạt nhìn...

FindSounds.com - tìm kiếm âm thanh

Tài nguyên này dành cho những người dùng đang tìm kiếm sáng tạo. Tài nguyên cho phép bạn tìm kiếm các tệp âm thanh có định dạng khác nhau - wav, mp3, aiff, au. Cơ sở dữ liệu tài nguyên chứa nhiều loại âm thanh - tiếng la hét của động vật, tiếng ô tô mài, tiếng chuông, tiếng gõ cửa, còi báo động, tiếng côn trùng vo ve, tiếng gầm của vụ nổ và tiếng súng, tiếng nước bắn tung tóe, v.v. Các tệp âm thanh có thể được tìm kiếm theo nhiều tiêu chí khác nhau, ví dụ: theo kích thước, sự hiện diện của hai hoặc một kênh âm thanh (âm thanh nổi/đơn âm), tần số lấy mẫu và độ sâu bit âm thanh. Trong kết quả tìm kiếm, tài nguyên không chỉ hiển thị các liên kết đến các tệp tìm thấy mà còn hiển thị các đặc điểm chính của chúng, đồng thời hiển thị biểu đồ biên độ âm thanh, có thể được sử dụng để đánh giá bản chất âm thanh của một mẫu nhất định.

Cơ sở dữ liệu hiệu ứng âm thanh FindSounds có thể được sử dụng trong nhiều lĩnh vực khác nhau - từ phát triển trò chơi máy tính và các ứng dụng khác cho đến tạo bản trình bày và tất cả các loại clip. Công cụ tìm kiếm có thể hữu ích, chẳng hạn như đối với những người tạo đồ họa web tương tác và muốn tăng thêm sự đa dạng cho trang web bằng cách đi kèm với việc nhấp vào các thành phần điều hướng trang với các âm thanh khác nhau.

Gnod.net - sẽ chọn nhạc, sách và phim phù hợp với sở thích của bạn

Khi một người muốn đọc một cuốn sách mới, nghe một bản nhạc mới hoặc xem một bộ phim, anh ta thường tìm đến bạn bè hoặc người quen của mình để xin lời khuyên, những người có thẩm quyền trong mắt anh ta. Tuy nhiên, việc tìm được người đồng ý bày tỏ quan điểm của mình về vấn đề này không phải là điều dễ dàng. Thứ nhất, không phải ai cũng thích đưa ra lời khuyên, bởi vì khi giới thiệu điều gì đó cho người khác, một người sẽ phải chịu trách nhiệm và nhiều người dừng lại trước câu hỏi “Nếu anh ấy không thích bộ phim mà tôi giới thiệu thì sao?” Thứ hai, người đưa ra lời khuyên phải hiểu chính xác người đối thoại sẽ thích gì và điều gì sẽ hoàn toàn không thú vị. Rốt cuộc, hương vị và màu sắc, như người ta nói... Nhưng có một cách dễ dàng hơn để nhận được lời khuyên hữu ích - sử dụng một công cụ tìm kiếm đặc biệt được thiết kế riêng cho mục đích này. Vì vậy, bạn muốn nghe một ban nhạc mới, nhưng bạn không có thời gian hoặc mong muốn tìm kiếm những bản nhạc hay. Tài nguyên gnod.net sẽ hỏi bạn một số tên nghệ sĩ âm nhạc mà bạn thích, phân tích kết quả và đưa ra phiên bản ca sĩ hoặc nhóm nhạc của riêng bạn mà bạn cũng nên thích. Dịch vụ này có một số cơ sở dữ liệu - về nghệ sĩ âm nhạc, phim ảnh, sách và con người. Do đó, tài nguyên bao gồm bốn dịch vụ: Gnod Music, Gnod Books, Gnod Movies và Flork. Dịch vụ mới nhất, Flork, là một thử nghiệm xã hội nhằm khám phá những người quan tâm đến việc giao tiếp với nhau. Chúng tôi rất vui khi thử nghiệm phần âm nhạc của dịch vụ này và giới thiệu ba nghệ sĩ - Gerry and the Pacemakers, The Beatles và Hollies. Sự lựa chọn của chúng tôi không phải ngẫu nhiên - ba nhóm này thuộc thời kỳ những năm sáu mươi, thuộc về một hiện tượng thú vị được gọi là Cuộc xâm lược của Anh. Tất cả các ban nhạc này đều chơi một nhịp và công cụ tìm kiếm phải đề xuất một ban nhạc hoặc nghệ sĩ có cùng phong cách. Và thế là nó đã xảy ra. Kết quả mang lại cho chúng tôi là nhóm Archies, vào cuối những năm sáu mươi đã được tất cả người Mỹ yêu thích với bài hát vui tươi Sugar Sugar. Sau khi chơi với công cụ tìm kiếm một thời gian, chúng tôi đi đến kết luận rằng gnod.net thường đưa ra lời khuyên chính xác và không thường xuyên mắc lỗi. Để rõ ràng, công cụ tìm kiếm có thể cung cấp kết quả “lời khuyên” của nó dưới dạng một đám mây hoạt hình với tên của các nhóm, tác giả hoặc phim. Cơ sở dữ liệu có thể được bổ sung một cách độc lập bằng cách “trò chuyện” với công cụ tìm kiếm và trả lời các câu hỏi của nó theo kiểu “Tôi thích cái này” hoặc “Tôi không thích cái này”.

Alldll.net - tìm tập tin thư viện

Chúng tôi khuyên bạn nên đánh dấu ngay công cụ tìm kiếm này, vì sớm hay muộn nó chắc chắn sẽ có ích. Chắc hẳn ai cũng ít nhất một lần gặp phải vấn đề thiếu thư viện dll trong hệ thống của mình. Điều này thường dẫn đến các chương trình hoặc trò chơi từ chối khởi chạy và thông báo “Không thể tìm thấy *****.dll” xuất hiện trên màn hình." Có thể có nhiều lý do cho việc này, ví dụ: việc thiếu tệp có thể có thể do xóa sai ứng dụng đã cài đặt trước đó, vô tình làm hỏng tệp, v.v. Ngoài ra, nhà phát triển có thể đơn giản là không đưa thư viện này vào quá trình phân phối sản phẩm của mình.

Việc khắc phục tình trạng này rất đơn giản - chỉ cần tìm tệp bị thiếu trên Internet, tải xuống và sao chép vào thư mục của chương trình từ chối khởi động hoặc vào thư mục ..WINDOWSsystem32.... Bạn có thể tìm và tải xuống tệp bị thiếu. tập tin dễ dàng và nhanh chóng bằng cách sử dụng dịch vụ này. Tài nguyên www.alldll.net là cơ sở dữ liệu có thể tìm kiếm được của các thư viện dll phổ biến nhất. Các tập tin được sắp xếp theo thứ tự bảng chữ cái và có chức năng tìm kiếm. Bạn có thể tìm kiếm tệp bạn đang tìm ngay cả khi bạn chỉ biết tên gần đúng của thư viện. Chỉ cần bắt đầu nhập văn bản vào trường yêu cầu là đủ và ở cuối trang sẽ xuất hiện một danh sách lớn các tệp bắt đầu bằng các chữ cái đã được nhập.

Medpoisk.ru - tìm kiếm thông tin y tế

Mặc dù thực tế là công cụ tìm kiếm này sử dụng công cụ tìm kiếm của Google, nhưng điều này không hề làm giảm giá trị của nó. Medpoisk.ru là một công cụ tìm kiếm phổ quát được thiết kế để tìm kiếm độc quyền trên các trang web y tế. Trang web này là một công cụ tuyệt vời cho mọi bác sĩ và bất kỳ ai muốn nhận được câu trả lời cho bất kỳ câu hỏi nào trong lĩnh vực y học. Làm thế nào để điều trị căn bệnh này hay căn bệnh kia, những chống chỉ định của loại thuốc này hay loại thuốc kia, nên khám bác sĩ nào - tất cả những điều này và nhiều hơn thế nữa có thể được tìm ra bằng cách “hỏi” một công cụ tìm kiếm. Công cụ tìm kiếm bao gồm trao đổi lao động và có thể được sử dụng để tìm kiếm việc làm giữa các chuyên gia y tế. Tài nguyên này cũng chứa một danh mục các tổ chức y tế được sắp xếp theo khu vực. Trong số các cơ sở này có địa chỉ của các phòng khám, trung tâm y tế thuộc nhiều chuyên khoa khác nhau, bệnh viện phụ sản, trung tâm chẩn đoán, thẩm mỹ viện, v.v. Chúng tôi chân thành mong muốn bạn sử dụng dịch vụ tìm kiếm này chỉ vì tò mò chứ không phải vì cần thiết.

Taggalaxy.de - tìm kiếm hình ảnh và hình ảnh

Có lẽ bạn đã nghe nói về dịch vụ chia sẻ hình ảnh phổ biến Flickr.com? Đây cũng chính là dịch vụ đã bị chính quyền Trung Quốc chặn vào năm 2007 sau khi những bức ảnh về sự kiện đau buồn năm 1989 tại Quảng trường Thiên An Môn, nằm ở thủ đô Bắc Kinh của Trung Quốc, xuất hiện trên các trang của dịch vụ này. Flickr.com là một trong những dịch vụ Web 2.0 đầu tiên và số lượng hình ảnh được người dùng tải lên lên tới hàng tỷ. Số lượng hình ảnh được tải lên máy chủ của dịch vụ này lớn đến mức để tìm được một hình ảnh cụ thể trong đại dương ảnh và tranh này, cần phải có một công cụ tìm kiếm riêng. Dịch vụ này cung cấp dịch vụ tìm kiếm hình ảnh, nhưng có một cách thú vị hơn để tìm kiếm hình ảnh - sử dụng công cụ tìm kiếm khác thường taggalaxy.de. Dịch vụ tìm kiếm này là một công cụ tìm kiếm hình ảnh trên Flickr.com, có tính năng xem trước. Điều khiến nó trở nên khác thường là giao diện tìm kiếm hoàn toàn ba chiều. Quá trình tìm kiếm theo từ khóa gợi nhớ đến một số loại trò chơi trên máy tính - các thiên thể khác nhau bay trong không gian vũ trụ, giữa đó bạn có thể di chuyển trong thế giới ảo.

Sau khi truy vấn từ khóa hoàn tất, trên màn hình sẽ xuất hiện hệ thống mặt trời và các hành tinh quay quanh ngôi sao. Mỗi thiên thể đều có mục đích riêng và được “ký” bằng một từ. Ở trung tâm thiên hà là mặt trời, câu truy vấn chính, tất cả các vật thể khác đều là những từ bổ trợ, làm rõ. Nếu bạn nhấp vào mặt trời, vật thể này sẽ đến gần hơn và các bức ảnh sẽ bay về phía nó từ mọi phía và bao quanh nó, nội dung của vật thể đó được xác định bởi truy vấn tìm kiếm. Mô hình ba chiều kèm theo các bức ảnh này có thể được xoay trong không gian ảo, kiểm tra chi tiết và tìm kiếm hình ảnh quan tâm. Sau đó, chỉ cần nhấp vào hình ảnh để phóng to kích thước, sau đó bạn có thể kiểm tra nó tốt hơn và đọc mô tả.

Khi làm việc với công cụ tìm kiếm này, bạn có thể sử dụng chức năng cuộn - nó cho phép bạn phóng to hoặc thu nhỏ các hành tinh ba chiều. Các hành tinh còn lại hiển thị trong giao diện công cụ tìm kiếm sau yêu cầu là những từ bổ trợ cho phép bạn làm rõ yêu cầu. Ví dụ: nếu bạn nhập “Bầu trời” vào trường tìm kiếm thì trong số các từ-hành tinh đủ điều kiện sẽ có các từ “mây”, “hoàng hôn”, “xanh lam” và các thẻ khác có ý nghĩa tương tự mà người dùng đã chỉ định khi sử dụng Flickr dịch vụ .com. Nhược điểm của công cụ tìm kiếm là taggalaxy.de không hỗ trợ tiếng Nga nên chỉ có thể nhập truy vấn bằng tiếng Latin.

Nigma.ru - lọc kết quả từ các công cụ tìm kiếm khác

Trong số tất cả các công cụ tìm kiếm có thể tìm thấy trên Internet, có một nhóm công cụ tìm kiếm đặc biệt. Nó khác với tất cả những thứ khác ở chỗ chúng thực hiện chức năng đa tìm kiếm, nghĩa là tìm kiếm đồng thời trong một số công cụ tìm kiếm. Một trong những hệ thống tìm kiếm đa dạng này là dịch vụ Nigma.ru của Nga.

Nigma chứa cơ sở tài nguyên riêng nhưng ngoài ra, nó còn cho phép bạn tìm kiếm ngay lập tức trên tất cả các công cụ tìm kiếm phổ biến nhất, bao gồm Google, MSN, Yandex, Rambler, AltaVista, Yahoo và Aport. Cơ chế chọn kết quả trong công cụ tìm kiếm này khác với các phương pháp khám phá trang web được chấp nhận nhất. Thực tế là công cụ của dịch vụ này sử dụng phân cụm kết quả. Điều đó có nghĩa là gì? Hãy tưởng tượng bạn quyết định tự mình tìm hiểu xem “kết xuất” là gì. Sau khi so sánh kết quả trong các công cụ tìm kiếm khác nhau, công cụ Nigma.ru đã chọn những kết quả có khả năng xảy ra nhất, đồng thời, ở phía bên trái của cửa sổ, bên cạnh danh sách kết quả tìm kiếm, hiển thị cái gọi là cụm - “ trực quan hóa", "sáng tạo", "hệ thống", "kết xuất", "quy trình", "studio max", "đồ họa máy tính" và các từ và cụm từ khác. Các cụm này đại diện cho một nhóm tài liệu được tìm thấy theo chủ đề. Bằng cách này, bạn có thể nhanh chóng thu hẹp tìm kiếm hoặc chỉ định truy vấn tìm kiếm của mình. Trong Nigma.ru, bạn cũng có thể sử dụng các danh mục để giới hạn khu vực mà kết quả sẽ được chọn - ví dụ: chỉ thực hiện tìm kiếm dựa trên tài nguyên âm nhạc hoặc chỉ hiển thị kết quả cho hình ảnh. Một cơ hội khác của dịch vụ này có thể được học sinh và sinh viên quan tâm. Nigma.ru cung cấp các dịch vụ Nigma-toán học và Nigma-hóa học. Cái đầu tiên được thiết kế để giải nhanh các phương trình đơn giản và các phép tính số học khác nhau, cái thứ hai cho phép bạn làm việc với các công thức phản ứng hóa học. Dịch vụ tìm kiếm nhận dạng hơn một nghìn hằng số vật lý, toán học và đơn vị đo lường, cho phép bạn nhanh chóng chuyển đổi từ chiều này sang chiều khác.

Searchme.com - công cụ tìm kiếm có bản xem trước

Mọi người đều biết rằng để tìm được thông tin cụ thể trên Internet, bạn cần phải dành rất nhiều thời gian. Khi xem kết quả tìm kiếm, về cơ bản, người dùng mở các tài nguyên một cách ngẫu nhiên, không biết chắc liệu mình có tìm thấy nội dung mình quan tâm trên trang mới hay không, hay điều đó sẽ lãng phí thời gian. Những người tạo ra dịch vụ tìm kiếm searchme.com đã nghĩ về vấn đề này và đưa ra giải pháp ban đầu. Bản chất của giải pháp này là tạo ra một công cụ tìm kiếm trong đó người dùng có thể xem hình thu nhỏ thô của trang trước khi tải. Điều này sẽ cho phép chúng tôi hình thành ý kiến ​​​​bổ sung về mức độ nghiêm trọng của tài nguyên và nội dung của nó.

Việc triển khai ý tưởng này thật tuyệt vời - công cụ tìm kiếm được tạo ra có giao diện ba chiều hoạt hình đẹp mắt và hiển thị kết quả tìm kiếm dưới dạng dải băng hoạt hình gồm các hình thu nhỏ, ảnh chụp màn hình hình thu nhỏ của các trang web có chứa từ khóa tìm kiếm. Đoạn băng có kết quả, giống như một bộ phim có âm bản cũ, có thể được cuộn trong cửa sổ trình duyệt bằng một thanh trượt đặc biệt nằm dưới chuỗi hình ảnh. Các bản phác thảo được tải ngay lập tức nên không có sự chậm trễ trong việc vẽ kết quả. Nó đặc biệt thuận tiện khi làm việc với kết quả tìm kiếm ở chế độ toàn màn hình - khi đó bạn thậm chí có thể xem văn bản của các bài báo trong hình thu nhỏ của kết quả. Để đánh giá cao sự tiện lợi của hệ thống này, bạn chỉ cần thử duyệt các nguồn tin tức. Hình ảnh tin tức chính trên trang tiêu đề của ấn phẩm web sẽ ngay lập tức làm rõ tin tức nào trên tài nguyên này được coi là quan trọng nhất.

Giải pháp là một công cụ tìm kiếm torrent chuyên dụng. Có rất nhiều trang web trên Internet tìm kiếm tài nguyên torrent. Tuy nhiên, torrent-finder.com có ​​một lợi thế không thể phủ nhận so với các công cụ tìm kiếm khác - dịch vụ này cho phép bạn tìm kiếm các tệp trên một số lượng lớn trình theo dõi cùng một lúc.

Công cụ tìm kiếm (SE) đã là một phần thiết yếu của Internet từ khá lâu. Ngày nay, chúng là những cơ chế khổng lồ và phức tạp, không chỉ là công cụ để tìm kiếm bất kỳ thông tin cần thiết nào mà còn là những lĩnh vực khá thú vị cho doanh nghiệp.


Nhiều người dùng tìm kiếm chưa bao giờ nghĩ về nguyên tắc hoạt động của họ, cách xử lý yêu cầu của người dùng hoặc cách các hệ thống này được xây dựng và hoạt động. Tài liệu này sẽ giúp những người tham gia tối ưu hóa và hiểu cấu trúc cũng như chức năng chính của công cụ tìm kiếm.

Chức năng và khái niệm của PS

Hệ thống tìm kiếm là một tổ hợp phần cứng và phần mềm được thiết kế để thực hiện chức năng tìm kiếm trên Internet và đáp ứng yêu cầu của người dùng, thường được chỉ định dưới dạng cụm từ văn bản (hay chính xác hơn là truy vấn tìm kiếm), bằng cách đưa ra một tham chiếu danh sách các nguồn thông tin, dựa trên mức độ liên quan. Các công cụ tìm kiếm phổ biến nhất và lớn nhất: Google, Bing, Yahoo, Baidu. Trong RuNet - Yandex, Mail.Ru, Rambler.

Chúng ta hãy xem xét kỹ hơn ý nghĩa của truy vấn tìm kiếm, lấy hệ thống Yandex làm ví dụ.

Yêu cầu phải được người dùng đưa ra đầy đủ theo chủ đề tìm kiếm của mình, đơn giản và ngắn gọn nhất có thể. Ví dụ: chúng tôi muốn tìm thông tin trong công cụ tìm kiếm này: “cách chọn xe cho chính mình”. Để thực hiện việc này, hãy mở trang chính và nhập truy vấn tìm kiếm “cách chọn xe”. Sau đó, chức năng của chúng tôi chỉ còn là đi theo các liên kết được cung cấp tới các nguồn thông tin trên mạng.




Nhưng ngay cả khi hành động theo cách này, chúng ta cũng có thể không nhận được thông tin mình cần. Nếu chúng tôi nhận được kết quả tiêu cực như vậy, chúng tôi chỉ cần định dạng lại yêu cầu của mình hoặc cơ sở dữ liệu tìm kiếm thực sự không có bất kỳ thông tin hữu ích nào về loại yêu cầu này (điều này hoàn toàn có thể xảy ra với các tham số “hẹp” của yêu cầu, chẳng hạn như, ví dụ: “cách chọn ô tô ở Anadyr ").

Nhiệm vụ cơ bản nhất của mọi công cụ tìm kiếm là cung cấp cho mọi người chính xác loại thông tin họ cần. Và thực tế là không thể dạy người dùng tạo loại truy vấn “chính xác” cho các công cụ tìm kiếm, tức là các cụm từ sẽ tương ứng với nguyên tắc hoạt động của chúng.

Đó là lý do tại sao các nhà phát triển công cụ tìm kiếm chuyên nghiệp tạo ra các nguyên tắc và thuật toán cho công việc của họ để cho phép người dùng tìm thấy thông tin họ quan tâm. Điều này có nghĩa là hệ thống phải “suy nghĩ” giống như cách một người nghĩ khi tìm kiếm thông tin cần thiết trên Internet.

Khi nhập truy vấn của mình vào công cụ tìm kiếm, anh ấy muốn tìm thấy thứ mình cần một cách dễ dàng và nhanh chóng nhất có thể. Sau khi nhận được kết quả, người dùng đưa ra đánh giá về hiệu suất của hệ thống, được hướng dẫn bởi một số tiêu chí. Liệu anh ấy có thể tìm thấy thông tin mình cần không? Nếu không, anh ấy đã phải định dạng lại văn bản truy vấn bao nhiêu lần để tìm thấy nó? Thông tin họ nhận được cập nhật như thế nào? Công cụ tìm kiếm xử lý yêu cầu của anh ấy nhanh như thế nào? Kết quả tìm kiếm được cung cấp thân thiện với người dùng như thế nào? Kết quả mong muốn đứng đầu hay ở vị trí thứ 30? Bao nhiêu thông tin “rác” (thông tin không cần thiết) được tìm thấy cùng với thông tin hữu ích? Liệu thông tin liên quan có được tìm thấy cho anh ta khi sử dụng PS trong một tuần hay một tháng không?




Để có được câu trả lời đúng cho những câu hỏi như vậy, các nhà phát triển tìm kiếm không ngừng cải tiến các nguyên tắc xếp hạng và thuật toán của nó, bổ sung thêm các tính năng và chức năng mới cho chúng, đồng thời cố gắng làm cho hệ thống hoạt động nhanh hơn bằng mọi cách.

Đặc điểm chính của công cụ tìm kiếm

Hãy để chúng tôi chỉ ra các đặc điểm chính của tìm kiếm:

Sự hoàn thiện.

Tính đầy đủ là một trong những đặc điểm quan trọng nhất của tìm kiếm; nó thể hiện tỷ lệ giữa số lượng tài liệu thông tin được tìm thấy theo yêu cầu trên tổng số tài liệu trên Internet liên quan đến một yêu cầu nhất định. Ví dụ: có 100 trang trên Internet với cụm từ “cách chọn ô tô” và đối với cùng một truy vấn, chỉ có 60 trang trong tổng số được chọn, thì trong trường hợp này mức độ đầy đủ của tìm kiếm sẽ là 0,6. Rõ ràng là bản thân việc tìm kiếm càng đầy đủ thì khả năng người dùng tìm thấy chính xác tài liệu mình cần càng cao, tất nhiên, nếu nó tồn tại.

Sự chính xác.

Một chức năng chính khác của công cụ tìm kiếm là độ chính xác. Nó xác định mức độ các trang được tìm thấy trên Internet phù hợp với yêu cầu của người dùng. Ví dụ: nếu cụm từ khóa “cách chọn ô tô” có hàng trăm tài liệu thì một nửa trong số đó chứa cụm từ này và phần còn lại chỉ có các từ sau (cách chọn đài phát thanh ô tô chính xác và lắp đặt trên ô tô ), thì độ chính xác tìm kiếm bằng 50/100 = 0,5.

Tìm kiếm càng chính xác, người dùng sẽ tìm thấy thông tin mình cần càng sớm, càng ít "rác" khác nhau được tìm thấy trong các kết quả, càng ít tài liệu được tìm thấy sẽ không tương ứng với ý nghĩa của yêu cầu.

Sự liên quan.

Đây là một thành phần quan trọng của tìm kiếm, được đặc trưng bởi thời gian trôi qua từ thời điểm thông tin được xuất bản trên Internet cho đến khi nó được nhập vào cơ sở dữ liệu chỉ mục của công cụ tìm kiếm.

Ví dụ, một ngày sau khi thông tin về việc ra mắt iPad mới xuất hiện, nhiều người dùng đã chuyển sang tìm kiếm với các loại truy vấn liên quan. Trong hầu hết các trường hợp, thông tin về tin tức này đã có sẵn trong tìm kiếm, mặc dù rất ít thời gian trôi qua kể từ khi nó xuất hiện. Điều này là do các công cụ tìm kiếm lớn có “cơ sở dữ liệu nhanh” được cập nhật nhiều lần trong ngày.

Tốc độ tìm kiếm.

Chức năng như tốc độ tìm kiếm có liên quan chặt chẽ với cái gọi là “khả năng chịu tải”. Một số lượng lớn người truy cập tìm kiếm mỗi giây; khối lượng công việc như vậy đòi hỏi phải giảm đáng kể thời gian xử lý một yêu cầu. Ở đây, lợi ích của cả công cụ tìm kiếm và người dùng hoàn toàn trùng khớp: khách truy cập muốn nhận được kết quả nhanh nhất có thể và công cụ tìm kiếm phải xử lý yêu cầu của anh ta càng nhanh càng tốt để không làm chậm quá trình xử lý các yêu cầu tiếp theo.

Hiển thị.

Trình bày kết quả trực quan là yếu tố quan trọng nhất của sự thuận tiện trong tìm kiếm. Dựa trên nhiều truy vấn, công cụ tìm kiếm tìm thấy hàng nghìn và trong một số trường hợp là hàng triệu tài liệu khác nhau. Do sự mơ hồ trong việc tổng hợp các cụm từ khóa cho tìm kiếm hoặc tính không chính xác của nó, ngay cả kết quả truy vấn đầu tiên không phải lúc nào cũng chỉ chứa thông tin cần thiết.

Điều này có nghĩa là một người thường phải tự mình tiến hành tìm kiếm trong số các kết quả được cung cấp. Các thành phần khác nhau của trang kết quả tìm kiếm giúp bạn điều hướng kết quả tìm kiếm.

Lịch sử phát triển của công cụ tìm kiếm

Khi Internet mới bắt đầu phát triển, số lượng người dùng thường xuyên còn ít và lượng thông tin truy cập tương đối ít. Về cơ bản, chỉ những chuyên gia trong lĩnh vực nghiên cứu mới có quyền truy cập vào mạng này. Khi đó, nhiệm vụ tìm kiếm thông tin chưa cấp bách như bây giờ.

Một trong những phương pháp đầu tiên để tổ chức truy cập rộng rãi vào các nguồn thông tin là tạo ra các thư mục trang web và các liên kết đến chúng bắt đầu được nhóm theo chủ đề. Dự án đầu tiên là tài nguyên Yahoo.com, được mở vào mùa xuân năm 1994. Sau đó, khi số lượng trang web trong thư mục Yahoo tăng lên đáng kể, tùy chọn tìm kiếm thông tin cần thiết trong thư mục đã được thêm vào. Nó vẫn chưa phải là một hệ thống tìm kiếm đầy đủ, vì phạm vi tìm kiếm như vậy chỉ giới hạn ở các trang web có trong thư mục này chứ không phải tất cả các tài nguyên trên Internet. Trước đây, các thư mục liên kết được sử dụng rộng rãi nhưng ngày nay chúng gần như đã mất đi sự phổ biến hoàn toàn.

Suy cho cùng, ngay cả những danh mục ngày nay với số lượng khổng lồ cũng chỉ chứa thông tin về một phần nhỏ các trang web trên Internet. Danh bạ nổi tiếng nhất và lớn nhất thế giới có thông tin trên 5 triệu trang web, trong khi cơ sở dữ liệu của Google chứa thông tin trên hơn 25 tỷ trang.




Công cụ tìm kiếm thực sự đầu tiên là WebCrawler, xuất hiện vào năm 1994.

Năm sau AltaVista và Lycos xuất hiện. Hơn nữa, người đầu tiên là người dẫn đầu trong việc tìm kiếm thông tin trong một thời gian rất dài.




Năm 1997, Sergey Brin cùng với Larry Page đã tạo ra công cụ tìm kiếm Google như một dự án nghiên cứu tại Đại học Stanford. Ngày nay đó là Google, công cụ tìm kiếm phổ biến và phổ biến nhất trên thế giới.




Vào tháng 9 năm 1997, Yandex PS đã được công bố (chính thức), hiện là hệ thống tìm kiếm phổ biến nhất trên RuNet.




Dựa theo Tháng 9 năm 2015, thị phần của các công cụ tìm kiếm trên thế giới được phân bổ như sau:
  • Google - 69,24%;
  • Bing - 12,26%;
  • Yahoo! - 9,19%;
  • Baidu - 6,48%;
  • AOL - 1,11%;
  • Hỏi - 0,23%;
  • Kích thích - 0,00%


Dựa theo tháng 12 năm 2016, chia sẻ của các công cụ tìm kiếm trong Runet:

  • Yandex - 48,40%
  • Google - 45,10%
  • Tìm kiếm.Mail.ru - 5,70%
  • Rambler - 0,40%
  • Bing - 0,30%
  • Yahoo - 0,10%

Cách công cụ tìm kiếm hoạt động

Ở Nga, công cụ tìm kiếm chính là Yandex, sau đó là Google và sau đó là [email protected]. Tất cả các công cụ tìm kiếm lớn đều có cấu trúc riêng, khá khác biệt so với các công cụ khác. Nhưng vẫn có thể xác định được các yếu tố cơ bản chung cho tất cả các công cụ tìm kiếm.

Mô-đun lập chỉ mục.

Thành phần này bao gồm ba chương trình robot:

nhện(trong tiếng Anh là nhện) là một chương trình được thiết kế để tải xuống các trang web. Con nhện tải xuống một trang cụ thể, đồng thời trích xuất tất cả các liên kết từ đó. Mã HTML được tải xuống từ hầu hết mọi trang. Để làm điều này, robot sử dụng giao thức HTTP.




"Nhện" hoạt động như sau. Robot gửi yêu cầu đến máy chủ “get/path/document” và các lệnh yêu cầu HTTP khác. Để đáp lại, chương trình robot sẽ nhận được một luồng văn bản chứa thông tin về loại dịch vụ và tất nhiên là cả chính tài liệu đó.
  • URL của trang đã tải xuống;
  • ngày tải trang xuống;
  • tiêu đề phản hồi http của máy chủ;
  • mã html, “nội dung” của trang.
Trình thu thập thông tin("du lịch" nhện). Chương trình này tự động đi đến tất cả các liên kết được tìm thấy trên trang và cũng đánh dấu chúng. Nhiệm vụ của nó là quyết định nơi con nhện sẽ đi tiếp theo, dựa trên các liên kết này hoặc dựa trên danh sách địa chỉ nhất định.

Người lập chỉ mục(robot indexer) là chương trình phân tích các trang mà nhện đã tải xuống.



Bộ chỉ mục sẽ phân tích trang hoàn toàn thành các phần tử thành phần của nó và phân tích chúng bằng cách sử dụng các loại thuật toán hình thái và từ vựng của riêng nó.

Việc phân tích được thực hiện trên nhiều phần khác nhau của trang, chẳng hạn như tiêu đề, văn bản, liên kết, kiểu dáng và đặc điểm cấu trúc, thẻ html, v.v.

Do đó, mô-đun lập chỉ mục cho phép theo dõi các liên kết của một số tài nguyên nhất định, tải xuống các trang, trích xuất liên kết đến các trang mới từ các tài liệu đã nhận và thực hiện phân tích chi tiết về chúng.

Cơ sở dữ liệu

Cơ sở dữ liệu(hoặc chỉ mục công cụ tìm kiếm) là một tổ hợp lưu trữ dữ liệu, một mảng thông tin trong đó các tham số sửa đổi của từng tài liệu được mô-đun lập chỉ mục xử lý và tải xuống được lưu trữ theo một cách nhất định.

Máy chủ tìm kiếm

Đây là yếu tố quan trọng nhất của toàn bộ hệ thống, bởi vì tốc độ và tất nhiên là chất lượng tìm kiếm phụ thuộc trực tiếp vào các thuật toán làm cơ sở cho chức năng của nó.

Máy chủ tìm kiếm hoạt động như sau:

  • Yêu cầu đến từ người dùng phải được phân tích hình thái. Môi trường thông tin của bất kỳ tài liệu nào có sẵn trong cơ sở dữ liệu sẽ được tạo (sau đó nó sẽ được hiển thị dưới dạng đoạn mã, tức là trường thông tin văn bản tương ứng với một yêu cầu nhất định).
  • Dữ liệu nhận được sẽ được chuyển dưới dạng tham số đầu vào cho mô-đun xếp hạng chuyên biệt. Chúng được xử lý cho tất cả các tài liệu và do đó, đối với mỗi tài liệu đó, xếp hạng riêng của nó được tính toán, đặc trưng cho mức độ liên quan của tài liệu đó với yêu cầu của người dùng và các thành phần khác.
  • Tùy thuộc vào các điều kiện do người dùng chỉ định, xếp hạng này có thể được điều chỉnh bởi các điều kiện bổ sung.
  • Sau đó, đoạn mã sẽ được tạo, tức là. Đối với bất kỳ tài liệu nào được tìm thấy, tiêu đề, bản tóm tắt phù hợp nhất với truy vấn và liên kết đến tài liệu này sẽ được trích xuất từ ​​bảng tương ứng, đồng thời các dạng từ và từ tìm thấy sẽ được đánh dấu.
  • Kết quả tìm kiếm kết quả được truyền đến người thực hiện nó dưới dạng trang hiển thị kết quả tìm kiếm (SERP).
Tất cả các yếu tố này có liên quan chặt chẽ với nhau và hoạt động, tương tác với nhau, tạo thành một cơ chế riêng biệt nhưng khá phức tạp cho hoạt động của PS, đòi hỏi phải tiêu tốn rất nhiều nguồn lực.

Thoạt nhìn, có vẻ như chỉ Yandex mới có thể tốt hơn Google và thậm chí đó không phải là sự thật. Các công ty này đầu tư số tiền khổng lồ vào đổi mới và phát triển. Có ai thực sự có cơ hội không chỉ để cạnh tranh với những người dẫn đầu mà còn để giành chiến thắng? Câu trả lời của Lifehacker: “Có!” Có một số công cụ tìm kiếm đã thành công. Hãy nhìn vào những anh hùng của chúng ta.

Cái này là cái gì

Đây là một công cụ tìm kiếm mã nguồn mở khá nổi tiếng. Máy chủ được đặt tại Hoa Kỳ. Ngoài robot của riêng mình, công cụ tìm kiếm còn sử dụng kết quả từ các nguồn khác: Yahoo! Tìm kiếm BOSS, Wikipedia, Wolfram|Alpha.

Tốt hơn

DuckDuckGo tự định vị mình là một công cụ tìm kiếm cung cấp sự riêng tư và bảo mật tối đa. Hệ thống không thu thập bất kỳ dữ liệu nào về người dùng, không lưu trữ nhật ký (không có lịch sử tìm kiếm) và việc sử dụng cookie càng hạn chế càng tốt.

DuckDuckGo không thu thập hoặc chia sẻ thông tin cá nhân từ người dùng. Đây là chính sách bảo mật của chúng tôi.
Gabriel Weinberg, người sáng lập DuckDuckGo

Tại sao bạn cần cái này

Tất cả các công cụ tìm kiếm lớn đều đang cố gắng cá nhân hóa kết quả tìm kiếm dựa trên dữ liệu về người ngồi trước màn hình. Hiện tượng này được gọi là “bong bóng bộ lọc”: người dùng chỉ nhìn thấy những kết quả phù hợp với sở thích của mình hoặc hệ thống cho là như vậy.

DuckDuckGo tạo ra một bức tranh khách quan không phụ thuộc vào hành vi trước đây của bạn trên Internet và loại bỏ quảng cáo theo chủ đề khỏi Google và Yandex dựa trên các truy vấn của bạn. Với DuckDuckGo, thật dễ dàng tìm kiếm thông tin bằng tiếng nước ngoài: Google và Yandex theo mặc định ưu tiên các trang web tiếng Nga, ngay cả khi truy vấn được nhập bằng ngôn ngữ khác.

Cái này là cái gì

"" là một hệ thống siêu tìm kiếm của Nga được phát triển bởi các sinh viên tốt nghiệp Đại học quốc gia Moscow Viktor Lavrenko và Vladimir Chernyshov. Nó tìm kiếm thông qua các chỉ mục của Google, Bing, Yandex và các chỉ mục khác, đồng thời cũng có thuật toán tìm kiếm riêng.

Tốt hơn

Tìm kiếm thông qua các chỉ mục của tất cả các công cụ tìm kiếm chính cho phép bạn tạo ra các kết quả có liên quan. Ngoài ra, Nigma chia kết quả thành nhiều nhóm (cụm) theo chủ đề và mời người dùng thu hẹp trường tìm kiếm, loại bỏ những nhóm không cần thiết hoặc làm nổi bật những nhóm ưu tiên. Nhờ các học phần Toán học và Hóa học, bạn có thể giải các bài toán và yêu cầu kết quả phản ứng hóa học trực tiếp trên thanh tìm kiếm.

Tại sao bạn cần cái này

Loại bỏ nhu cầu tìm kiếm cùng một truy vấn trong các công cụ tìm kiếm khác nhau. Hệ thống cụm giúp dễ dàng thao tác kết quả tìm kiếm. Ví dụ: Nigma thu thập kết quả từ các cửa hàng trực tuyến vào một cụm riêng biệt. Nếu bạn không có ý định mua bất cứ thứ gì thì chỉ cần loại trừ nhóm này. Bằng cách chọn cụm “trang web tiếng Anh”, bạn sẽ chỉ nhận được kết quả bằng tiếng Anh. Các học phần Toán và Hóa sẽ giúp ích cho học sinh.

Thật không may, dự án hiện không được phát triển vì các nhà phát triển đã chuyển hoạt động của họ sang thị trường Việt Nam. Tuy nhiên, Nygma không những chưa lỗi thời mà còn mang lại lợi thế cho Google ở ​​một số mặt. Hãy hy vọng sự phát triển tiếp tục.

Cái này là cái gì

not Evil là một hệ thống tìm kiếm mạng Tor ẩn danh. Để sử dụng nó, bạn cần phải truy cập mạng này, chẳng hạn như bằng cách khởi chạy một trình duyệt chuyên dụng cùng tên. not Evil không phải là công cụ tìm kiếm duy nhất thuộc loại này. Có LOOK (tìm kiếm mặc định trong trình duyệt Tor, có thể truy cập từ Internet thông thường) hoặc TORCH (một trong những công cụ tìm kiếm lâu đời nhất trên mạng Tor) và các công cụ khác. Chúng tôi quyết định không chọn Ác ma vì rõ ràng ám chỉ đến chính Google (chỉ cần nhìn vào trang bắt đầu).

Tốt hơn

Nó tìm kiếm ở những nơi Google, Yandex và các công cụ tìm kiếm khác thường đóng cửa.

Tại sao bạn cần cái này

Mạng Tor chứa nhiều tài nguyên không thể tìm thấy trên Internet tuân thủ luật pháp. Và khi sự kiểm soát của chính phủ đối với nội dung Internet được thắt chặt, số lượng của họ sẽ tăng lên. Tor là một loại Mạng trong Mạng: có mạng xã hội riêng, trình theo dõi torrent, phương tiện truyền thông, nền tảng giao dịch, blog, thư viện, v.v.

YaCy

Cái này là cái gì

YaCy là một công cụ tìm kiếm phi tập trung hoạt động trên nguyên tắc mạng P2P. Mỗi máy tính được cài đặt mô-đun phần mềm chính sẽ quét Internet một cách độc lập, nghĩa là nó tương tự như một robot tìm kiếm. Các kết quả thu được sẽ được thu thập vào cơ sở dữ liệu chung được tất cả những người tham gia YaCy sử dụng.

Tốt hơn

Thật khó để nói liệu điều này tốt hơn hay tệ hơn, vì YaCy là một cách tiếp cận hoàn toàn khác để tổ chức tìm kiếm. Việc không có một máy chủ và công ty chủ sở hữu duy nhất khiến kết quả hoàn toàn độc lập với sở thích của bất kỳ ai. Quyền tự chủ của mỗi nút giúp loại bỏ sự kiểm duyệt. YaCy có khả năng tìm kiếm trên deep web và các mạng công cộng không được lập chỉ mục.

Tại sao bạn cần cái này

Nếu bạn là người ủng hộ phần mềm nguồn mở và Internet miễn phí, không bị ảnh hưởng bởi các cơ quan chính phủ và tập đoàn lớn thì YaCy là sự lựa chọn dành cho bạn. Nó cũng có thể được sử dụng để tổ chức tìm kiếm trong mạng công ty hoặc mạng tự trị khác. Và mặc dù YaCy không hữu ích lắm trong cuộc sống hàng ngày nhưng nó là một sự thay thế xứng đáng cho Google về mặt quá trình tìm kiếm.

Pipl

Cái này là cái gì

Pipl là một hệ thống được thiết kế để tìm kiếm thông tin về một người cụ thể.

Tốt hơn

Các tác giả của Pipl khẳng định rằng các thuật toán chuyên biệt của họ tìm kiếm hiệu quả hơn các công cụ tìm kiếm “thông thường”. Đặc biệt, các nguồn thông tin ưu tiên bao gồm hồ sơ mạng xã hội, bình luận, danh sách thành viên và các cơ sở dữ liệu khác nhau công bố thông tin về mọi người, chẳng hạn như các quyết định của tòa án. Sự dẫn đầu của Pipl trong lĩnh vực này được khẳng định bằng các đánh giá từ Lifehacker.com, TechCrunch và các ấn phẩm khác.

Tại sao bạn cần cái này

Nếu bạn cần tìm thông tin về một người sống ở Mỹ thì Pipl sẽ hiệu quả hơn Google rất nhiều. Cơ sở dữ liệu của các tòa án Nga dường như không thể truy cập được đối với công cụ tìm kiếm. Vì vậy, anh ta không đối phó tốt với công dân Nga.

Cái này là cái gì

Một công cụ tìm kiếm chuyên dụng khác. Tìm kiếm nhiều âm thanh khác nhau (ngôi nhà, thiên nhiên, ô tô, con người, v.v.) trong các nguồn mở. Dịch vụ này không hỗ trợ truy vấn bằng tiếng Nga, nhưng có một danh sách ấn tượng các thẻ tiếng Nga mà bạn có thể sử dụng để tìm kiếm.

Tốt hơn

Đầu ra chỉ chứa âm thanh và không có gì bổ sung. Trong cài đặt tìm kiếm, bạn có thể đặt định dạng và chất lượng âm thanh mong muốn. Tất cả âm thanh được tìm thấy đều có sẵn để tải xuống. Có một tìm kiếm âm thanh theo mẫu.

Tại sao bạn cần cái này

Nếu bạn cần nhanh chóng tìm thấy âm thanh của tiếng súng hỏa mai, tiếng thổi của chim gõ kiến ​​đang bú hoặc tiếng kêu của Homer Simpson, thì dịch vụ này là dành cho bạn. Và tôi chỉ chọn điều này từ các truy vấn tiếng Nga có sẵn. Trong tiếng Anh, phạm vi thậm chí còn rộng hơn. Nhưng nghiêm túc mà nói, một dịch vụ chuyên biệt cần có một lượng khán giả chuyên biệt. Nhưng nếu nó cũng có ích cho bạn thì sao?

Tuổi thọ của các công cụ tìm kiếm thay thế thường rất ngắn ngủi. Lifehacker đã hỏi cựu tổng giám đốc chi nhánh Yandex của Ukraine, Sergei Petrenko, về triển vọng lâu dài của những dự án như vậy.

Đối với số phận của các công cụ tìm kiếm thay thế, thật đơn giản: trở thành những dự án rất thích hợp với lượng khán giả nhỏ, do đó không có triển vọng thương mại rõ ràng hoặc ngược lại, hoàn toàn rõ ràng về sự vắng mặt của chúng.

Nếu bạn xem các ví dụ trong bài viết, bạn có thể thấy rằng các công cụ tìm kiếm như vậy chuyên về một phân khúc hẹp nhưng phổ biến, có lẽ chưa phát triển đủ để được chú ý trên radar của Google hoặc Yandex, hoặc họ đang thử nghiệm một giả thuyết ban đầu trong xếp hạng, chưa được áp dụng trong tìm kiếm thông thường.

Ví dụ: nếu một tìm kiếm trên Tor đột nhiên có nhu cầu, nghĩa là ít nhất một phần trăm khán giả của Google cần kết quả từ đó, thì tất nhiên, các công cụ tìm kiếm thông thường sẽ bắt đầu giải quyết vấn đề làm thế nào để tìm chúng và hiển thị chúng cho người dùng. Nếu hành vi của khán giả cho thấy rằng đối với một tỷ lệ đáng kể người dùng trong một số lượng truy vấn đáng kể, kết quả được đưa ra mà không tính đến các yếu tố tùy thuộc vào người dùng có vẻ phù hợp hơn, thì Yandex hoặc Google sẽ bắt đầu tạo ra những kết quả như vậy.

“Trở nên tốt hơn” trong bối cảnh của bài viết này không có nghĩa là “trở nên giỏi hơn về mọi thứ”. Đúng, về nhiều mặt, các anh hùng của chúng ta khác xa Google và Yandex (thậm chí còn xa Bing). Nhưng mỗi dịch vụ này đều mang lại cho người dùng những thứ mà những gã khổng lồ trong ngành tìm kiếm không thể cung cấp.