Lista de motoare de căutare populare în limba rusă. Motoare de căutare fără restricții: trei motoare de căutare puțin cunoscute în comparație


Până de curând, găsirea informațiilor necesare pe World Wide Web nu era atât de ușoară. Dar, datorită dezvoltării rapide și apariției noilor motoare de căutare, acest proces a devenit mult mai convenabil și mai rapid. În recenzia noastră de astăzi vă prezentăm cele mai bune 10 servicii pentru căutarea diferitelor tipuri de date care pot găsi tot ce aveți nevoie în adâncurile internetului.

1. Motor de căutare pe Internet - Bing


Bing este un celebru motor de căutare pe Internet care a fost creat în iunie 2009. Acest serviciu este disponibil în 40 de limbi. Are aproximativ 350 de milioane de vizitatori unici lunar.

2. Motor de metacăutare pe Internet - AOL Search.com


AOL Search.com este un metamotor de căutare pe Internet care a fost fondat în Statele Unite ale Americii în 1985. Numărul lunar de vizitatori ai acestui serviciu este de aproximativ 75 de milioane de persoane. Poziția de CEO este ocupată de Tim Armstrong.

3. Motor de căutare pe Internet - DuckDuckGo


DuckDuckGo este un motor de căutare pe internet open source care a fost lansat în 2008 de Gabriel Weinberg. Sediul companiei este situat în Valley Forge, Pennsylvania. Numărul de vizitatori unici care folosesc DuckDuckGo este de aproximativ 13 milioane de oameni pe lună.

4. Motor de căutare pe Internet - Ask.com


Ask.com este un sistem de căutare pe Internet, a cărui caracteristică principală este căutarea răspunsurilor la întrebări. Serviciul a fost fondat în iunie 1996 în Berkeley, California de Garrett Gruner și David Wharton. Numărul lunar de vizitatori unici la acest serviciu este de aproximativ 145 de milioane de persoane.

5. Motor de căutare pe Internet - Google


Google este cel mai faimos motor de căutare pe Internet, cu sediul în Mountain View, California, Statele Unite ale Americii. Compania a fost fondată la 4 septembrie 1998 de Larry Page și Serghei Mihailovici Brin. Numărul său lunar de vizitatori unici este de aproximativ 1.100.000.000 de persoane.

6. Sistem de metacăutare pe Internet - MyWebSearch.com


MyWebSearch.com este un motor de metacăutare pe Internet care ocupă locul 73 pe lista celor mai populare site-uri web. Are aproximativ 60 de milioane de vizitatori unici lunar.

7. Metamotor de căutare pe Internet - Infospace.com


Motorul de căutare prezentat a fost fondat în 1996. Sediul său este situat în Bellevue, Washington, Statele Unite. Numărul lunar de vizitatori unici Infospace.com este de aproximativ 24 de milioane de oameni.

8. Motor de metacăutare pe Internet - WebCrawler.com


WebCrawler.com este un motor de metacăutare pe internet alimentat de Yahoo și Google. Compania a fost fondată în aprilie 1994. Are aproximativ 65 de milioane de vizitatori unici lunar.

9. Internet metamotor de căutare - Info.com


Info.com este un metamotor de căutare cu sediul în capitala Regatului Unit, Londra. Info.com are aproximativ 13 milioane de vizitatori unici lunar.

10. Motor de căutare pe Internet – Yahoo


motor de căutare pe internet numit - Yahoo, care a fost fondată în ianuarie 1994 de Jerry Yang și David Feal. CEO-ul companiei este Marissa Mayer. Numărul său lunar de vizitatori unici este de aproximativ 300 de milioane de oameni. Sediul serviciului este situat în Santa Clara, California, Statele Unite ale Americii.

Și iubitorii de dispozitive mobile și de tehnologie informatică vor fi probabil interesați să se uite

17.12.2017 17:00:00

Este greu de imaginat internetul modern fără motoare de căutare. În fiecare zi, procesează miliarde de solicitări care vin prin browsere desktop și aplicații mobile. Cei mai complexi algoritmi prezic literalmente acțiunile utilizatorului, sugerează opțiuni posibile pentru datele de intrare și produc cele mai precise rezultate.

Dar care este cel mai bun motor de căutare care operează astăzi pe internet? De ce preferăm un anumit motor de căutare? În articolul nostru vom analiza ce motoare de căutare au câștigat cea mai mare popularitate și care sunt diferențele lor fundamentale.

Clasamentul motoarelor de căutare din lume

În primul rând, să aflăm care motoare de căutare sunt cele mai populare din lume. Pentru a face acest lucru, să ne întoarcem la datele furnizate de reputata agenție analitică NetMarketShare. Acest tabel prezintă primele 5 motoare de căutare și procentul de solicitări de la utilizatorii de computere personale pentru 2017:

Este ușor de observat că în ambele poziții motorul de căutare Google este în frunte cu cea mai largă marjă față de concurenții săi. În plus, pe dispozitivele mobile, Google deține în esență un monopol, procesând 93% din toate interogările de căutare. Acest lucru se datorează și utilizării pe scară largă a smartphone-urilor care rulează sistemul de operare Android.

În plus, Google este unul dintre cele mai minimaliste motoare de căutare. Pe pagina principală, utilizatorul vede doar un logo și o bară de căutare. Utilizatorii sunt, de asemenea, atrași de doodle-uri interesante - sigle Google care sunt redesenate în cinstea unei anumite date sau eveniment. Foarte des, astfel de doodle-uri sunt făcute interactive. Astfel, conform tuturor indicatorilor de mai sus, Google este în mod clar cel mai bun motor de căutare.

Pe locul doi în popularitate, atât pe computere, cât și pe smartphone-uri, se află motorul de căutare chinez Baidu. Cert este că acest serviciu este singurul disponibil în China - este folosit de 92% din întreaga populație. Din când în când, Baidu încearcă să-și extindă granițele geografice, dar nu a câștigat niciodată popularitate în alte țări. Acest lucru se datorează în mare parte unei politici de promovare destul de agresive și unui conflict între extensiile pentru motoarele de căutare și software-ul antivirus.


Bing este un motor de căutare de la Microsoft care este cel mai des folosit de proprietarii de computere din Statele Unite. Procentul mic de solicitări de la dispozitivele mobile se datorează faptului că smartphone-urile Microsoft părăsesc treptat de pe piață.


Yahoo! este unul dintre cele mai vechi motoare de căutare, care a fost creat în 1995. Este folosit în principal de rezidenții din SUA, Marea Britanie și unele țări din Asia de Sud-Est.

Motorul de căutare de la Yandex a fost doar în primele cinci pentru interogări de pe un computer. Un mic procent din numărul total de solicitări se datorează și faptului că motorul de căutare intern este utilizat de utilizatorii din Rusia și țările CSI. Iar serviciul Dogpile închide top 5 în ceea ce privește popularitatea motoarelor de căutare pentru dispozitive mobile. Publicul său principal este rezidenții din SUA, Canada și Europa.

Clasamentul motoarelor de căutare în Rusia

Datele de la contorul LiveInternet și serviciul analitic Seo-auditor ne vor ajuta să aflăm care este cel mai bun motor de căutare din segmentul de internet rus al Runetului.

Contorul LiveInternet ia în considerare interogările de căutare atât de pe computer, cât și de pe platformele mobile. Ca rezultat, ratingul de popularitate al motoarelor de căutare din Rusia arată astfel:


Cei doi concurenți principali, Google și Yandex, sunt în frunte cu o marjă largă. Ambele motoare de căutare se caracterizează prin viteză mare și eficiență. În plus, fiecare serviciu are propriile sale caracteristici unice. De exemplu, motorul de căutare Google oferă informații clare și concise despre fiecare site și ia în considerare și calitatea paginilor din rezultate. Yandex acordă o mare atenție serviciilor sale suplimentare, care sunt conectate cu fiecare cerere din motorul de căutare.

Pe locul trei în popularitate a fost motorul de căutare de la Mail.ru. Mulți experți notează că acest serviciu are algoritmi de căutare bine dezvoltați și actualizări rapide de știri pe pagina principală. Pe de altă parte, Mail are o mulțime de deficiențe. În primul rând, aceasta este o lipsă de servicii suplimentare și un filtru anti-spam neterminat.

Odinioară popularul Rambler procesează acum doar 0,2% din numărul total de interogări de căutare pe RuNet. În urmă cu ceva timp, serviciul a suferit o revizuire majoră: motorul de căutare și-a schimbat logo-ul și pagina principală a fost redesenată de la zero. Cu toate acestea, acest lucru, din păcate, nu a ajutat la creșterea în clasamentul motoarelor de căutare.


Cu toate acestea, Rambler are avantajele sale evidente. De exemplu, un sistem de căutare asociativă. Dacă utilizatorul uită să schimbe aspectul și să scrie cuvântul vepsrf, motorul de căutare returnează rezultate pentru interogarea „Muzică”. Acum acest sistem nu va surprinde pe nimeni, dar Rambler a fost primul motor de căutare de pe RuNet care a fost capabil să implementeze un astfel de algoritm într-o manieră de înaltă calitate.

Motorul de căutare Bing a procesat mai puțin de 200 de mii de solicitări pe an. După cum am menționat mai sus, serviciul de la Microsoft este popular în principal în Occident și, cel mai probabil, majoritatea solicitărilor de pe RuNet prin Bing sunt trimise de pe smartphone-uri și PC-uri ale străinilor care lucrează în Rusia.

Date similare despre popularitatea motoarelor de căutare pot fi observate într-un studiu al agenției de analiză Seo-auditor. Comparați cifrele pentru ianuarie și noiembrie 2017:

După ce au comparat datele de la contoarele Yandex.Metrica, SpyLog/Openstat, LiveInternet, Hotlog, [email protected], precum și folosind algoritmi originali, specialiștii în auditori SEO au ajuns la concluzia că titlul de „Cel mai bun motor de căutare” în RuNet este din nou împărtășit între ei Google și Yandex. În plus, se observă modul în care ponderea solicitărilor prin motoarele de căutare Mail, Rambler și Bing a scăzut de-a lungul anului.

Aplicații pentru motoarele de căutare mobile

Printre primele cinci cele mai populare motoare de căutare, Google, Yandex și Bing au aplicații mobile de marcă. Pentru a afla cum diferă fiecare utilitar, am testat motoarele de căutare pe un smartphone puternic și productiv. Ca cerere de testare, am folosit unul dintre cele mai populare, în acest moment, nu numai în Rusia, ci în întreaga lume - Star Wars 8. Rezultatul poate fi văzut în videoclipul de mai jos:

Google în motorul său de căutare mobil este ghidat de același principiu ca și în versiunea desktop - un minim de elemente de interfață. Interogarea de căutare poate fi introdusă fie de la tastatura de pe ecran, fie prin voce. În rezultatele motorului de căutare, puteți urmări o ierarhie clară:

  • Recenzii și evaluări ale filmului
  • Programe în cinematografele din oraș
  • Trailere pe YouTube
  • Lista actorilor de film
  • Interogări înrudite
  • Link-uri către site-uri.

O imagine similară poate fi văzută în motorul de căutare Yandex. Serviciul rusesc copiază și versiunea principală în aplicația sa. Pagina principală conține servicii și știri utile, iar bara de căutare este fixată în partea de jos a ecranului. Rezultatele sunt distribuite după cum urmează:

  • Trailere și videoclipuri pe Yandex.Video
  • Orele spectacolelor de cinema
  • Link către Wikipedia
  • Lista actorilor
  • Interogări înrudite
  • Link-uri către site (și primul link este pagina filmului de pe Kinopoisk, care aparține Yandex).

O caracteristică separată a Yandex este asistentul vocal Alice, cu care nu numai că puteți găsi informațiile de care aveți nevoie, ci și să petreceți timpul într-o conversație plăcută și uneori amuzantă cu un algoritm digital.


Aplicația Bing, ca și Google, urmează calea conciziei. Ecranul principal are un buton de căutare pe un fundal frumos. Făcând clic pe lupă, utilizatorul este dus la pagina motorului de căutare. În ciuda faptului că interfața nu este rusificată, aplicația produce rapid rezultatele dorite. Adevărat, spre deosebire de Google și Yandex, Bing se limitează doar la link-uri către site-uri fără servicii suplimentare incluse.

Motoare de căutare alternative

Pe lângă cele mai populare motoare de căutare precum Yandex și Google, există multe servicii de căutare interesante pe Internet care, în ceea ce privește funcțiile lor, pot fi o alternativă bună la giganții recunoscuți. Am selectat 5 dintre cele mai interesante sisteme care pot fi folosite atât pe PC-uri, cât și pe smartphone-uri.


Un motor de căutare care se bazează pe trei principii principale:

  • Fără stocare de date personale
  • Fără publicitate intruzivă bazată pe solicitările utilizatorilor
  • Lipsa de urmărire a acțiunilor utilizatorului.

Astfel, DuckDuckGo va fi apreciat de cei care preferă confidențialitatea pe Internet și doresc să primească informații obiective, fără a ține cont de comportamentul trecut de căutare pe Internet. În plus, DuckDuckGo nu este legat din punct de vedere geografic de utilizator. Aceasta înseamnă că informațiile pot fi căutate și primite în orice limbă, în timp ce Yandex și Google acordă preferință resurselor în limba rusă, chiar dacă introduceți o interogare în engleză.

YaCy

Un motor de căutare descentralizat care nu are un singur server și proprietar. YaCy este o rețea de computere de utilizator pe care este instalat un program special. Fiecare PC scanează în mod independent rețeaua și colectează informațiile primite într-o bază de date comună. Fiecare nod din rețeaua YaCy este autonom și, prin urmare, nu este supus cenzurii guvernamentale sau corporative.

Singurul dezavantaj pentru utilizatorii casnici este că YaCy nu este rusificat.

Pipl


Pipl este un sistem conceput pentru a căuta anumiți utilizatori pe Internet. Algoritmi complecși colectează toate datele despre o persoană din profilurile rețelelor sociale, comentarii, baze de date deschise și așa mai departe. În acest moment, baza de date de căutare Pipl conține date despre mai mult de 3 miliarde de oameni.

Căutarea în RuNet pentru Pipl este încă o sarcină destul de dificilă. Deci acest motor de căutare va fi mai util celor care caută anumiți utilizatori în Europa, SUA sau Canada.

Sistem de răspunsuri la întrebări, motor de căutare bazat pe o bază de cunoștințe și un set de algoritmi de calcul. Spre deosebire de alte motoare de căutare, Wolfram|Alpha nu afișează o listă de link-uri pentru interogări, ci generează un răspuns complet bazat pe o bază de cunoștințe despre istorie, cultură, știință, cinema, teatru și multe altele. În plus, algoritmul conectează date despre oameni celebri și pagini de pe Internet.

De exemplu, atunci când se solicită filmele Star Wars, motorul de căutare returnează o listă cu toate filmele din universul cinematografic, pentru fiecare dintre ele puteți vizualiza câte o fișă informativă individuală. Mai jos este o selecție de afișe de film și informații detaliate despre încasările de box office în cinematografe.

Wolfram|Alpha își actualizează constant baza de date pentru a afișa cu mai multă acuratețe cele mai relevante informații pentru interogări. Pentru studenți, jurnaliști, analiști și cercetători, Wolfram|Alpha este poate cel mai bun motor de căutare, deoarece oferă nu numai informații text, ci și compilează diverse grafice, tabele și diagrame pentru o mai mare claritate.

V-am prezentat cele mai populare motoare de căutare. Desigur, este destul de dificil să numești un anumit motor de căutare cel mai bun din lume. Fiecare sistem are propriul set de instrumente care atrag anumiți utilizatori. Ce motor de căutare folosești cel mai des? Povestește-ne despre impresiile tale în comentariile acestui articol!

Un motor de căutare este o bază de date cu informații specifice de pe Internet. Mulți utilizatori cred că, de îndată ce introduc o interogare într-un motor de căutare, întregul Internet este imediat accesat cu crawlere, dar acest lucru nu este deloc adevărat. Internetul este scanat constant, de multe programe, datele despre site-uri sunt introduse într-o bază de date, unde, după anumite criterii, toate site-urile și toate paginile lor sunt distribuite în diverse tipuri de liste și baze de date. Adică este un fel de dulap de fișiere de date, iar căutarea are loc nu pe Internet, ci pe acest dulap de fișiere.

Google este cel mai popular motor de căutare din lume.

Pe lângă motorul de căutare, Google oferă multe servicii suplimentare, programe și hardware, inclusiv un serviciu de e-mail, browser Google Chrome, cea mai mare bibliotecă video YouTube și multe alte proiecte. Google cumpără cu încredere multe proiecte care aduc profituri mari. Majoritatea serviciilor nu sunt destinate utilizatorului direct, ci spre a face bani pe Internet și sunt integrate cu accent pe interesele utilizatorilor europeni și americani.

Mail este un motor de căutare care este popular în principal datorită serviciului său de e-mail.

Există multe servicii suplimentare, a căror cheie este Mail, în acest moment compania Mail deține rețeaua socială Odnoklassniki, propria rețea „My World”, serviciul Money-mail, multe jocuri online, trei browsere aproape identice cu nume diferite. . Toate aplicațiile și serviciile conțin o mulțime de conținut publicitar. Rețeaua de socializare VKonatkte blochează tranzițiile directe către serviciile de e-mail, justificându-le cu un număr mare de viruși.

Wikipedia.

Wikipedia este un sistem de referință de căutare.

Motorul de căutare non-profit, care funcționează cu donații private, nu își umple, așadar, paginile cu publicitate. Un proiect multilingv al cărui scop este de a crea o enciclopedie de referință completă în toate limbile lumii. Nu are autori anumiți și este populat și condus de voluntari din toată lumea. Fiecare utilizator poate să scrie și să editeze un articol.

Pagina oficială - www.wikipedia.org.

Youtube este cea mai mare bibliotecă de fișiere video.

Găzduire video cu elemente ale unei rețele sociale, unde fiecare utilizator poate adăuga un videoclip. De la achiziționarea lor de către Google Ink, nu este necesară înregistrarea separată pentru YouTube, trebuie doar să vă înregistrați în serviciul de e-mail Google.

Pagina oficială - youtube.com.

Yahoo! este al doilea cel mai important motor de căutare din lume.

Există servicii suplimentare, dintre care cel mai faimos este Yahoo mail. Ca parte a îmbunătățirii calității motorului de căutare, Yahoo transferă date despre utilizatori și interogările acestora către Microsoft. Din aceste date, se formează o idee despre interesele utilizatorilor și se formează o piață pentru conținut publicitar. Motorul de căutare Yahoo, precum , este implicat în achiziția altor companii, de exemplu, Yahoo deține serviciul de căutare Altavista și site-ul de comerț electronic Alibaba.

Pagina oficială - www.yahoo.com.

WDL este o bibliotecă digitală.

Biblioteca colectează cărți care oferă valoare culturală în formă digitală. Scopul principal este de a crește nivelul de conținut cultural al internetului. Accesul la bibliotecă este gratuit.

Pagina oficială - www.wdl.org/ru/.

Bing este un motor de căutare de la Microsoft.

Pagina oficială - www.baidu.com.

Motoare de căutare în Rusia

Rambler este un motor de căutare „pro-american”.

Inițial a fost creat ca un portal media de internet. La fel ca multe alte motoare de căutare, are servicii de căutare pentru imagini, fișiere video, hărți, prognoze meteo, o secțiune de știri și multe altele. Editorii oferă, de asemenea, un browser gratuit, Rambler-Nichrome.

Pagina oficială - www.rambler.ru.

Nigma este un motor de căutare inteligent.

Un motor de căutare mai convenabil datorită prezenței multor filtre și setări. Interfața vă permite să includeți sau să excludeți valori similare sugerate în căutare pentru a obține rezultate mai bune. De asemenea, atunci când primiți un rezultat de căutare, vă permite să utilizați informații de la alte motoare de căutare majore.

Pagina oficială - www.nigma.ru.

Aport - catalog de produse online.

În trecut, un motor de căutare, dar după ce dezvoltarea și inovarea au fost oprite, a pierdut rapid teren și . În prezent, Aport este o platformă de tranzacționare în care sunt prezentate produsele a peste 1.500 de companii.

Pagina oficială - www.aport.ru.

Sputnik este un motor național de căutare și un portal de internet.

Creat de Rostelecom. Momentan in faza de testare.

Pagina oficială - www.sputnik.ru.

Metabot este un motor de căutare în creștere.

Sarcinile Metabot sunt de a crea un motor de căutare pentru toate celelalte motoare de căutare, creând poziții de rezultate ținând cont de datele din întreaga listă de motoare de căutare. Adică este un motor de căutare pentru motoarele de căutare.

Pagina oficială - www.metabot.ru.

Motorul de căutare a fost suspendat.

Pagina oficială - www.turtle.ru.

KM este un multiportal.

Inițial, site-ul a fost un multiportal cu introducerea ulterioară a unui motor de căutare. Căutarea poate fi efectuată atât în ​​cadrul site-ului, cât și pe toate site-urile RuNet monitorizate.

Pagina oficială - www.km.ru.

Gogo - nu funcționează, redirecționează către un motor de căutare.

Pagina oficială - www.gogo.ru.

Multiportalul rusesc, nu foarte popular, necesită îmbunătățiri. Motorul de căutare include știri, televiziune, jocuri și o hartă.

Pagina oficială - www.zoneru.org.

Motorul de căutare nu funcționează, dezvoltatorii sugerează utilizarea motorului de căutare.

Ele au devenit de multă vreme o parte integrantă a internetului rusesc. Motoarele de căutare sunt acum mecanisme uriașe și complexe care reprezintă nu doar un instrument de căutare a informațiilor, ci și zone tentante pentru afaceri.

Majoritatea utilizatorilor motoarelor de căutare nu s-au gândit niciodată (sau s-au gândit la asta, dar nu au găsit un răspuns) la principiul de funcționare a motoarelor de căutare, schema de procesare a cererilor utilizatorilor, în ce constau aceste sisteme și cum funcționează...

Această clasă de master este concepută pentru a răspunde la întrebarea cum funcționează motoarele de căutare. Totuși, nu veți găsi aici factori care influențează clasarea documentelor. Mai mult, nu ar trebui să contați pe o explicație detaliată a algoritmului Yandex. El, potrivit lui Ilya Segalovici, directorul tehnologiei și dezvoltării motorului de căutare Yandex, poate fi recunoscut „sub tortură” doar de Ilya Segalovici însuși...

2. Conceptul și funcțiile unui motor de căutare

Un sistem de căutare este un complex software și hardware conceput să caute pe internet și să răspundă la o solicitare a utilizatorului, specificată sub forma unei fraze text (interogare de căutare), prin producerea unei liste de legături către surse de informații, în ordinea relevanței ( conform cererii). Cele mai mari motoare de căutare internaționale: "Google", Yahoo , MSN . Pe internetul rusesc, acestea sunt Yandex, Rambler, Aport.

Să aruncăm o privire mai atentă asupra conceptului de interogare de căutare folosind motorul de căutare Yandex ca exemplu. Interogarea de căutare ar trebui să fie formulată de utilizator în conformitate cu ceea ce dorește să găsească, cât mai scurt și simplu posibil. Să presupunem că vrem să găsim informații în Yandex despre cum să alegem o mașină. Pentru a face acest lucru, deschideți pagina principală Yandex și introduceți textul interogării de căutare „cum să alegeți o mașină”. În continuare, sarcina noastră se rezumă la deschiderea legăturilor furnizate la cererea noastră către sursele de informații de pe Internet. Cu toate acestea, este foarte posibil să nu găsim informațiile de care avem nevoie. Dacă se întâmplă acest lucru, atunci fie trebuie să reformulați cererea, fie baza de date a motorului de căutare într-adevăr nu are nicio informație relevantă cu privire la solicitarea noastră (acest lucru se poate întâmpla atunci când solicitați interogări foarte „înguste”, cum ar fi, de exemplu, „cum să alegeți o mașină în Arhangelsk”)

Scopul principal al oricărui motor de căutare este de a oferi oamenilor exact informațiile pe care le caută. Și învățați utilizatorii să facă cereri „corecte” către sistem, de exemplu. interogările care respectă principiile de funcționare ale motoarelor de căutare sunt imposibile. Prin urmare, dezvoltatorii creează algoritmi și principii de funcționare pentru motoarele de căutare care ar permite utilizatorilor să găsească informațiile pe care le caută.

Aceasta înseamnă că motorul de căutare trebuie să „gândească” la fel cum gândește utilizatorul atunci când caută informații. Când un utilizator face o solicitare către un motor de căutare, el dorește să găsească ceea ce are nevoie cât mai repede și ușor posibil. Primind rezultatul, evaluează performanța sistemului, ghidat de mai mulți parametri de bază. A găsit ceea ce căuta? Dacă nu l-a găsit, de câte ori a trebuit să reformuleze interogarea pentru a găsi ceea ce căuta? Câte informații relevante ar putea găsi? Cât de repede a procesat motorul de căutare cererea? Cât de convenabil au fost prezentate rezultatele căutării? Rezultatul pe care îl căutați a fost primul sau al sutelea? Cât gunoi inutile a fost găsit împreună cu informații utile? Informațiile necesare vor fi găsite la accesarea unui motor de căutare, să zicem, într-o săptămână, sau într-o lună?

Pentru a satisface toate aceste întrebări cu răspunsuri, dezvoltatorii de motoare de căutare îmbunătățesc constant algoritmii și principiile de căutare, adăugând noi funcții și capabilități și încearcă în toate modurile posibile să accelereze funcționarea sistemului.

3. Principalele caracteristici ale unui motor de căutare

Să descriem principalele caracteristici ale motoarelor de căutare:

  • Completitudine

    Completitudinea este una dintre principalele caracteristici ale unui sistem de căutare, care este raportul dintre numărul de documente găsite prin cerere și numărul total de documente de pe Internet care satisfac cererea dată. De exemplu, dacă există 100 de pagini pe Internet care conțin expresia „cum să alegi o mașină” și doar 60 dintre ele au fost găsite pentru interogarea corespunzătoare, atunci caracterul complet al căutării va fi de 0,6. Evident, cu cât căutarea este mai completă, cu atât este mai puțin probabil ca utilizatorul să nu găsească documentul de care are nevoie, cu condiția ca acesta să existe deloc pe Internet.

  • Precizie

    Precizia este o altă caracteristică principală a unui motor de căutare, care este determinată de gradul în care documentele găsite se potrivesc cu interogarea utilizatorului. De exemplu, dacă interogarea „cum să alegi o mașină” conține 100 de documente, 50 dintre ele conțin expresia „cum să alegi o mașină”, iar restul conțin pur și simplu aceste cuvinte („cum să alegi radioul potrivit și să-l instalezi în o mașină”), atunci precizia căutării este considerată egală cu 50/100 (=0,5). Cu cât căutarea este mai precisă, cu atât utilizatorul va găsi mai repede documentele de care are nevoie, cu atât mai puține tipuri de „gunoi” vor fi găsite printre acestea, cu atât mai rar documentele găsite nu vor corespunde cererii.

  • Relevanţă

    Relevanța este o componentă la fel de importantă a căutării, care se caracterizează prin timpul care trece din momentul în care documentele sunt publicate pe Internet și până când sunt introduse în baza de date a indexului motorului de căutare. De exemplu, a doua zi după ce au apărut știri interesante, un număr mare de utilizatori au apelat la motoarele de căutare cu interogări relevante. Obiectiv, a trecut mai puțin de o zi de la publicarea informațiilor de știri pe această temă, dar principalele documente au fost deja indexate și disponibile pentru căutare, datorită existenței așa-numitei „baze de date rapide” a marilor motoare de căutare, care este actualizat de mai multe ori pe zi.

  • Viteza de căutare

    Viteza de căutare este strâns legată de rezistența la sarcină. De exemplu, conform Rambler Internet Holding LLC, astăzi, în timpul programului de lucru, motorul de căutare Rambler primește aproximativ 60 de solicitări pe secundă. Un astfel de volum de muncă necesită reducerea timpului de procesare a unei cereri individuale. Aici coincid interesele utilizatorului și ale motorului de căutare: vizitatorul dorește să obțină rezultate cât mai repede, iar motorul de căutare trebuie să proceseze solicitarea cât mai repede posibil, pentru a nu încetini calculul interogărilor ulterioare.

  • Vizibilitate

4. Scurt istoric al dezvoltării motoarelor de căutare

În perioada inițială a dezvoltării Internetului, numărul utilizatorilor săi a fost mic, iar cantitatea de informații disponibile a fost relativ mică. În cea mai mare parte, doar personalul de cercetare avea acces la internet. În acest moment, sarcina de a căuta informații pe internet nu era la fel de urgentă ca acum.

Una dintre primele modalități de organizare a accesului la resursele informaționale din rețea a fost crearea de directoare deschise de site-uri, link-uri către resurse în care au fost grupate în funcție de subiecte. Primul astfel de proiect a fost site-ul Yahoo.com, care a fost deschis în primăvara anului 1994. După ce numărul de site-uri din catalog a crescut semnificativ, a fost adăugată posibilitatea de a căuta informațiile necesare în catalog. În sensul deplin, nu era încă un motor de căutare, întrucât zona de căutare era limitată doar la resursele prezente în catalog, și nu la toate resursele de pe Internet.

Directoarele de link-uri au fost utilizate pe scară largă în trecut, dar și-au pierdut aproape complet popularitatea în prezent. Deoarece chiar și cataloagele moderne, uriașe ca volum, conțin informații doar despre o parte neglijabilă a Internetului. Cel mai mare director al rețelei DMOZ (numit și Proiectul Open Directory) conține informații despre 5 milioane de resurse, în timp ce baza de date a motorului de căutare Google este formată din peste 8 miliarde de documente.

În 1995, au apărut motoarele de căutare Lycos și AltaVista. Acesta din urmă este lider în domeniul căutării de informații pe Internet de mulți ani.

În 1997, Sergey Brin și Larry Page au creat motorul de căutare Google ca parte a unui proiect de cercetare la Universitatea Stanford. Google este în prezent cel mai popular motor de căutare din lume!

În septembrie 1997, motorul de căutare Yandex, care este cel mai popular de pe internetul în limba rusă, a fost anunțat oficial.

În prezent, există trei motoare de căutare principale (internaționale) - Google, Yahoo și, care au propriile baze de date și algoritmi de căutare. Majoritatea celorlalte motoare de căutare (dintre care există un număr mare) folosesc într-o formă sau alta rezultatele celor trei enumerate. De exemplu, căutarea AOL (search.aol.com) utilizează baza de date Google, în timp ce AltaVista, Lycos și AllTheWeb folosesc baza de date Yahoo.

5. Componența și principiile de funcționare ale sistemului de căutare

În Rusia, principalul motor de căutare este Yandex, urmat de Rambler.ru, Google.ru, Aport.ru, Mail.ru. Mai mult, în acest moment, Mail.ru utilizează motorul de căutare și baza de date Yandex.

Aproape toate motoarele de căutare majore au propria lor structură, diferită de celelalte. Cu toate acestea, este posibil să se identifice principalele componente comune tuturor motoarelor de căutare. Diferențele de structură pot fi doar sub forma implementării mecanismelor de interacțiune a acestor componente.

Modul de indexare

Modulul de indexare este format din trei programe auxiliare (roboți):

Spider este un program conceput pentru a descărca pagini web. Păianjenul descarcă pagina și preia toate linkurile interne de pe pagina respectivă. Codul html al fiecărei pagini este descărcat. Roboții folosesc protocoale HTTP pentru a descărca pagini. Păianjenul funcționează după cum urmează. Robotul trimite cererea „get/path/document” și alte comenzi de solicitare HTTP către server. Ca răspuns, robotul primește un flux de text care conține informații de serviciu și documentul în sine.

  • Adresa URL a paginii
  • data la care pagina a fost descărcată
  • Antetul http de răspuns al serverului
  • corpul paginii (cod html)

Crawler („călător”) este un program care urmărește automat toate linkurile găsite pe pagină. Selectează toate linkurile prezente pe pagină. Sarcina sa este de a determina unde ar trebui să meargă păianjenul, pe baza unor link-uri sau a unei liste predeterminate de adrese. Crawler, urmând linkurile găsite, caută documente noi care sunt încă necunoscute motorului de căutare.

Indexer (robot indexer) este un program care analizează paginile web descărcate de păianjeni. Indexatorul parsează pagina în părțile sale componente și le analizează folosind proprii algoritmi lexicali și morfologici. Sunt analizate diferite elemente ale paginii, cum ar fi text, titluri, link-uri, caracteristici structurale și de stil, etichete HTML pentru servicii speciale etc.

Astfel, modulul de indexare vă permite să accesați cu crawlere un anumit set de resurse folosind link-uri, să descărcați pagini întâlnite, să extrageți link-uri către pagini noi din documentele primite și să efectuați o analiză completă a acestor documente.

Bază de date

O bază de date, sau index al motorului de căutare, este un sistem de stocare a datelor, o matrice de informații în care sunt stocați parametrii special convertiți ai tuturor documentelor descărcate și procesate de modulul de indexare.

Server de căutare

Serverul de căutare este cel mai important element al întregului sistem, deoarece calitatea și viteza căutării depind direct de algoritmii care stau la baza funcționării acestuia.

Serverul de căutare funcționează după cum urmează:

  • Solicitarea primită de la utilizator este supusă analizei morfologice. Se generează mediul informațional al fiecărui document conținut în baza de date (care va fi afișat ulterior în formular, adică informații text corespunzătoare solicitării din pagina cu rezultatele căutării).
  • Datele primite sunt transmise ca parametri de intrare la un modul special de clasare. Datele sunt prelucrate pentru toate documentele, drept urmare fiecare document are propriul rating care caracterizează relevanța interogării introduse de utilizator și diferitele componente ale acestui document stocate în indexul motorului de căutare.
  • În funcție de alegerea utilizatorului, această evaluare poate fi ajustată prin condiții suplimentare (de exemplu, așa-numita „căutare avansată”).
  • În continuare, se generează un fragment, adică pentru fiecare document găsit, titlul, un scurt rezumat care se potrivește cel mai bine interogării și un link către documentul în sine sunt extrase din tabelul de documente, iar cuvintele găsite sunt evidențiate.
  • Rezultatele căutării rezultate sunt transmise utilizatorului sub forma unei SERP (Search Engine Result Page) – o pagină cu rezultatele căutării.

După cum puteți vedea, toate aceste componente sunt strâns legate între ele și funcționează în interacțiune, formând un mecanism clar, destul de complex pentru funcționarea sistemului de căutare, care necesită cantități uriașe de resurse.

6. Concluzie

Acum să rezumam toate cele de mai sus.

  • Scopul principal al oricărui motor de căutare este de a oferi oamenilor exact informațiile pe care le caută.
  • Principalele caracteristici ale motoarelor de căutare:
    1. Completitudine
    2. Precizie
    3. Relevanţă
    4. Viteza de căutare
    5. Vizibilitate
  • Primul motor de căutare cu drepturi depline a fost proiectul WebCrawler, publicat în 1994.
  • Sistemul de căutare include următoarele componente:
    1. Modul de indexare
    2. Bază de date
    3. Server de căutare

Sperăm că clasa noastră de master vă va permite să vă familiarizați mai bine cu conceptul de motor de căutare și să înțelegeți mai bine principalele funcții, caracteristici și principii de funcționare ale motoarelor de căutare.

Cel mai popular serviciu web al timpului nostru este motorul de căutare. Totul este de înțeles aici, pentru că vremurile în care reprezentanții primilor internauți puteau observa produse noi pe Internet au trecut de mult.

Apar și se acumulează atât de multe informații încât a devenit foarte greu pentru o persoană să găsească exact ceea ce are nevoie. Imaginați-vă cum ar fi să căutați pe Internet dacă utilizatorul obișnuit ar trebui să caute informații de la Dumnezeu știe unde. Pur și simplu nu înțeleg unde, pentru că nu veți găsi multe informații cu o căutare manuală.

Motor de căutare, ce este?

Este bine dacă utilizatorul cunoaște deja site-uri care pot avea informațiile necesare, dar ce să facă altfel? Pentru a ușura viața unei persoane în găsirea informațiilor necesare pe Internet, au fost inventate motoarele de căutare sau pur și simplu motoarele de căutare. Motorul de căutare îndeplinește o funcție foarte importantă, fără de care Internetul nu ar fi la fel cum suntem obișnuiți să-l vedem - aceasta este căutarea de informații pe Internet.

Sistem de căutare- acesta este un site web special sau cu alte cuvinte un site care oferă utilizatorilor, la cererea acestora, hyperlinkuri către pagini ale site-urilor care răspund la o anumită interogare de căutare.

Ca să fiu puțin mai precis, este o căutare de informații pe Internet, realizată datorită unui set funcțional software și hardware și a unei interfețe web pentru interacțiunea cu utilizatorii.

Pentru interacțiunea umană cu motorul de căutare, a fost creată o interfață web, adică un shell vizibil și ușor de înțeles. Această abordare a dezvoltatorilor de motoare de căutare face căutarea mai ușoară pentru mulți oameni. De regulă, căutările sunt efectuate folosind motoarele de căutare pe Internet, dar există și sisteme de căutare pentru servere FTP, anumite tipuri de bunuri pe World Wide Web sau informații de știri sau alte direcții de căutare.

Căutarea poate fi efectuată nu numai prin conținutul text al site-urilor, ci și prin alte tipuri de informații pe care o persoană le poate căuta: imagini, videoclipuri, fișiere de sunet etc.

Cum caută un motor de căutare?

Căutarea pe Internet în sine, la fel ca și navigarea pe site-uri web, este posibilă folosind un browser de internet. Numai după ce utilizatorul și-a specificat interogarea în bara de căutare, căutarea în sine este efectuată direct.

Orice sistem de căutare conține o parte software pe care se bazează întregul mecanism de căutare; se numește motor de căutare - acesta este un pachet software care oferă posibilitatea de a căuta informații. După ce contactează un motor de căutare, o persoană generează o interogare de căutare și o introduce în bara de căutare, motorul de căutare generează o pagină cu o listă de rezultate ale căutării, cele mai relevante, în opinia motorului de căutare, sunt situate mai sus.

Relevanța căutării - căutarea celor mai relevante materiale la solicitarea utilizatorului și plasarea de hyperlinkuri pe acestea în pagina cu rezultatele căutării cu rezultate mai precise deasupra altora. Distribuția în sine a rezultatelor se numește clasarea site-ului.

Deci, cum își pregătește un motor de căutare materialele pentru publicare și cum caută însuși motorul de căutare informații? Colectarea informațiilor în rețea este facilitată de un robot sau bot unic pentru fiecare motor de căutare, care are și o serie de alte sinonime, cum ar fi crawler sau spider, iar activitatea sistemului de căutare în sine poate fi împărțită în trei etape:

Prima etapă a funcționării unui motor de căutare include scanarea site-urilor din rețeaua globală și colectarea de copii ale paginilor web pe propriile servere. Acest lucru creează o cantitate imensă de informații care nu au fost încă procesate și nu sunt potrivite pentru rezultatele căutării.

A doua etapă a muncii motorului de căutare se rezumă la punerea în ordine a informațiilor primite anterior, în prima etapă, de pe site-uri. Sortarea este realizată în așa fel încât în ​​cel mai mic timp să fie favorabilă căutării de foarte înaltă calitate pe care utilizatorii se așteaptă de fapt de la un motor de căutare. Etapa se numește indexare, ceea ce înseamnă că paginile sunt deja pregătite pentru emitere, iar baza de date actuală va fi considerată un index.

Este tocmai a treia etapă care determină rezultatele căutării, după primirea unei cereri de la clientul său, pe baza cuvintelor cheie sau a cuvintelor cheie apropiate specificate în cerere. Acest lucru facilitează selectarea informațiilor cele mai relevante pentru cerere și livrarea ulterioară a acesteia. Întrucât există multe, multe informații, motorul de căutare realizează clasament în conformitate cu algoritmii săi.
Cel mai bun motor de căutare este considerat a fi cel care poate furniza materialul care răspunde cel mai corect solicitării utilizatorului. Dar și aici pot exista rezultate care au fost influențate de persoane interesate să-și promoveze site-ul; astfel de site-uri, deși nu întotdeauna, apar adesea în rezultatele căutării, dar nu pentru mult timp.

Deși lideri mondiali au fost deja identificați în multe regiuni, motoarele de căutare continuă să-și dezvolte căutarea de înaltă calitate. Cu cât o pot oferi o căutare mai bună, cu atât mai mulți oameni o vor folosi.

Cum se utilizează motorul de căutare?

Ce este un motor de căutare și cum funcționează este deja clar, dar cum să-l folosești corect? Majoritatea site-urilor au întotdeauna o bară de căutare, iar lângă ea există un buton Găsiți sau Căutați. O interogare este introdusă în linia de căutare, după care trebuie să apăsați butonul de căutare sau, așa cum se întâmplă mai des, apăsați tasta Enter de pe tastatură și în câteva secunde primiți rezultatul interogării în formular a unei liste.

Dar nu este întotdeauna posibil să obțineți răspunsul corect la o interogare de căutare prima dată. Pentru a vă asigura că căutarea a ceea ce doriți nu devine dureroasă, trebuie să compuneți corect interogarea de căutare și să urmați recomandările descrise mai jos.

Compunem corect interogarea de căutare

Următoarele vor oferi sfaturi pentru utilizarea motorului de căutare. Respectarea unor trucuri și reguli atunci când căutați informații într-un motor de căutare va face posibilă obținerea rezultatului dorit mult mai rapid. Urmați aceste instrucțiuni:

  1. Ortografia corectă a cuvintelor asigură numărul maxim de potriviri cu obiectul informațional dorit (Deși motoarele de căutare moderne au învățat deja să corecteze greșelile de ortografie, acest sfat nu trebuie neglijat).
  2. Folosind sinonime în interogarea dvs., puteți acoperi o gamă mai largă de căutare.
  3. Uneori, schimbarea unui cuvânt din textul interogării poate aduce rezultate mai bune; reformatați interogarea.
  4. Aduceți specificitate interogării dvs., utilizați aparițiile exacte ale expresiilor care ar trebui să definească esența principală a căutării.
  5. Experimentați cu cuvinte cheie. Folosirea cuvintelor cheie și a expresiilor poate ajuta la identificarea punctului principal, iar motorul de căutare va returna rezultate mai relevante.

Deci, ceea ce este un motor de căutare nu este altceva decât o oportunitate de a găsi informații de interes și de a le folosi, de obicei, complet gratuit, de a învăța ceva, de a înțelege ceva sau de a trage concluzia corectă pentru tine. Mulți oameni nu își mai pot imagina viața fără căutare vocală, în care nu este nevoie să tastați text, trebuie doar să spuneți cererea dvs., iar dispozitivul de introducere a informațiilor de aici este un microfon. Toate acestea indică dezvoltarea constantă a tehnologiilor de căutare pe Internet și necesitatea acestora.