Motoare de căutare fără cenzură și restricții. Cheat sheet pentru sistemele de căutare anonime

Există doi lideri mari și cunoscuți în lumea căutărilor private: Yauba și Ixquick. Să începem revizuirea prin a arunca o privire mai atentă la acești doi lideri consacrați și apoi îi comparăm rapid cu concurenții existenți pe această piață specifică.




Acest motor de căutare a fost fondat de indianul Ahmed Hossain și creat împreună de Institutul Indian de Tehnologie, Universitatea Delphi (India) și faimosul MIT (Massachusetts Institute of Technology). Facultăți de IT de la Universitatea Harvard și Universitatea din California din Berkeley au participat, de asemenea, activ la proiect. Acesta este un proiect științific serios și o încercare de a crea un tip fundamental nou de căutare, în timp ce în prim-plan se află faptul că căutarea nu ar trebui să folosească date private sau fapte personale ale cetățenilor în procesul de lucru. Toate rezultatele căutării nu sunt analizate sau acumulate în niciun fel, proiectul încearcă fundamental să creeze o căutare absolut curată și sigură pe cât posibil. Serviciul nu vă salvează adresa IP, nu stochează niciun cookie pe computer și toate informațiile pe care le-ați introdus în orice formular de căutare sunt șterse imediat după procesare. În acest moment, motorul de căutare se află cu încredere printre primele 100.000 de site-uri cele mai vizitate de pe Internetul mondial. Este important ca acest motor de căutare să aibă propriul motor de căutare, care, de asemenea, indexează cu succes site-urile în limba rusă și procesează interogările utilizatorilor în limba rusă. În rezultatele căutării, ca răspuns la solicitările utilizatorilor, Yauba oferă să acceseze site-urile găsite folosind două tipuri de link-uri, dintre care unul este albastru (aceasta este o legătură directă obișnuită), iar al doilea este verde, care permite utilizatorului de căutare să vizualizeze acest site printr-un server proxy anonim.




Ixquick se numește primul site de căutare din lume care nu înregistrează adresele IP ale vizitatorilor săi. Acest proiect de căutare susține, de asemenea, că stochează un minim de informații de căutare, care în nici un caz nu vor fi furnizate terților, ci sunt necesare doar pentru propriile nevoi tehnice, dezvoltare și optimizare a căutării. În 2008, acest motor de căutare a primit Sigiliul European de Confidențialitate și a devenit primul motor de căutare recomandat oficial de Uniunea Europeană pentru utilizare de către cetățenii săi. Motorul de căutare are o interfață convenabilă și modernă (de exemplu, există posibilitatea de a restrânge rezultatele căutării într-un spoiler). În rezultatele căutării, utilizatorului i se oferă posibilitatea de a merge la linkurile găsite printr-un anonimizator proxy al proiectului în sine și există posibilitatea de a urmări link-uri directe, la fel ca în Google. În opinia noastră, motorul de căutare arată rezultate de căutare foarte bune. Informațiile de pe site-ul dezvoltatorilor în sine despre natura motorului de căutare sunt oarecum contradictorii, așa că într-un loc vorbim despre propriul motor de căutare, în altul, dimpotrivă, se afirmă că este de fapt o metacăutare, adică. formarea rezultatului căutării agregate din rezultatele căutării unor lideri mondiali de căutare precum Bing, Yahoo, Ask/Theoma, precum și încheierea unui acord separat cu Wikipedia. La fel ca motoarele de căutare tradiționale, Ixquick vă permite și să căutați în imagini, baze de date telefonice, colecții video etc.




StartPage este o altă căutare anonimă care din punct de vedere tehnologic este o clonă a lui Ixquick. La fel ca și colegul său, StartPage nu stochează date private ale utilizatorilor care o folosesc. Echipa de dezvoltare StartPage încearcă pur și simplu să îmbunătățească Ixquick-ul existent.




Și, deși numele acestui motor de căutare arată ca numele unui personaj de desene animate frivol de basm, în ceea ce privește căutarea este un adevărat motor de căutare care folosește o fermă de cluster de 400 de servere pentru a servi toate solicitările primite și pentru a indexa Internetul. DuckDuckGo numește acumularea de date personale atât de îndrăgite de motoarele de căutare tradiționale o „scurgere de căutare” și ea însăși, de exemplu, menține neutralitatea totală în raport cu utilizatorul. Spre deosebire de motoarele de căutare menționate mai sus, totul aici poate fi personalizat. Deci, în secțiunea Setări rezultate și confidențialitate, puteți specifica în mod independent ce poate și ce nu poate fi folosit și salvat de motorul de căutare - în mod implicit, toate valorile sunt resetate. În secțiunea Setări proxy, puteți configura fie o redirecționare către un link direct dintr-o postare găsită, fie să activați modul proxy - la fel cum fac motoarele de căutare din recenzia de mai sus. Tot în această secțiune, puteți activa utilizarea forțată a protocolului https securizat, astfel încât comunicarea dvs. cu serverul de căutare va fi, de asemenea, criptată în siguranță, ceea ce împiedică terții să „asculte” interesele dumneavoastră.




Deoarece toate cele patru motoare de căutare discutate mai sus sunt destul de asemănătoare și de același tip, în concluzie putem oferi un alt exemplu de abordare complet diferită a anonimatului - aceasta este lucrul cu căutarea tradițională Google printr-un filtru de securitate special. O abordare similară de succes este demonstrată de serviciul destul de cunoscut hidemyass.com. Acționează ca un fel de server proxy cu o interfață web special pentru căutarea Google, producând rezultatul său standard, dar, în același timp, vă lipsește de toate deliciile „supravegherii”, încearcă să vă determine locația geografică, gusturile și obiceiurile și alte dezavantaje ale căutării tradiționale prin Google. Credem că această abordare este potrivită pentru majoritatea utilizatorilor, deoarece... nu vă obligă să abandonați gigantul de căutare deja familiar și lider mondial, eliminând în același timp toate caracteristicile sale nedorite. Desigur, nu poți să-ți complici viața și să nu folosești astfel de servicii specializate, ci să folosești un fel de anonimizator public, de exemplu the-cloak.com, care face față mai mult sau mai puțin cu succes rolului de protector de curiozitatea obsesivă a căutării. motoare, dar aici trebuie să aveți imediat în vedere unele subtilități. De exemplu, în unele cazuri va trebui să dezactivați independent execuția javascript în browser, deoarece... în acest fel, unele motoare de căutare vă vor putea „prinde” chiar și atunci când îl accesați printr-un anomizator. A doua abordare alternativă este utilizarea motoarelor de căutare cu metacăutare, dintre care multe sunt mai puțin intruzive și curioase, acționând ca un fel de interfață intermediară pentru motoarele de căutare tradiționale. Proiectul nostru rus nigma.ru poate fi citat ca un astfel de „exemplu bun”.

Ce este asta

DuckDuckGo este un motor de căutare open source destul de cunoscut. Serverele sunt situate în SUA. Pe lângă propriul robot, motorul de căutare folosește rezultate din alte surse: Yahoo, Bing, Wikipedia.

Cu atât mai bine

DuckDuckGo se poziționează ca un motor de căutare care oferă confidențialitate și confidențialitate maximă. Sistemul nu colectează date despre utilizator, nu stochează jurnalele (fără istoric de căutare), iar utilizarea cookie-urilor este cât se poate de limitată.

DuckDuckGo nu colectează și nu partajează informații personale de la utilizatori. Aceasta este politica noastră de confidențialitate.

Gabriel Weinberg, fondatorul DuckDuckGo

De ce ai nevoie de asta

Toate motoarele de căutare majore încearcă să personalizeze pe baza datelor despre persoana din fața monitorului. Acest fenomen se numește „bulă de filtru”: utilizatorul vede doar acele rezultate care sunt în concordanță cu preferințele sale sau pe care sistemul le consideră ca atare.

DuckDuckGo creează o imagine obiectivă care nu depinde de comportamentul tău trecut pe Internet și elimină publicitatea tematică de pe Google și Yandex pe baza interogărilor tale. Cu DuckDuckGo, este ușor să cauți informații în limbi străine: Google și Yandex în mod implicit acordă preferință site-urilor în limba rusă, chiar dacă interogarea este introdusă într-o altă limbă.


Ce este asta

not Evil este un sistem care caută în rețeaua Tor anonimă. Pentru a o folosi, trebuie să mergeți la această rețea, de exemplu, lansând una specializată cu același nume.

not Evil nu este singurul motor de căutare de acest gen. Există LOOK (căutarea implicită în browserul Tor, accesibilă de pe internetul obișnuit) sau TORCH (unul dintre cele mai vechi motoare de căutare din rețeaua Tor) și altele. Ne-am hotărât pe not Evil din cauza indicii clare de la Google (doar uitați-vă la pagina de pornire).

Cu atât mai bine

Căută unde Google, Yandex și alte motoare de căutare sunt în general închise.

De ce ai nevoie de asta

Rețeaua Tor conține multe resurse care nu pot fi găsite pe internetul care respectă legea. Iar numărul acestora va crește pe măsură ce controlul guvernului asupra conținutului internetului se va înăspri. Tor este un fel de rețea din Internet cu propriile rețele sociale, trackere de torrent, media, platforme de tranzacționare, bloguri, biblioteci și așa mai departe.

3. YaCy

Ce este asta

YaCy este un motor de căutare descentralizat care funcționează pe principiul rețelelor P2P. Fiecare computer pe care este instalat modulul software principal scanează Internetul independent, adică este analog cu un robot de căutare. Rezultatele obținute sunt colectate într-o bază de date comună care este utilizată de toți participanții YaCy.

Cu atât mai bine

Este dificil de spus dacă acest lucru este mai bun sau mai rău, deoarece YaCy este o abordare complet diferită a organizării căutării. Absența unui singur server și a unei companii proprietare face ca rezultatele să fie complet independente de preferințele oricui. Autonomia fiecărui nod elimină cenzura. YaCy este capabil să caute pe web profund și rețele publice neindexate.

De ce ai nevoie de asta

Dacă sunteți un susținător al software-ului open source și al unui internet gratuit, care nu este supus influenței agențiilor guvernamentale și a marilor corporații, atunci YaCy este alegerea dvs. Poate fi folosit și pentru a organiza o căutare în cadrul unei rețele corporative sau autonome. Și chiar dacă YaCy nu este foarte util în viața de zi cu zi, este o alternativă demnă la Google în ceea ce privește procesul de căutare.

4. Pipl

Ce este asta

Pipl este un sistem conceput pentru a căuta informații despre o anumită persoană.

Cu atât mai bine

Autorii lui Pipl susțin că algoritmii lor specializați caută mai eficient decât motoarele de căutare „obișnuite”. În special, sursele prioritare de informații includ profiluri de rețele sociale, comentarii, liste de membri și diverse baze de date care publică informații despre oameni, cum ar fi hotărârile judecătorești. Conducerea lui Pipl în acest domeniu este confirmată de evaluările de la Lifehacker.com, TechCrunch și alte publicații.

De ce ai nevoie de asta

Dacă aveți nevoie să găsiți informații despre o persoană care locuiește în SUA, atunci Pipl va fi mult mai eficient decât Google. Bazele de date ale instanțelor ruse sunt aparent inaccesibile motorului de căutare. Prin urmare, el nu se descurcă atât de bine cu cetățenii ruși.

Ce este asta

FindSounds este un alt motor de căutare specializat. Caută diverse sunete (casă, natură, mașini, oameni etc.) în surse deschise. Serviciul nu acceptă interogări în limba rusă, dar există o listă impresionantă de etichete în limba rusă pe care le puteți căuta.

Cu atât mai bine

Ieșirea conține doar sunete și nimic în plus. În setările de căutare puteți seta formatul dorit și calitatea sunetului. Toate sunetele găsite sunt disponibile pentru descărcare. Există o căutare de sunete după model.

De ce ai nevoie de asta

Dacă trebuie să găsiți rapid sunetul unei împușcături de muschetă, loviturile unei ciocănitoare care alăptează sau strigătul lui Homer Simpson, atunci acest serviciu este pentru dvs. Și am ales acest lucru numai din interogările disponibile în limba rusă. În engleză spectrul este și mai larg.

Dar serios, un serviciu specializat necesită un public specializat. Dar dacă îți este de folos și ție?

Ce este asta

Wolfram|Alpha este un motor de căutare computațional. În loc de link-uri către articole care conțin cuvinte cheie, oferă un răspuns gata făcut la cererea utilizatorului. De exemplu, dacă introduceți „comparați populațiile din New York și San Francisco” în formularul de căutare în limba engleză, Wolfram|Alpha va afișa imediat tabele și grafice cu comparația.

Cu atât mai bine

Acest serviciu este mai bun decât altele pentru a găsi fapte și a calcula date. Wolfram|Alpha colectează și organizează cunoștințele disponibile pe Web dintr-o varietate de domenii, inclusiv știință, cultură și divertisment. Dacă această bază de date conține un răspuns gata făcut la o interogare de căutare, sistemul îl afișează, dacă nu, calculează și afișează rezultatul; În acest caz, utilizatorul vede doar informațiile necesare și nimic de prisos.

De ce ai nevoie de asta

Dacă sunteți student, analist, jurnalist sau cercetător, de exemplu, puteți utiliza Wolfram|Alpha pentru a găsi și calcula date legate de munca dvs. Serviciul nu înțelege toate solicitările, dar se dezvoltă constant și devine mai inteligent.

Ce este asta

Motorul de metacăutare Dogpile afișează o listă combinată de rezultate din rezultatele căutării de la Google, Yahoo și alte sisteme populare.

Cu atât mai bine

În primul rând, Dogpile afișează mai puține anunțuri. În al doilea rând, serviciul folosește un algoritm special pentru a găsi și afișa cele mai bune rezultate din diferite motoare de căutare. Potrivit dezvoltatorilor Dogpile, sistemele lor generează cele mai complete rezultate de căutare de pe întregul Internet.

De ce ai nevoie de asta

Dacă nu puteți găsi informații pe Google sau pe alt motor de căutare standard, căutați-o în mai multe motoare de căutare simultan folosind Dogpile.

Ce este asta

BoardReader este un sistem de căutare de text în forumuri, servicii de întrebări și răspunsuri și alte comunități.

Cu atât mai bine

Serviciul vă permite să restrângeți câmpul de căutare la platformele sociale. Datorită filtrelor speciale, puteți găsi rapid postări și comentarii ale utilizatorilor care corespund criteriilor dvs.: limbă, data publicării și numele site-ului.

De ce ai nevoie de asta

BoardReader poate fi util pentru oamenii de PR și pentru alți specialiști media care sunt interesați de opinia unui public de masă asupra anumitor probleme.

In cele din urma

Viața motoarelor de căutare alternative este adesea trecătoare. Lifehacker l-a întrebat pe fostul director general al filialei ucrainene Yandex, Serghei Petrenko, despre perspectivele pe termen lung ale unor astfel de proiecte.


Serghei Petrenko

Fost director general al Yandex.Ucraina.

În ceea ce privește soarta motoarelor de căutare alternative, este simplu: să fie proiecte foarte de nișă cu un public restrâns, deci fără perspective comerciale clare sau, dimpotrivă, cu claritatea deplină a absenței lor.

Dacă te uiți la exemplele din articol, poți vedea că astfel de motoare de căutare fie sunt specializate într-o nișă îngustă, dar populară, care, poate, încă nu a crescut suficient pentru a fi vizibilă pe radarele Google sau Yandex, fie testează. o ipoteză originală în clasament, care nu este încă aplicabilă în căutarea obișnuită.

De exemplu, dacă o căutare pe Tor se dovedește brusc a fi solicitată, adică rezultatele de acolo sunt necesare de cel puțin un procent din publicul Google, atunci, desigur, motoarele de căutare obișnuite vor începe să rezolve problema cum să găsiți-le și arătați-le utilizatorului. Dacă comportamentul publicului arată că pentru o proporție semnificativă de utilizatori într-un număr semnificativ de interogări, rezultatele oferite fără a lua în considerare factorii în funcție de utilizator par mai relevante, atunci Yandex sau Google vor începe să producă astfel de rezultate.

„Fii mai bun” în contextul acestui articol nu înseamnă „fii mai bun în orice”. Da, în multe aspecte, eroii noștri sunt departe de Google și Yandex (chiar departe de Bing). Dar fiecare dintre aceste servicii oferă utilizatorului ceva ce giganții industriei de căutare nu pot oferi. Cu siguranță cunoști și tu proiecte similare. Distribuie cu noi - haideți să discutăm.

Ori de câte ori navigați pe un site web, adresa IP și MAC sunt înregistrate pentru a vă urmări activitatea. Pentru a vă proteja, trebuie să navigați anonim pe diverse site-uri. În acest sens, vă oferim o listă de motoare de căutare anonime care nu vă vor urmări interogările.

1. Wolfram Alpha

Este unul dintre cele mai bune motoare de căutare și este binecunoscut printre experții în securitate. WolframAlpha oferă o modalitate fundamental nouă de a obține cunoștințe și răspunsuri - prin calcule dinamice bazate pe cantități mari de date, algoritmi și metode încorporate.

2.Privat


Este un motor de căutare bazat pe HTTPS care utilizează criptarea SSL și nu înregistrează solicitările utilizatorilor.

3.DuckDuckGo


Acesta este un motor de căutare binecunoscut pe care poate l-ați folosit deja. Motorul de căutare anonim DuckDuckGo nu colectează și nu distribuie informațiile personale ale utilizatorilor. Aceasta este politica de confidențialitate folosită de acest serviciu.

4 Yippy


Acesta este unul dintre motoarele de căutare prin care puteți filtra cu ușurință rezultatele și sortați lista după dorința dvs. În plus, acest motor de căutare funcționează cu căutări adecvate ale utilizatorilor pentru a oferi utilizatorilor săi cele mai bune rezultate și nu salvează niciodată istoricul căutărilor.

5. GIBIRU


Gibiru nu se leagă de date personale și nu urmărește cookie-uri. Motorul de căutare oferă o rețea anonimă necenzurată și anonimă, astfel încât să puteți naviga pe internet în siguranță.

6.Pagina de pornire


Este un motor de căutare puternic care afișează rezultatele Google, protejând în același timp interogările utilizatorilor și evitând urmărirea pașilor dvs. Oferă navigarea printr-un server proxy care împiedică urmărirea adresei IP sau a locației.

7. Hulbee


Hulbee.com este o alternativă inteligentă pentru cei care acordă o mare importanță integrității și confidențialității datelor. Spre deosebire de motoarele de căutare obișnuite, utilizatorii Hulbee.com nu lasă urme. Hulbee.com nici măcar nu numără numărul de vizitatori. Solicitările lor, adresele IP și informațiile personale nu sunt stocate.

8. Deconectați căutarea


Acest serviciu folosește Google, Bing și Yahoo pentru a căuta conținut. Dar nu vă urmărește niciodată solicitările sau adresa IP. Acesta permite chiar utilizatorului să-și selecteze locația înainte de a începe căutarea.

9.Lukol


Lukol este unul dintre cele mai bune motoare de căutare care protejează utilizatorii de escrocii și spammerii online. Utilizează Google pentru a afișa rezultatele căutării. Dar un server proxy este folosit pentru a furniza rezultate de căutare.

Am analizat cele mai bune motoare de căutare anonime care nu urmăresc solicitările utilizatorilor. Folosindu-le, puteți efectua cu ușurință căutări anonime fără să vă faceți griji pentru siguranța dumneavoastră.

Traducerea articolului " Top 10 motoare de căutare private care nu vă urmăresc» a fost pregătit de echipa prietenoasă de proiect Construirea site-ului web de la A la Z.

Rău Bun

Bună ziua, dragi cititori ai blogului. , apoi puținii săi utilizatori s-au săturat de propriile lor marcaje. Cu toate acestea, după cum vă amintiți, s-a întâmplat în progresie geometrică și foarte curând a devenit mai dificil de navigat în toată diversitatea sa.

Apoi au apărut directoare (Yahoo, Dmoz și altele), în care autorii lor adăugau și sortau diverse site-uri pe categorii. Acest lucru a făcut imediat viața mai ușoară pentru utilizatorii de atunci, încă nu foarte numeroși, ai rețelei globale. Multe dintre aceste cataloage sunt încă în viață astăzi.

Dar după ceva timp, dimensiunea bazelor lor de date a devenit atât de mare încât dezvoltatorii s-au gândit mai întâi să creeze o căutare în interiorul lor și apoi să creeze un sistem automat de indexare a întregului conținut de pe Internet, pentru a-l face accesibil tuturor.

Principalele motoare de căutare ale segmentului de limbă rusă a internetului

După cum înțelegeți, această idee a fost implementată cu un succes uimitor, dar, totuși, totul a ieșit bine doar pentru o mână de companii selectate care au reușit să nu dispară pe internet. Aproape toate motoarele de căutare care au apărut în primul val acum fie au dispărut, au lânceit, fie au fost cumpărate de concurenți mai de succes.

Un motor de căutare este un mecanism foarte complex și, important, foarte consumator de resurse (aceasta înseamnă nu numai resurse materiale, ci și umane). În spatele aparentului simplu, sau a analogului său ascetic de la Google, există mii de angajați, sute de mii de servere și multe miliarde de investiții care sunt necesare pentru ca acest colos să continue să funcționeze și să rămână competitiv.

A intra acum pe această piață și a începe de la zero este mai mult o utopie decât un adevărat proiect de afaceri. De exemplu, una dintre cele mai bogate corporații din lume, Microsoft, încearcă de zeci de ani să se introducă pe piața de căutare și abia acum motorul lor de căutare Bing începe încetul cu încetul să le răspundă așteptărilor. Și înainte de asta a existat o serie întreagă de eșecuri și eșecuri.

Ce putem spune despre intrarea pe această piață fără influențe financiare speciale. De exemplu, motorul nostru de căutare autohton Nigma are o mulțime de lucruri utile și inovatoare în arsenalul său, dar traficul lor este de mii de ori mai mic decât liderii pieței ruse. De exemplu, aruncați o privire asupra audienței zilnice Yandex:

În acest sens, putem presupune că lista principalelor (cele mai bune și mai norocoase) motoare de căutare ale Runetului și ale întregului Internet a fost deja formată și întreaga intrigă stă doar în cine va devora în cele din urmă pe cine sau cum va devora cota lor procentuală. să fie distribuite dacă toți supraviețuiesc și vor rămâne pe linia de plutire.

Piața rusă a motoarelor de căutare este foarte clar vizibil și aici, probabil, putem distinge doi sau trei jucători principali și câțiva minori. În general, în RuNet s-a dezvoltat o situație destul de unică, care, după cum am înțeles, s-a repetat doar în alte două țări ale lumii.

Vorbesc despre faptul că motorul de căutare Google, care a venit în Rusia în 2004, încă nu a fost capabil să preia conducerea. De fapt, ei au încercat să cumpere Yandex în această perioadă, dar ceva nu a mers acolo și acum „Rusia noastră”, împreună cu Cehia și China, sunt acele locuri în care atotputernicul Google, dacă nu a fost învins, atunci, în în orice caz, a întâlnit o rezistență serioasă.

De fapt, pentru a vedea starea actuală a lucrurilor printre cele mai bune motoare de căutare de pe RuNet Oricine poate. Va fi suficient să lipiți această adresă URL în bara de adrese a browserului dvs.:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Faptul este că majoritatea folosesc .

După ce ați introdus adresa URL dată, veți vedea o imagine care nu este foarte atractivă și prezentabilă, dar reflectă bine esența problemei. Acordați atenție primelor cinci motoare de căutare de la care site-urile în limba rusă primesc trafic:

Da, desigur, nu toate resursele cu conținut în limba rusă se află în această zonă. Există, de asemenea, SU și RF, iar zonele generale precum COM sau NET sunt pline de proiecte Internet axate pe Runet, dar totuși, eșantionul este destul de reprezentativ.

Această dependență poate fi prezentată într-un mod mai colorat, așa cum, de exemplu, cineva a făcut-o online pentru prezentarea sa:

Asta nu schimbă esența. Există câțiva lideri și câțiva foarte, foarte departe de motoarele de căutare. Apropo, am scris deja despre multe dintre ele. Uneori poate fi destul de interesant să te arunci în istoria succesului sau, dimpotrivă, să aprofundezi în motivele eșecurilor unor motoare de căutare cândva promițătoare.

Deci, în ordinea importanței pentru Rusia și Runet în ansamblu, le voi enumera și le voi oferi scurte caracteristici:

    Căutarea pe Google a devenit deja un cuvânt de uz casnic pentru mulți oameni de pe planetă - puteți citi despre asta în link. În acest motor de căutare, mi-a plăcut opțiunea „traducerea rezultatelor”, când primeai răspunsuri din toată lumea, dar în limba ta maternă, dar acum, din păcate, nu este disponibilă (cel puțin pe google.ru).

    În ultimul timp am fost, de asemenea, nedumerit de calitatea rezultatelor lor (Pagina de rezultate ale motorului de căutare). Personal, folosesc întotdeauna mai întâi motorul de căutare în oglindă RuNet (există unul acolo, ei bine, m-am obișnuit) și numai dacă nu găsesc acolo un răspuns inteligibil, apelez la Google.

    De obicei, eliberarea lor m-a făcut fericit, dar în ultimul timp nu m-a făcut decât să mă încurce - uneori ies astfel de prostii. Este posibil ca lupta lor de a crește veniturile din publicitatea contextuală și amestecarea constantă a rezultatelor căutării pentru a discredita promovarea SEO să ducă la rezultatul opus. În orice caz, acest motor de căutare are un concurent pe RuNet și ce fel de acesta.

    Cred că este puțin probabil ca cineva să meargă în mod special la Go.mail.ru pentru a căuta în RuNet. Prin urmare, traficul către proiecte de divertisment din acest motor de căutare poate fi semnificativ mai mare de zece procente. Proprietarii unor astfel de proiecte ar trebui să acorde atenție acestui sistem.

Cu toate acestea, pe lângă liderii clari de pe piața motoarelor de căutare a segmentului de limbă rusă a internetului, mai există câțiva jucători a căror cotă este destul de scăzută, dar cu toate acestea, însuși faptul existenței lor face necesar să rostim câteva cuvinte. despre ele.

Motoarele de căutare Runet din eșalonul doi


Motoare de căutare pe Internet

În general, pe scara întregului Internet există un singur jucător serios - Google. Acesta este liderul de necontestat, dar mai are ceva concurență.

În primul rând, este tot la fel Bing, care, de exemplu, are o poziție foarte bună pe piața americană, mai ales având în vedere că motorul său este folosit și pe toate serviciile Yahoo (aproape o treime din întreaga piață de căutare din SUA).

Ei bine, în al doilea rând, datorită ponderii uriașe pe care o ocupă utilizatorii din China în numărul total de utilizatori de Internet, principalul lor motor de căutare numit Baidu se încadrează în distribuția locurilor de pe Olimpul mondial. S-a născut în 2000 și acum ponderea sa este de aproximativ 80% din întregul public național din China.

Este greu de spus ceva mai inteligibil despre Baidu, dar pe internet exista pareri ca locurile din Topul sau sunt ocupate nu doar de site-urile cele mai relevante pentru cerere, ci si de cei care au platit-o (direct catre motorul de cautare). , și nu la biroul SEO). Desigur, acest lucru se aplică în primul rând înregistrărilor comerciale.

În general, privind statisticile, devine clar de ce Google acceptă cu ușurință să-și înrăutățească rezultatele căutării în schimbul creșterii profiturilor din publicitatea contextuală. De fapt, nu le este frică de abandonul utilizatorilor, pentru că în cele mai multe cazuri nu au unde să meargă. Această situație este oarecum tristă, dar vom vedea ce se întâmplă în continuare.

Apropo, pentru a face viața și mai dificilă pentru optimizatori și poate pentru a menține liniștea minții utilizatorilor acestui motor de căutare, Google a folosit recent criptarea atunci când transmite interogări din browserele utilizatorilor către bara de căutare. În curând nu va mai fi posibil să vedeți în statisticile contoarelor de vizitatori pentru ce interogări au venit utilizatorii Google.

Desigur, pe lângă motoarele de căutare menționate în această publicație, există mii de altele - regionale, specializate, exotice etc. Încercarea de a le enumera și de a le descrie pe toate într-un singur articol ar fi imposibilă și probabil nu necesară. Să spunem mai bine câteva cuvinte despre cât de ușor este să creezi un motor de căutareși cum nu este ușor sau ieftin să-l ții la zi.

Marea majoritate a sistemelor funcționează pe principii similare (citiți despre asta și asta) și urmăresc același scop - de a oferi utilizatorilor un răspuns la întrebarea lor. Mai mult, acest răspuns trebuie să fie relevant (corespunzător întrebării), cuprinzător și, ceea ce nu este lipsit de importanță, relevant (de primă prospețime).

Rezolvarea acestei probleme nu este atât de ușoară, mai ales având în vedere că motorul de căutare va trebui să analizeze din mers conținutul a miliarde de pagini de Internet, să le îndepărteze pe cele inutile, iar din cele rămase să formeze o listă (problema), unde mai întâi vor apărea cele mai potrivite răspunsuri la întrebarea utilizatorului.

Această sarcină extrem de complexă este rezolvată prin colectarea preliminară a informațiilor din aceste pagini folosind diverse roboți de indexare. Ei colectează link-uri de la paginile deja vizitate și încarcă informații din acestea în baza de date a motorului de căutare. Există roboți care indexează text (un bot obișnuit și rapid care trăiește din știri și resurse actualizate frecvent, astfel încât cele mai recente date să fie întotdeauna prezentate în rezultate).

În plus, există roboți care indexează imaginile (pentru ieșirea lor ulterioară), favicon-uri, oglinzi de site (pentru compararea lor ulterioară și posibila lipire), roboți care verifică funcționalitatea paginilor de Internet, care utilizatorii sau prin instrumente pentru webmasteri (aici pot citi despre, și) .

Procesul de indexare în sine și procesul ulterior de actualizare a bazelor de date indexate necesită destul de mult timp. Deși Google face acest lucru mult mai repede decât concurenții săi, cel puțin Yandex, care durează o săptămână sau două pentru a face acest lucru (citiți despre).

De obicei, un motor de căutare descompune conținutul text al unei pagini de Internet în cuvinte individuale, care sunt reduse la principiile de bază, astfel încât să poată da apoi răspunsuri corecte la întrebările puse în diferite forme morfologice. Toate lucrurile suplimentare sub formă de etichete HTML, spații etc. lucrurile sunt șterse, iar cuvintele rămase sunt sortate alfabetic și poziția lor în acest document este indicată lângă ele.

Acest tip de lucru se numește index invers și vă permite să căutați nu după pagini web, ci după date structurate situate pe serverele motoarelor de căutare.

Numărul de astfel de servere pentru Yandex (care caută în principal numai site-uri în limba rusă și puțin pentru ucraineană și turcă) este de zeci sau chiar sute de mii, iar pentru Google (care caută în sute de limbi) - de milioane .

Multe servere au copii, care servesc atât la creșterea securității documentelor, cât și la creșterea vitezei de procesare a cererilor (prin distribuirea încărcăturii). Estimați costurile menținerii întregii economii.

Solicitarea utilizatorului va fi trimisă de echilibrator de încărcare către segmentul de server care este cel mai puțin încărcat în prezent. Apoi se efectuează o analiză a regiunii din care utilizatorul motorului de căutare a trimis cererea și este analizată morfologic. Dacă o interogare similară a fost introdusă recent în bara de căutare, atunci utilizatorului i se oferă date din cache pentru a nu supraîncărca din nou serverele.

Dacă cererea nu a fost încă memorată în cache, atunci este transferată în zona în care se află baza de date index a motorului de căutare. Ca răspuns, veți primi o listă cu toate paginile de internet care sunt cel puțin oarecum legate de cerere. Nu sunt luate în considerare doar aparițiile directe, ci și alte forme morfologice, precum și etc. lucruri.

Al lor trebuie clasat iar în această etapă intră în joc algoritmul (inteligența artificială). De fapt, cererea utilizatorului este multiplicată prin toate opțiunile posibile de interpretare a acesteia, iar răspunsurile la multe solicitări sunt căutate simultan (prin utilizarea operatorilor de limbaj de interogare, dintre care unii sunt disponibili pentru utilizatorii obișnuiți).

De regulă, rezultatele căutării conțin o pagină de pe fiecare site (uneori mai multe). sunt acum foarte complexe și iau în considerare mulți factori. În plus, pentru a le corecta, și sunt utilizate, care evaluează manual site-urile de referință, ceea ce vă permite să ajustați funcționarea algoritmului în ansamblu.

În general, este clar că problema este întunecată. Putem vorbi despre asta mult timp, dar este deja clar că satisfacția utilizatorilor cu un sistem de căutare este atinsă, oh, cât de dificil este. Și întotdeauna vor exista cei cărora nu le place ceva, ca tine și mine, dragi cititori.

Multă baftă! Ne vedem curând pe paginile site-ului blogului

Puteți viziona mai multe videoclipuri accesând
");">

S-ar putea să fiți interesat

Yandex People - cum să cauți oameni pe rețelele sociale Apometr este un serviciu gratuit de urmărire a modificărilor rezultatelor căutării și a actualizărilor motoarelor de căutare. DuckDuckGo - un motor de căutare care nu te urmărește
Cum să verificați viteza internetului - test de conexiune online pe computer și telefon, SpeedTest, Yandex și alte contoare
Imagini Yandex și Google, precum și căutare după fișier imagine în Tineye (tinai) și Google