Copiator de site-uri web Httrack cum să descărcați fișiere individuale. Lansarea programului WinHTTrack Website Copier. Care sunt limitările copiilor?

Actualizarea copiei locale
Pentru a continua descărcarea unui blog mare sau sincronizarea versiune locală cu ceea ce este pe Internet, httrack poate actualiza proiectul descărcat. Din câte am înțeles, pentru a face acest lucru trebuie să adăugați cheia --update la vraja de mai sus

Adică să actualizezi un blog deja descărcat din blogspot din directorul în care se află directorul hts-cache (conține un fișier hts-cache/doit.log care conține totul parametrii necesari) si scrie:

httrack "http://YOURBLOGTUT .blogspot.com/" "+*.css" "+*.js" "+*.jpg" "+*.jpeg" "+*.tiff" "+*.png" " +*.gif" "+*.giff" "+*.swf" "+.ico" -v --disable-security-limits -s0 "-*666*" "-*BlogBacklinkURL*" --update
Și httrack încearcă să actualizeze proiectul. Și îl actualizează, descarcând fișierele rămase. Apropo, pentru a sări peste fișierele de pe servere care sunt prea lente, puteți seta și timeout-ul pentru httrack mai mic, adăugând tasta --timeout 20, după care timeout-ul va fi de 20 de secunde.

Voi observa, de asemenea, că în directorul hts-cache există două arhive mari în Format ZIP- deci, îl puteți șterge doar pe cel numit old.zip și este mai bine să nu atingeți new.zip. Cert este că aceste fișiere conțin informațiile necesare pentru ca httrack să actualizeze site-ul descărcat, iar dacă aceste fișiere sunt șterse, nu veți putea să actualizați pur și simplu copia (va trebui să descărcați totul din nou).

Link-uri către subiect
Cele mai bune minți din blogging și tehnologie de blogging s-au luptat cu acest subiect, ale cărui realizări sunt imortalizate, de exemplu, în articolul lui Dmitry Konishchev Crearea unei oglinzi pentru site-ul web și în postarea lui Andrey Afanasenko Arhivă blog/arhivă blog . Pentru care aceste minți (precum toți cei care au luat parte la discuții) fac o plecăciune scăzută și o mare recunoștință.
Mulțumesc și tovarășului.
vnaum pentru a găsi în sălbăticia documentației Blogger un link către posibilitatea de a obține toate postările Blogger folosind scripturi Python.

15 comentarii: | | Flux de discuții RSS. |
Comentariile directorului de program... 21 dec 2009, 16:53:00

Curios. Nu am avut sarcina de a oglindi un blog, dar este o idee interesantă. Voi încerca să-l copiez pe al meu doar pentru distracție...

Olly Cat comentează... 21 dec 2009, 20:31:00

Multumesc, foarte interesant si informativ. Trebuie să ne gândim cum să folosim acest lucru acum pentru a transfera de la un blog la altul (de mult îmi doream să transfer vechiul meu LiveJournal pe blogspot, dar nu am ajuns niciodată la el).

Serghei comentează... 21 dec 2009, 22:41:00

Am vrut să notez că obținerea arhivei a lui Cel mai simplu mod de a începe un blog este din panoul de control - Setări/Informații de bază/Instrumente blog/Export blog. Și obținem XML cu totul, totul, totul. Frumos XML. Numai date (dar inclusiv toate setările de stil), fără HTML generat.

Am avut ideea că este posibil să scriu un script care să genereze un document TeX folosind această arhivă XML, care să fie generată automat pentru citire offline - pentru tipărire sau e-book. Ca ljbook sau blurb, dar mai bine :-) Vă dau o idee.

comentariile vnaum... 23 dec 2009, 00:23:00

Ei bine, cei doi cenți ai mei:
http://code.google.com/apis/blogger/docs/1.0/developers_guide_python.html#RetrievingWithoutQuery

(python-gdata este disponibil în Debian)

comentariile virens... 23 dec 2009, 01:59:00

@Programmaster scrie...
Curios. Nu am avut sarcina de a oglindi un blog, dar este o idee interesantă.
În curând te vei confrunta cu aceeași sarcină atunci când există peste o sută de postări. Nu există întotdeauna o conexiune la internet - nu există internet la MEPhI de două săptămâni. Deși nu mai este MEPhI, știu... dar nu asta este ideea.

@Olly Cat scrie...
Trebuie să ne gândim cum să folosim acest lucru acum pentru a transfera de la un blog la altul (de mult îmi doream să transfer vechiul meu LiveJournal pe blogspot, dar nu am ajuns niciodată la el).
În acest fel, cred că este puțin probabil. Blogspot descarcă un fișier XML voluminos, dar nu am idee cum să îl formatez.

@Sergey scrie...
Aș dori să menționez că cel mai simplu mod de a obține o arhivă a blogului dvs. este din panoul de control - Setări/Informații de bază/Instrumente blog/Export blog. Și obținem XML cu totul, totul, totul.
A, și aici vine Oberfeldwebel Evidenz în fir! :-)) Îmi pare rău, Sergey, nu am putut rezista ;-))

Frumos XML. Numai date (dar inclusiv toate setările de stil), fără HTML generat.
Fată bună Lida, ce e așa de bine la ea?! :-)
Serios, nu pot să-l privesc. Și distribuirea acestui fișier tuturor - așa sunt furate articolele mele și apoi vor fi doar duplicate în bancuri.

Am avut ideea că este posibil să scriu un script care să genereze un document TeX folosind această arhivă XML, care să fie generată automat pentru citire offline - pentru tipărire sau e-book.
Oh, voi luminițe de Crăciun... Asta aduce Haskell, mămici, haide... :-)

@vnaum scrie...
Ei bine, cei doi cenți ai mei
Acest o rublă întreagă, vnaum! Mulțumesc!

P.S. Vă rog să mă iertați pentru răspunsurile ușor ironice, pentru că... Am scris rapoarte toată ziua. După aceea îmi vine să râd mult :-)

Programul luat în considerare în revizuire Site-ul HTTrack Copizorul pentru încărcarea unui site web în zilele noastre nu mai este la fel de popular ca înainte. În timpul nostru de mare vitezăȘi Internet nelimitat vă permite să vizualizați orice site web. Și nu cu mult timp în urmă, era mai convenabil pentru mulți utilizatori să descarce întregul site și să-l vizualizeze copie locală pe computer fără conexiune la internet. Cu toate acestea, în multe cazuri, de exemplu, pentru a studia structura unui site web, utilitarul HTTrack Website Copier poate fi în continuare util. Programul vă permite să încărcați un site în conformitate cu regulile specificate și să salvați oglinda locală a acestuia pe computerul nostru.

Înainte de a începe descărcarea site-ului, trebuie să creați un proiect în HTTrack Website Copier, unde vom defini toți parametrii de descărcare. apasa butonul [Mai departe]în fereastra programului.

În câmp Nou nume de proiect introduceți numele proiectului, indicați și categoria și Catalog, unde vor fi salvate informațiile descărcate. Dacă un proiect a fost deja creat anterior, îl puteți selecta din listă pentru a continua încărcarea sau pentru a modifica parametrii.

În etapa următoare, va trebui să specificați adresa site-ului de descărcat (sau mai multe link-uri) și, de asemenea, să selectați metoda de descărcare. HTTrack Website Copier acceptă mai multe metode: descărcarea site-urilor, descărcarea fișierelor individuale, descărcarea tuturor site-urilor de pe pagina specificată, testarea link-urilor dintr-o pagină, continuarea unei descărcări întrerupte sau actualizarea unei descărcări existente. O listă de site-uri descărcabile poate fi compilată și salvată în fisier text, apoi indicați-l în câmp Lista de adrese URL (.txt).

Buton [Setați parametri...] deschide masa parametri suplimentariîncărcarea site-ului. Aici puteți specifica serverul proxy, cu ce browser HTTrack Website Copier se va identifica, determina subsol pe paginile HTML, configurați jurnalul și parametrii de stocare în cache. Apropo, programul are o „traducere strâmbă”, astfel încât toate elementele de meniu în care se găsesc cuvintele „modă” ar trebui considerate „mod”, de exemplu: „Modul de scanare” - „Modul de scanare”.

Să ne uităm la câțiva parametri mai detaliat. Tab Filtre vă permite să limitați descărcarea tipurilor de fișiere nedorite. De exemplu, pentru a exclude imaginile mici (bannere, pictograme, avatare) format GIF, poti intra " -*.gif" Pentru a le include anumite în descărcare, specificați o mască cu semnul +. Programul vă permite să creați reguli mai flexibile, inclusiv fișiere sau directoare ale căror nume conțin textul specificat, legături cu domenii specificate, sau care conține textul specificat etc.

Tab Restricții vă va ajuta să configurați setări precum Adâncime maximă , acesta este numărul de niveluri de link. De exemplu, cu o valoare de 2, HTTrack Website Copier va copia pagina principala site-ul web și paginile care se deschid prin link-uri de la acesta. Parametru Adâncimea maximă exterioară limitează nivelul de scanare și descărcare a altor site-uri, link-uri către care pot fi pe site-ul descărcat. Aici puteți seta restricții privind dimensiunea paginilor html încărcate și a altor pagini, dimensiune maximă site-ul, timpul de încărcare și viteza. Puteți selecta vizualizarea structurii site-ului descărcat în filă Structura.

După finalizarea setărilor, puteți începe imediat descărcarea site-ului sau îl puteți amâna pentru mai târziu. În timp ce site-ul se încarcă, este afișată pagina sau folderul scanat, precum și viteza conexiunii, viteza de descărcare, dimensiunea informațiilor salvate și numărul de pagini/directoare scanate și salvate. Puteți opri încărcarea unui site în HTTrack Website Copier făcând clic pe butonul [Anulare]. Jurnalul de descărcare vă va ajuta să obțineți informații despre paginile și fișierele descărcate.

Pentru a vizualiza site-ul încărcat, faceți clic pe butonul [Vizualizare oglindă], după care o copie locală a site-ului este încărcată în browser. Nici măcar nu necesită o conexiune la internet. Vă rugăm să rețineți că HTTrack Website Copier înlocuiește toate linkurile de pe site cu cele locale, făcând posibilă navigarea pe site:

Caracteristici:
Limbajul interfeței: rusă, engleză etc.
OS: Windows 2000, XP, Vista, 7
Mărime fișier: 3,8 MB
Licență: gratuit

În timp ce studia căi diferite Pentru a câștiga bani pe internet, de exemplu, de multe ori trebuie să copiați site-uri de o pagină.

De ce să creați pagini de destinație când le puteți împrumuta? Nu este dificil să faci asta, mai ales că au fost deja create programe speciale pentru aceasta.

Cum să copiați orice site web? Mai întâi trebuie să-l descărcați pe computer, apoi să îl transferați pe găzduire, după ce faceți modificări (de exemplu, modificarea link-urilor).

Durează doar câteva minute dacă utilizați copiatorul site-ului Httrack. Acest utilitate gratuită, care are o versiune rusă.

Copierea întregului site

Copiator de site-uri web Httrack are multe analoge, majoritatea sunt plătite (de exemplu, Offline Explorer). Nu este nevoie să plătiți, acest program are suficientă funcționalitate.

Descărcați-l de pe site-ul oficial (httrack), ținând cont de versiunea sistemului dvs. de operare.

Este instalat ca orice alt program, și după lansare trebuie să faceți următoarele:

  1. Crea proiect nou, introduceți un nume personalizat. Categoria poate fi lăsată goală. Selectați folderul în care vor fi salvate datele și faceți clic pe următorul:

  1. Apoi, selectați tipul de operațiune, lăsați încărcarea site-ului neschimbată și introduceți adresa resursei:

  1. În pasul anterior, înainte de a face clic pe „Următorul”, trebuie să deschideți „Setare parametri”. Acolo, deschideți fila filtre pentru a scăpa de fișierele semnificative și inutile:

  1. Accesați, de asemenea, fila de restricții pentru a seta cât de departe de pagina specificată ar trebui să se încarce site-ul. Dacă acesta este un site cu o singură pagină, nu atingeți setările:

  1. Dacă doriți ca site-ul să se încarce cât mai repede posibil, bifați casetele din fila „Link-uri”, așa cum se arată în imagine:

  1. Ultimul personalizare suplimentară Aceasta este o alegere a modului în care sunt salvate fișierele. Selectați structura site-ului din fila „Structură”:

  1. Când toți parametrii sunt configurați, puteți face clic pe butonul „OK” și puteți reveni pentru a continua descărcarea. Tot ce rămâne de făcut este să lăsați o bifă pe primul articol și să faceți clic pe „Finish”:

  1. Procedura de descărcare a fișierului va începe, trebuie să așteptați până se termină. Timpul depinde de cantitatea de date:

  1. Acum va apărea un folder pe computer în care sunt salvate toate datele site-ului copiat. Puteți intra în el și îl puteți deschide fișier HTMLîn browser pentru a verifica dacă totul este afișat corect:

Ultimul pas de copiere a unui site este transferul lui pe hosting. Totul este simplu acolo, copiați datele și legați un domeniu preînchiriat. Gata, poți să introduci adresa site-ului și să verifici dacă totul a funcționat.

Programul de copiere a site-ului web Httrack vă ajută atât să salvați o pagină de site, cât și să o descărcați complet. Cu acest utilitar simplu, puteți utiliza orice site frumos de o pagină și puteți crește conversia, doar nu uitați să faceți modificări codului, cel puțin editand link-uri externe.

Cum să descărcați întregul site gratuit? Vom discuta această problemă în acest articol și vom acorda atenție gratuit offline browser - . WinHTTrack este program gratuit pentru a descărca site-uri întregi.

Există un moment în care chiar trebuie să descărcați un site interesant în întregime.

Acesta poate fi cazul dacă avem un laptop sau netbook și noi vom merge undeva unde nu există acces la internet (de exemplu, la dacha, la o drumeție, la mare etc.). În această situație, folosind un program de descărcare a site-urilor întregi, puteți descărca orice site de acasă și apoi îl puteți citi oricând și oriunde, fără a fi nevoie să vă conectați la Internet.

Sau, de exemplu, noi mai ales internet lent și scump, dar este posibil să plătiți rapid și trafic nelimitat pentru o zi (sau du-ți laptopul la un prieten care are internet nelimitat). Am compilat o listă de site-uri necesare și le-am conectat pentru o zi tarif nelimitat(sau a mers la casa unui prieten), a descărcat toate site-urile selectate și gata - apoi le puteți citi fără conexiune la internet.

Există și situații când Internetul este nelimitat, dar lent, iar pentru a deschide pagini noi pe un site pe care îl vizităm frecvent, trebuie să petrecem mult timp. În acest caz, posibilitatea de a descărca întregul site pentru a-i putea vizualiza rapid paginile este foarte utilă, deoarece fișierele site-ului vor fi deja pe computerul nostru.

Pentru a descărca întregul site, există mai multe diferite pe Internet din care să alegeți. programe cu plată. Dar, în conformitate cu tema site-ului meu, ne vom uita la: cum să descărcați întregul site gratuit, adică folosind un program gratuit.

Pentru a face acest lucru, vom folosi un program gratuit pentru descărcarea site-urilor.

Cum se descarcă

Pentru a descărca programul de descărcare a site-urilor (cea mai recentă versiune), accesați site-ul oficial al acestui program și descărcați în secțiunea de descărcare fișier de instalare. În cele mai multe cazuri, trebuie să descărcați primul fișier, așa cum se arată în imaginea de mai jos. Dar, puteți alege și un alt fișier de instalare dacă, sistem de operare nu Windows, ci Linux sau Android:

Instalarea WinHTTrack Website Copier

Instalarea WinHTTrackîncepe cu o fereastră de bun venit în care pur și simplu faceți clic Următorul:

Specifică numele folderului în meniul Start pentru lansarea WinHTTrack. De asemenea, nu trebuie să schimbați nimic aici. Să mergem mai departe:

Lăsăm totul așa cum este sugerat implicit și facem clic Următorul:

Următoarea fereastră arată opțiunile selectate. Doar click Instalare pentru a finaliza instalarea. Va apărea următoarea fereastră, în care lăsăm o bifă dacă dorim să lansăm programul imediat după instalare. Și cealaltă casetă de selectare poate fi eliminată (citind istoricul dezvoltării programului în limba engleză, cred că aproape nimeni nu va fi interesat). Clic finalizarea:

Lansarea WinHTTrack Website Copier

Dacă ai lăsat o bifă Lansați WinHTTrack Website Copier, programul va începe imediat. În viitor, poate fi lansat prin meniul Start, așa cum se arată mai jos.

Când lansați WinHTTrack Website Copier pentru prima dată, puteți seta limba pentru interfața programului:

  1. Selectați limba rusă pentru WinHTTrack
  2. În fereastra care apare, spunând că pentru a schimba limba, trebuie să reporniți programul, faceți clic pe OK
  3. Faceți clic pe OK unde ați selectat limba:

De asemenea, puteți schimba limba prin meniul programului, așa cum se arată în imagine:

Închideți complet programul WinHTTrack făcând clic pe cruce din dreapta colțul de sus, sau pe butonul Ieșire situat în mijlocul ecranului programului:

Pornim din nou programul prin meniu start-> Toate programele -> Dosarul WinHTTrack-> așa cum se arată în imagine:

Cum să descărcați un întreg site web folosind WinHTTrack

Mă voi uita la procesul de descărcare a unui întreg site folosind WinHTTrack folosind site-ul meu ca exemplu:

Lansați WinHTTrack și faceți clic pe butonul din mijlocul ecranului programului Următorul >:

Într-o fereastră nouă indicăm Nou nume de proiect, Categoria de proiect(pentru organizarea în continuare a site-urilor salvate) și salvare cale - Catalog(unde site-urile salvate vor fi stocate pe computer), care pot fi schimbate dacă se dorește. Faceți clic pe Următorul:

Indicăm Tipul de descărcare, adăugăm adresa site-ului și facem clic pe Next pentru a descărca întregul site cu toate paginile și fișierele care se află pe acest site:

Mai mult, programul are caracteristică bună, - puteți urmări în timp real procesul de descărcare a întregului site și, în același timp, puteți sări peste descărcarea oricăror fișiere inutile:

Acest lucru poate fi util atunci când vedem ceva legănându-se fișier video mare sau un program de care nu avem nevoie.

Dar puteți și inițial (înainte de a descărca site-ul) să setați parametrii după cum doriți, pentru, de exemplu, a preveni în prealabil descărcarea a ceea ce nu avem nevoie.

Să ne uităm puțin mai detaliat la această setare a parametrului.

Cum să setați parametrii WinHTTrack pentru descărcarea unui site web

Accesați fila Setare parametri (imaginea de mai sus). Aici ne vor interesa în special cele 3 file:

A). Filtre WinHTTrack pentru descărcarea unui site web

În această filă, puteți da programului o sarcină: ce să facă cu anumite fișiere atunci când descărcați un site.

Să presupunem că trebuie să descarcăm întregul site împreună cu toate imaginile, dar nu avem nevoie de programe ( fișiere exe), arhive, precum și video și audio care pot fi localizate pe acesta. În acest caz, punem o bifă pe toate grupurile de fișiere și schimbăm manual pictograma + pe pentru toate fișierele pe care dorim să le excludem de la descărcare:

După cum puteți vedea, există opțiuni pentru descărcare informatie necesara poate mult.

B). Restricții WinHTTrack pentru descărcarea unui site web

În această filă puteți configura câțiva parametri care limitează anumite funcții. Când treceți cursorul peste fiecare celulă cu cursorul mouse-ului, apare o explicație a constrângerii selectate, astfel încât să puteți vedea ce înseamnă fiecare dintre ele:

Două dintre ele, după părerea mea, sunt cele mai frecvent utilizate:

Dimensiunea maximă a site-ului. Util în cazurile în care dorim să limităm descărcările unui site, deoarece nu știm câte informații există de fapt, iar spațiul de pe computerul nostru poate fi limitat. Prin urmare, decidem singuri cât spațiu putem dedica pe computerul nostru acestui site.

Timp maxim de descărcare a site-ului web. Este util în cazurile în care mergem undeva și trebuie să plecăm într-o jumătate de oră sau într-o oră, dar trebuie să descarcăm urgent un site pentru a citi pe drum fără internet. Și aici puteți specifica timpul după cât timp să opriți descărcarea: câte au fost descărcate - câte vor fi.

Puteți încerca să utilizați singur restricțiile rămase - nu mai sunt aplicabile atât de des și, poate, nu vor fi niciodată necesare.

ÎN). Link-uri WinHTTrack

Filele rămase dau caracteristici suplimentare, dar am descris principalul lucru de care aveți nevoie pentru a descărca întregul site în această postare. Pentru un utilizator începător, cred că nu trebuie să acordați prea multă atenție restului.

Asta e tot! Tot ce trebuie să faci este să apeși butonul Gata:

Și după descărcarea site-ului, puteți trece la vizualizarea acestuia.

Pentru a vizualiza site-urile descărcate, în partea stângă a ferestrei programului, găsiți folderul cu site-urile salvate pe computer și faceți clic pe fișier index.html asa cum se vede in poza:

În browser se va deschide o pagină cu un meniu, cu care puteți lansa și vizualiza toate site-urile descărcate:

Faceți clic pe oricare dintre site-urile salvate și bucurați-vă de vizualizare rapidă!

Funcții WinHTTrack mai utile

De asemenea, atunci când utilizați WinHTTrack Website Copier pentru a descărca site-uri web, puteți utiliza unele caracteristici utile acest program. În tipul de încărcare a site-ului, puteți selecta ceea ce avem nevoie de pe site.

De exemplu, putem doar descărca fişiere separate(doar poze, arhive sau programe), cu specificarea extensiilor fisierele necesare prin setarile parametrilor. De asemenea, putem continua descărcarea (dacă Internetul se stinge brusc) sau actualizam descărcarea (dacă dorim să suplimentăm informațiile unui site descărcat anterior):

Concluzie: este un program gratuit bun pentru descărcarea site-urilor care vă permite descărcați întregul site, iar cu ajutorul filtrelor și restricțiilor vă permite să faceți procesul de descărcare a unui site convenabil și variat.