Httrack website copier как скачать отдельные файлы. Запуск программы WinHTTrack Website Copier. Какие есть ограничения у копий

Обновление локальной копии
Для того, чтобы продолжить скачивание большого блога или синхронизировать локальную версию с тем, что есть в Интернете, httrack может обновить скачанный проект. Насколько я понял, для этого нужно добавить к вышеупомянутому заклинанию ключик --update

То есть для обновления уже скачанного блога с blogspot из директории, где находится директория hts-cache (в ней лежит файл hts-cache/doit.log который содержит все нужные параметры) и пишем:

httrack "http://ВАШБЛОГТУТ .blogspot.com/" "+*.css" "+*.js" "+*.jpg" "+*.jpeg" "+*.tiff" "+*.png" "+*.gif" "+*.giff" "+*.swf" "+.ico" -v --disable-security-limits -s0 "-*666*" "-*BlogBacklinkURL*" --update
И httrack пытается обновить проект. И обновляет его, выкачивая оставшиеся файлы. Кстати, чтобы пропускать файлы со слишком тормозных серверов, можно ещё тайм-аут для httrack поставить поменьше, добавив ключик --timeout 20 после чего тайм-аут будет 20 секунд.

Отмечу так же, что в каталоге hts-cache лежат два больших архива в формате ZIP - так вот, удалить можно только тот из них, который называется old.zip, а new.zip лучше не трогать. Дело в том, что эти файлы содержат информацию, необходимую httrack для обновления скачанного сайта, и если эти файлы удалить, то вы не сможете просто обновить копию (придётся выкачивать всё заново).

Ссылки в тему
Над этой темой бились лучшие умы блоговедения и блоготехники, достижения коих увековечены к примеру в заметке Дмитрия Конищева Создание зеркала сайта и в посте Андрея Афанасенко Архив блога/blogarchive . За что оным умам (а так же всем, кто принимал участие в обсуждениях) низкий поклон и огромная благодарность.
Так же благодарность тов.
vnaum за то, что разыскал в дебрях документации к Блоггеру ссылку на возможность получить все посты Blogger с помощью скриптов на Python.

15 комментариев: | | RSS-лента дискуссии. |
Programmaster комментирует... 21 дек. 2009 г., 16:53:00

Любопытненько. Передо мной задача зеркалирования блога не вставала, но задумка интересная. Попробую-ка свой скопировать ради интереса…

Olly Cat комментирует... 21 дек. 2009 г., 20:31:00

Спасибо, очень интересно и познавательно. Надо подумать как теперь это дело использовать для переноса с одного блога на другой (давно хотел перенести свой старый ЖЖ в блогспот, да руки все не доходили).

Сергей комментирует... 21 дек. 2009 г., 22:41:00

Хотел заметить, что получить архив своего блога проще всего из панели управления — Настройки/Основные сведения/Инструменты блога/Экспорт блога. И получаем XML со всем-всем-всем. Хороший XML. Только данные (но в том числе и все настройки-стили), никакого генерируемого HTML.

У меня была мысль, что можно написать скрипт, формирующий по этому XML-архиву документ TeX, вестаемый автоматически для чтения оффлайн — под печать или e-book. Вроде ljbook или blurb, но лучше:-) Дарю идею.

vnaum комментирует... 23 дек. 2009 г., 00:23:00

Ну и мои две копейки:
http://code.google.com/apis/blogger/docs/1.0/developers_guide_python.html#RetrievingWithoutQuery

(python-gdata в дебиане есть)

virens комментирует... 23 дек. 2009 г., 01:59:00

@ Programmaster пишет...
Любопытненько. Передо мной задача зеркалирования блога не вставала, но задумка интересная.
Скоро встанет такая задача и перед тобой, когда постов будет за сотню. Не всегда есть подключение к интернету - вон в МИФИ вторую неделю интернета нету. Хотя он уж и не МИФИ, я нияу... но не суть.

@ Olly Cat пишет...
Надо подумать как теперь это дело использовать для переноса с одного блога на другой (давно хотел перенести свой старый ЖЖ в блогспот, да руки все не доходили).
Таким способом, думаю, вряд ли. Блогспот загружает один здоровенный XML-файл, но я без понятия, как его сформировать.

@ Сергей пишет...
Хотел заметить, что получить архив своего блога проще всего из панели управления — Настройки/Основные сведения/Инструменты блога/Экспорт блога. И получаем XML со всем-всем-всем.
О, а вот и оберфельдфебель Эвиденц в тред нагрянул! :-)) Извини, Сергей, не смог удержаться;-))

Хороший XML. Только данные (но в том числе и все настройки-стили), никакого генерируемого HTML.
Хорошая девочка Лида, а чем же она хороша?! :-)
Серьёзно, просмотреть его не получается. А раздавать этот файл всем - это у меня и так статьи тырят, а там просто двойники пойдут косяками.

У меня была мысль, что можно написать скрипт, формирующий по этому XML-архиву документ TeX, вестаемый автоматически для чтения оффлайн — под печать или e-book.
Ох ты ёлки-лампочки... Вот до чего хаскель-то доводит, мамочки, поди ж ты... :-)

@vnaum пишет...
Ну и мои две копейки
Это целый рубль, vnaum! Спасибо!

P.S. Прошу простить за немного ироничные ответы, т.к. писал весь день отчёты. После этого сильно пробивает на посмеяться:-)

Рассматриваемая в обзоре программа HTTrack Website Copier для загрузки сайта в наше время уже не настолько востребована, как раньше. В наше время высокая скорость и безлимитный Интернет позволяет просматривать любые сайты. А не так давно многим пользователям было удобнее скачать сайт целиком и просматривать его локальную копию на своём компьютере без подключения к Интернету. Однако во многих случаях, например, для изучения структуры сайта, утилита HTTrack Website Copier может пригодиться и сейчас. Программа позволяет загружать сайт в соответствии с заданными правилами и сохранять его локальное зеркало на нашем компьютере.

Перед тем, как начнётся скачивание сайта, необходимо создать в HTTrack Website Copier проект, где мы определим все параметры загрузки. Жмём кнопку [Далее] в окне программы.

В поле Имя нового проекта вводим название проекта, также указываем категорию и Каталог , где будет сохраняться загружаемая информация. Если проект уже был создан ранее, его можно выбрать в списке для продолжения загрузки или изменения параметров.

На следующем этапе потребуется указать адрес загружаемого сайта (или несколько ссылок), а также выбрать способ загрузки. HTTrack Website Copier поддерживает несколько способов: загрузка сайтов, загрузка отдельных файлов, всех сайтов с указанной страницы, тестирование ссылок со страницы, продолжение прерванной загрузки или обновление существующей закачки. Список загружаемых сайтов можно составить и сохранить в текстовой файл, после чего указать его в поле URL list (.txt) .

Кнопка [Задать параметры…] открывает массу дополнительных параметров загрузки сайта. Здесь можно указать прокси-сервер, каким браузером будет идентифицировать себя HTTrack Website Copier, определить нижний колонтитул на HTML-страницах, настроить параметры логов и кеширования. Кстати, в программе «кривой перевод», поэтому все пункты меню, где встретится слова «мода», его нужно рассматривать как «режим», например: «Мода сканирования» - «Режим сканирования».

Ещё несколько параметров рассмотрим подробнее. Вкладка Фильтры позволяет ограничить загрузку нежелательных типов файлов. Например, чтобы исключить мелкие картинки (баннеры, иконки, аватарки) формата GIF, можно ввести «-*.gif ». Для включения в загрузку определённых указываем маску со знаком +. Программа позволяет создавать и более гибкие правила, в том числе файлы или каталоги, в имени которых есть указанный текст, ссылки с указанных доменов, или содержащие указанный текст и т.д.

Вкладка Ограничения поможет настроить такие параметры, как Максимальная глубина , это количество уровней ссылок. Например, при значении, равном 2, HTTrack Website Copier скопирует главную страницу сайта и страницы, которые открываются по ссылкам с неё. Параметр Максимальная глубина внешних ограничивает уровень сканирования и закачки других сайтов, ссылки на которые могут быть на загружаемом сайте. Здесь же задаются ограничения на размер загружаемых html- и других страниц, максимальный размер сайта, время и скорость загрузки. Выбрать представление структуры загружаемого сайта можно во вкладке Структура .

По завершении настроек можно сразу запустить закачку сайта или отложить её на потом. Во время загрузки сайта отображается сканируемая страница или папка, а также скорость соединения, загрузки, размер сохранённой информации, количество просканированных и сохранённых страниц/каталогов. Прервать загрузку сайта в HTTrack Website Copier можно нажатием кнопки [Отмена] . Лог закачки поможет получить информацию о загруженных страницах и файлах.

Чтобы просмотреть загруженный сайт, жмём кнопку [Просмотр зеркала] , после чего локальная копия сайта загружается в браузере. Для этого даже не требуется подключение к интернету. Обратим внимание, все ссылки на сайте HTTrack Website Copier подменяет на локальные, благодаря чему возможна навигация по сайту:

Характеристики:
Язык интерфейса: русский, английский и др.
ОС: Windows 2000, XP, Vista, 7
Размер файла: 3,8 Мб
Лицензия: бесплатная

Занимаясь различными способами заработка в интернете, например, нередко требуется скопировать одностраничные сайты.

Зачем создавать лендинги, когда их можно позаимствовать? Сделать это не сложно, тем более уже созданы специальные программы для этого.

Как скопировать любой сайт? Сначала нужно скачать его на компьютер, а потом перенести на хостинг, предварительно внеся изменения (например, изменив ссылки).

Всего несколько минут уходит на это, если использовать Httrack website copier. Это бесплатная утилита, у которой есть русская версия.

Копирование сайта целиком

У Httrack website copier есть много аналогов, в большинстве своем они платные (например, Offline Explorer). Платить не надо, функционала этой программы хватает.

Скачивайте её с официального сайта (httrack), учитывая версию своей операционной системы.

Устанавливается она как любая другая программа, а после запуска нужно проделать следующие действия:

  1. Создавайте новый проект, имя указывайте произвольное. Категорию можно оставить пустой. Выбирайте папку, куда сохранятся данные и жмите далее:

  1. Дальше выбираете тип операции, оставляйте без изменения загрузку сайта и прописывайте адрес ресурса:

  1. На предыдущем шаге, перед нажатием «Далее», необходимо открыть «Задать параметры». Там открывайте вкладку с фильтрами, чтобы избавиться от весомых и ненужных файлов:

  1. Также зайдите на вкладку с ограничениями, чтобы указать, насколько далеко от указанной страницы нужно загружать сайт. Если это одностраничный сайт, настройки не трогайте:

  1. Если хотите, чтобы сайт загрузился максимально быстро, установите флажки на вкладке «Линки», как это показано на изображении:

  1. Последняя дополнительная настройка это выбор способа сохранения файлов. Выбирайте структуру сайта на вкладке «Структура»:

  1. Когда все параметры настроены, можно жать кнопку «ОК» и возвращаться к продолжению загрузки. Всё, что остается сделать, это оставить галочку на первом пункте и нажать «Готово»:

  1. Начнется процедура загрузки файлов, нужно дождаться, пока она закончится. Время зависит от объема данных:

  1. Теперь на вашем компьютере появится папка, в которой сохранены все данные копируемого сайта. Можете зайти в неё и открыть файл HTML в браузере, чтобы проверить, всё ли правильно отображается:

Последний шаг копирования сайта, это его перенос на хостинг. Там всё просто, копируете данные и привязываете заранее арендованный домен. Всё, можно ввести адрес сайта и проверить, всё ли получилось.

Программа Httrack website copier помогает, как сохранить страницу сайта, так и загрузить его полностью. С помощью этой простой утилиты, можно использовать любые красивые одностраничники и повышать конверсию, только не забывайте вносить изменения в код, как минимум, редактируя внешние ссылки.

Как скачать сайт целиком бесплатно? Этот вопрос мы обсудим в данной статье и обратим внимание на бесплатный оффлайн браузер — . WinHTTrack – это бесплатная программа для скачивания сайтов целиком.

Бывает время, когда, действительно, необходимо скачать какой-нибудь интересный сайт целиком.

Это может быть в случае, если у нас ноутбук или нетбук и мы собираемся куда-то поехать , где нет выхода в Интернет (допустим, на дачу, в поход, на море и т.п.). В данной ситуации, воспользовавшись программой для скачивания сайтов целиком, можно дома скачать любой сайт и затем читать его в любое время и в любом месте, без необходимости подключаться к Сети.

Или, например, у нас в основном медленный и дорогой Интернет , но есть возможность оплатить быстрый и безлимитный трафик на один день (или сходить со своим ноутбуком к другу, у которого есть безлимитный Интернет). Составили список необходимых сайтов, подключили на один день безлимитный тариф (или сходили к другу), скачали выбранные сайты целиком и всё, — дальше можно читать их уже без подключения к Интернет.

Также бывают ситуации, когда Интернет безлимитный, но медленный , и для того чтобы открывать новые страницы на каком-нибудь часто посещаемом нами сайте приходится тратить много времени. В таком случае, очень даже кстати возможность скачать сайт целиком, чтобы потом просматривать его страницы быстро, ведь файлы сайта будут находиться уже на нашем компьютере.

Чтобы скачать сайт целиком, в Сети существует на выбор несколько разных платных программ. Но, в согласии с тематикой моего сайта, мы рассмотрим: как скачать сайт целиком бесплатно , т.е. с помощью бесплатной программы.

Для этого мы будем использовать бесплатную программу для скачивания сайтов.

Как скачать

Для того, чтобы скачать программу для скачивания сайтов (самую последнюю ее версию), заходим на официальный сайт этой программы и в раделе загрузок скачиваем установочный файл. В большинстве случаев нужно скачать первый файл, как показано на снимке ниже. Но, Вы можете также выбрать другой установочный файл, если у Вас, операционная система не Windows, а Linux или Android:

Установка программы WinHTTrack Website Copier

Установка WinHTTrack начинается с приветственного окна, в котором просто жмем Next :

Указывается, какое будет название папки в меню Пуск для запуска WinHTTrack. Так же, здесь можно ничего не менять. Идем далее:

Оставляем всё, как предлагается по умолчанию, и жмем Next :

В следующем окне показываются выбранные параметры. Просто жмем Install для завершения установки. Появится следующее окно, в котором оставляем галочку на , если хотим запустить программу сразу же после установки. А другую галочку можно убрать (читать историю развития программы на английском, думаю, вряд ли кому-то будет интересно). Жмем Finish :

Запуск программы WinHTTrack Website Copier

Если оставили галочку на Launch WinHTTrack Website Copier , то программа запустится сразу же. В дальнейшем её можно будет запускать через меню Пуск, как будет показано ниже.

При первом запуске WinHTTrack Website Copier можно установить язык для интерфейса программы:

  1. Выбираем русский язык для WinHTTrack
  2. В появившемся окне, говорящем, что для изменения языка, нужно перезапустить программу, нажимаем ОК
  3. Нажимаем ОК там, где выбирали язык:

Изменить язык можно также через меню программы, как показано на снимке:

Закрываем программу WinHTTrack полностью, нажатием на крестик в правом верхнем углу, либо на кнопку Exit, расположенную посередине экрана программы:

Запускаем программу заново через меню Пуск -> Все программы -> Папка WinHTTrack -> , как показано на снимке:

Как скачать сайт целиком с помощью WinHTTrack

Процесс скачивания сайта целиком с помощью WinHTTrack я рассмотрю на примере своего сайта:

Запускаем WinHTTrack и посередине экрана программы нажимаем на кнопку Далее > :

В новом окне указываем Имя нового проекта , Категорию проекта (для дальнейшего упорядочивания сохраненных сайтов) и путь сохранения — Каталог (где на компьютере будут храниться сохраненные сайты), который при желании можно изменить. Жмем Далее:

Указываем Тип загрузки, добавляем адрес сайта и жмем Далее, чтобы скачать сайт полностью со всеми страницами и файлами, которые есть на этом сайте:

Причем у программы есть хорошая особенность, — можно в реальном времени наблюдать процесс скачивания сайта целиком и при этом пропускать скачивание любых ненужных файлов:

Это может быть полезно, когда мы видим, что качается какой-нибудь большой видео-файл или ненужная нам программа.

Но можно также изначально (перед скачиванием сайта) задать параметры по своему желанию, чтобы, например, заранее исключить скачивание того, что нам не нужно.

Такую настройку параметров давайте рассмотрим немного подробнее.

Как задать параметры WinHTTrack для скачивания сайта

Переходим во вкладку Задать параметры (снимок выше). Здесь нас будут интересовать особенно 3 вкладки:

А). Фильтры WinHTTrack для скачивания сайта

В данной вкладке можно дать задание программе: как при скачивании сайта поступать с некоторыми файлами.

Допустим, нам нужно скачать сайт целиком вместе со всеми картинками, но нам не нужны программы (файлы exe), архивы, а также видео и аудио, которые могут находиться на нем. В таком случае мы ставим на всех группах файлов галочки и меняем вручную значок + на для всех файлов, которые хотим исключить из закачки:

Как видим, вариантов для скачивания необходимой информации может быть много.

Б). Ограничения WinHTTrack для скачивания сайта

В этой вкладке можно настроить некоторые параметры, ограничивающие какие-либо функции. При наведении на каждую ячейку курсором мыши, появляется пояснение выбранного ограничения, поэтому можно посмотреть, что означает каждое из них:

Две из них, на мой взгляд, самые часто используемые:

Максимальный размер сайта. Полезно в случаях, когда мы хотим ограничить скачивания сайта, ведь мы не знаем, сколько там информации на самом деле, а место у нас на компьютере может быть ограничено. Поэтому сами решаем, сколько можем уделить места на своем компьютере для этого сайта.

Максимальное время закачки сайта. Полезно в случаях, когда мы куда-нибудь собираемся и выходить уже нужно через полчаса-час, а нам нужно срочно скачать какой-нибудь сайт в дорогу почитать без Интернета. И здесь можно указать время, через сколько прекратить закачку: сколько успели скачать – сколько и будет.

Остальные ограничения можете попробовать использовать самостоятельно, — они уже не так часто применимы и, может быть, не понадобятся никогда.

В). Линки WinHTTrack

Остальные вкладки дают дополнительные возможности, но основное, что нужно для того, чтобы скачать сайт целиком, я описал в этой заметке. Начинающему пользователю, думаю, на остальное можно не обращать особого внимания.

Вот и всё! Осталось нажать на кнопку Готово :

И после закачки сайта можно переходить к его просмотру.

Чтобы просматривать скачанные сайты, в левой части окна программы находим на своем компьютере папку с сохраненными сайтами и нажимаем на файл index.html , как показано на снимке:

В браузере откроется страница с меню, с помощью которого можно запускать и просматривать все скачанные сайты:

Нажимаем на любой из сохраненных сайтов и радуемся быстрому просмотру!

Еще полезные функции WinHTTrack

Также при использовании WinHTTrack Website Copier для скачивания сайтов можно воспользоваться некоторыми полезными функциями этой программы. В типе загрузки сайта можно выбрать, что нам требуется от сайта.

Например, мы можем загрузить только отдельные файлы (только картинки, архивы или программы), указав расширения необходимых файлов через настройки параметров. Также мы можем продолжить загрузку (если вдруг Интернет отключился), или обновить закачку (если хотим дополнить информацию скачанного когда-то сайта):

Вывод: – это хорошая бесплатная программа для скачивания сайтов, которая дает возможность скачать сайт целиком , а с помощью фильтров и ограничений позволяет делать процесс скачивания сайта удобным и разнообразным.