Как скачать сайт целиком в Ubuntu

Если вам нужно загрузить интересующий вас сайт целиком в Ubuntu, вам очень повезло. Нет необходимости скачивать громозкое (часто платное) программное обеспечение, как в Windows, нужные инструменты уже установлены в системе. Вам поможет утилита wget.

Вот пример загрузки сайта с помощью wget:

$ wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains goubuntu.ru \
     --no-parent \
         www.goubuntu.ru/category/%d1%81%d0%be%d1%84%d1%82

Эта команда позволит вам сохранить полную копию раздела Софт нашего сайта на ваш компьютер.

Давайте разберем параметры:

  • —recursive: рекурсивно скачивает весь сайт.
  • —domains goubuntu.ru: не переходит по внешним ссылкам за пределами сайта goubuntu.ru.
  • —no-parent: не переходит по ссылкам внешних каталогов, т.е. в другие разделы сайта.
  • —page-requisites: скачивает все элементы, составляющие страницу (изображения, таблицы стилей CSS и т.п.).
  • —html-extension: сохраняет файлы с расширением .html.
  • —convert-links: преобразовывает ссылки таким образом, чтобы с ними можно было работать локально, даже при отсутствии подключения к сети.
  • —restrict-file-names=windows: изменяет имена файлов таким образом, чтобы они работали также в операционной системе Windows.
  • —no-clobber: не перезаписывать существующие файлы (используется в случае, если вы остановили, а затем возобновили загрузку).

Добавить комментарий

Ваш адрес email не будет опубликован.

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.