Можно ли указать тип содержимого файла для загрузки с помощью Wget?

Я хочу использовать wget для загрузки файлов, связанных с главной страницы веб-сайта, но я хочу загружать только текстовые/html-файлы. Можно ли ограничить wget текстовыми/html файлами на основе типа содержимого mime?


person T. Brian Jones    schedule 17.07.2011    source источник


Ответы (2)


Я не думаю, что они реализовали это еще. Поскольку он все еще находится в списке ошибок.

http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=21148

Возможно, вам придется делать все по расширению файла

person rissicay    schedule 17.07.2011

Wget2 имеет эту функцию.

--filter-mime-type    Specify a list of mime types to be saved or ignored`

### `--filter-mime-type=list`

Specify a comma-separated list of MIME types that will be downloaded.  Elements of list may contain wildcards.
If a MIME type starts with the character '!' it won't be downloaded, this is useful when trying to download
something with exceptions. For example, download everything except images:

  wget2 -r https://<site>/<document> --filter-mime-type=*,\!image/*

It is also useful to download files that are compatible with an application of your system. For instance,
download every file that is compatible with LibreOffice Writer from a website using the recursive mode:

  wget2 -r https://<site>/<document> --filter-mime-type=$(sed -r '/^MimeType=/!d;s/^MimeType=//;s/;/,/g' /usr/share/applications/libreoffice-writer.desktop)

Wget2 еще не выпущен на сегодняшний день, но скоро будет. Нестабильный Debian уже имеет альфа-версию.

Дополнительную информацию см. на странице https://gitlab.com/gnuwget/wget2. Вы можете отправлять вопросы/комментарии непосредственно на адрес [email protected].

person rockdaboot    schedule 14.11.2018