Я хочу использовать wget для загрузки файлов, связанных с главной страницы веб-сайта, но я хочу загружать только текстовые/html-файлы. Можно ли ограничить wget текстовыми/html файлами на основе типа содержимого mime?
Можно ли указать тип содержимого файла для загрузки с помощью Wget?
Ответы (2)
Я не думаю, что они реализовали это еще. Поскольку он все еще находится в списке ошибок.
http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=21148
Возможно, вам придется делать все по расширению файла
person
rissicay
schedule
17.07.2011
Wget2 имеет эту функцию.
--filter-mime-type Specify a list of mime types to be saved or ignored`
### `--filter-mime-type=list`
Specify a comma-separated list of MIME types that will be downloaded. Elements of list may contain wildcards.
If a MIME type starts with the character '!' it won't be downloaded, this is useful when trying to download
something with exceptions. For example, download everything except images:
wget2 -r https://<site>/<document> --filter-mime-type=*,\!image/*
It is also useful to download files that are compatible with an application of your system. For instance,
download every file that is compatible with LibreOffice Writer from a website using the recursive mode:
wget2 -r https://<site>/<document> --filter-mime-type=$(sed -r '/^MimeType=/!d;s/^MimeType=//;s/;/,/g' /usr/share/applications/libreoffice-writer.desktop)
Wget2 еще не выпущен на сегодняшний день, но скоро будет. Нестабильный Debian уже имеет альфа-версию.
Дополнительную информацию см. на странице https://gitlab.com/gnuwget/wget2. Вы можете отправлять вопросы/комментарии непосредственно на адрес [email protected].
person
rockdaboot
schedule
14.11.2018