Вопросы по теме 'scrapy-shell'

Бот Scrapy и оболочка возвращают разные результаты с одним и тем же запросом xpath. Почему?
Когда я выполняю один и тот же запрос xpath в бот-боте и в оболочке scrapy, я получаю разные результаты. Примечание. Я просто пытаюсь изучить scrapy и поэтому модифицирую часть кода учебника. Пожалуйста, иди со мной медленно. Запрос:...
476 просмотров
schedule 25.12.2022

как очистить названия продуктов с веб-сайта с помощью scrapy shell
Пожалуйста, помогите мне очистить названия продуктов по этой ссылке: http://www.gap.com/browse/category.do?cid=5168&scrollTo=product353401012&scrollTo=product353401012#pageId=0&department=75 Названия продуктов содержатся в...
297 просмотров
schedule 04.06.2023

Robots.txt и Разрешить?
Итак, я новичок в веб-сканировании, и у меня возникли проблемы с пониманием конкретного файла robots.txt. В данном случае это то, что есть на сайте: User-agent: * Allow: / Sitemap: sitemapURLHere Поэтому я искал / здесь и нашел его....
543 просмотров

Вызвать пользовательский экспортер scrapy с помощью командной строки
При попытке решить мою проблему (вывести упорядоченный Json по полю определенного элемента), я получил ответ , который предлагает мне создать собственный экспортер для задания . Я создаю его, но... все примеры, которые я нашел, предлагают...
103 просмотров

Включить для выбора элемента с помощью оболочки Scrapy
Я пытаюсь распечатать все названия продуктов этого сайта с помощью оболочки scrapy: ' https://www.woolworths.com.au/shop/browse/drinks/cordials-juices-iced-teas/iced-teas ' Как только он открыт, я начинаю получать:...
26 просмотров

Код состояния Scrapy HTTP не обрабатывается или не разрешен
Я пытаюсь очистить все данные об обуви с этого https://www.matchesfashion.com/intl/mens/shop/shoes?page=1 URL для перехода к следующим кнопкам до страницы 7. Но когда я пытаюсь это сделать, я получаю, что код состояния HTTP не обрабатывается или не...
167 просмотров
schedule 05.12.2022

получить ответ https от оболочки scrapy
У меня есть паук, который получает файлы cookie с сайта на первых нескольких шагах. Я хотел бы получить файлы cookie, начать очистку, и если статус HTTP текущего запроса == 302, я хочу вернуться к части файлов cookie, чтобы обновить их. Как я могу...
21 просмотров