Публикации по теме 'puppeteer'


Программный рендеринг PDF-файлов из HTML с использованием Chrome и Puppeteer
Программный рендеринг PDF-файлов из HTML с использованием Chrome и Puppeteer Я давно работаю веб-разработчиком, и мне постоянно приходит в голову идея превратить HTML в PDF. Это довольно естественная просьба; HTML — это хороший формат, ориентированный на отображение, и он имеет отличные возможности макета и стиля. Кроме того, для веб-приложения у меня, вероятно, уже есть код, написанный для создания именно того контента, который мне нужен. Мне просто нужно превратить этот контент в..

Вот способ исправить часть кода парсера и улучшить качество кода.
И почему XPaths упростил код по сравнению с селекторами CSS Код среднего скребка недействителен: Код парсера для части Medium не работает, потому что используемые селекторы CSS недостаточно точны / не нацелены на нужные нужные узлы HTML. Действительно, извлеченные заголовки статей Medium не соответствуют ссылкам на связанные статьи Medium. Его можно легко протестировать и проверить прямо в консоли предпочитаемого вами веб-браузера, введя и выполнив соответствующий код Javascript:..

Как укротить нумерацию страниц с помощью Puppeteer: практическое руководство по парсингу продуктов Amazon
Эй, ребята! Если вы следите за моим блогом, возможно, вы помните наш последний опыт парсинга веб-страниц с помощью Node.js и Puppeteer. В этой статье мы рассмотрели, как извлекать информацию из огромного каталога продуктов Amazon. Если вы еще не проверили его, я рекомендую быстро прочитать его здесь . В духе преемственности сегодня мы повысим наши навыки парсинга веб-страниц и решим новую задачу — работу с нумерацией страниц. Если вы когда-либо пытались получить данные с веб-сайта с..

Набрал более 100 000 очков в игре Google Dino.
Ultimate Google Dino Game Hack: набрать более 100 000 очков с помощью Node.js и Puppeteer. Кроме того, есть настоящий трюк, чтобы набрать 1М+ за несколько секунд 😉 . Вы когда-нибудь ловили себя на том, что бесконечно играете в игру Google Chrome Dino только для того, чтобы разочароваться из-за низкого балла? Я знаю это чувство. Как разработчик, я был полон решимости найти способ освоить эту простую, но захватывающую игру, используя свои навыки программирования. И я это сделал — я..

Подробное руководство по сканированию SPA с Puppeteer и поиску и устранению неисправностей
Веб-сайты эволюционировали от статических до современных приложений SPA, и с этими изменениями задачи SEO и веб-сканирования стали немного сложнее, поскольку вы не можете получить всю информацию из исходного html-документа. Здесь я поделюсь некоторыми руководствами о том, как сканировать веб-сайт, похожий на SPA, с помощью кукловода . В предыдущем посте я рассказал, как использовать существующий сервис, такой как prerender , для улучшения SEO для приложений SPA, но здесь мы..

Служба тестирования
Служба тестирования Рассмотрев архитектуру и реализацию нашего приложения динамического сервис-воркера« Woz в первой части этой серии», в этом посте будет рассказано, какой подход мы приняли к написанию тестов для него. Service Workers - мощный инструмент, но как только неисправный Service Worker установлен и активирован в браузере пользователя, все может запутаться. Более того, Service Workers, как известно, трудно отлаживать , что может вызвать головные боли и разочарование ...

Удаление содержимого одностраничного приложения (SPA) с помощью Chrome без головы и кукловода
TL;DR Все примеры кода из этой статьи вы можете найти в репозитории GitHub https://github.com/AndrejsAbrickis/axios-cheerio-puppeteer Axios и cheerio - отличный набор инструментов для извлечения и очистки содержимого статической веб-страницы. Но в настоящее время, когда многие веб-сайты построены как одностраничные приложения и динамически отображаются на клиенте, может оказаться невозможным получить контент. Тот факт, что он отображается асинхронно и содержимое не копируется в..