Вопросы по теме 'cheerio'

как очистить контент от разрыва строки на веб-страницах с помощью Cheerio
Добрый день всем. У меня 2 вопроса по веб-парсингу с помощью Cheerio. Я просмотрел вопросы, на которые мог быть мой ответ, но не смог найти тот, который отвечал бы на мой вопрос, поэтому решил задать вопрос. Справочная информация: Я изучаю...
1652 просмотров

Листовые узлы поиска регулярных выражений плохо отформатированного HTML с использованием Cheerio
У меня есть плохо отформатированный HTML (например, приведенный ниже), и я хочу получить конечные узлы (без дополнительных дочерних элементов), текст которых соответствует заданному регулярному выражению: <html> <head>...
1196 просмотров
schedule 02.11.2022

узел js приветствие xml
У меня есть приведенный ниже код, и он отлично работает, чтобы получить: <troveUrl>http://trove.nla.gov.au/work/23043869</troveUrl> Но я хотел бы получить значение после «id» на той же странице и не могу его получить!...
9197 просмотров
schedule 05.06.2022

Запрос объекта getElementInfo в CasperJS
Я использую casperjs, и я дошел до того, что у меня есть такой объект: var domElem = this.getElementInfo(".foo"); И теперь я хочу запросить domElem дальше, например: var domElemChild = domElem.QUERYFUNCTIONHERE(".bar"); Я не могу...
742 просмотров
schedule 13.02.2023

Неперехваченная ошибка: не удается найти модуль «cheerio» Nodewebkit
Я пытаюсь разработать приложение node webkit и пытаюсь использовать библиотеку cheerio. Я импортировал его с помощью var cheerio = require("cheerio"); Однако, когда я запускаю программу, я получаю следующую ошибку: Uncaught Error: Cannot...
1181 просмотров
schedule 27.08.2022

Веб-скрапинг с сайта с живым счетом
Я пытаюсь получить данные с сайта с результатами в реальном времени. Я использую node.js с express.js, request.js и cheerio.js, чтобы получить HTML с веб-страницы. Это работает для некоторых частей HTML, но не для активных частей. Я пытаюсь...
3381 просмотров

Как получить доступ к DOM с помощью Node.js?
У меня есть editor.html , который содержит функцию generatePNG : <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>Diagram</title> <script type="text/javascript"...
17409 просмотров
schedule 19.06.2023

очищать страницы с динамическим контентом с помощью node.js?
Я видел этот вопрос: Как я могу очищать страницы с динамическим содержимым с помощью node.js? Я пытаюсь сделать то же самое с немного большей сложностью. Существует веб-сайт, который загружает динамический контент точно так же, но после...
1059 просмотров
schedule 05.05.2022

извлечение текста из элементов HTML с помощью Cheerio
Используя cheerio, $ определяется как объект cheerio, я пытаюсь получить текст из некоторых элементов, которые имеют класс forceWordWrap в html. Следующие селекторы Cheerio ничего не возвращают. Что я делаю неправильно? Спасибо const...
1022 просмотров
schedule 11.01.2023

Как очистить страницы с помощью Node.js
Я пытаюсь очистить веб-сайт, но не могу получить результаты для записи в файл HTML. Я использовал cheerio в node.js, и мой код ниже. var http = require('http'); var path = require('path'); var request = require('request'); var cheerio =...
460 просмотров
schedule 19.09.2022

Как мне манипулировать данными на веб-странице из node.js
Я новичок в node.js и Javascript, поэтому простите меня, если вопрос плохо сформулирован. Я использую cheeriojs для сбора данных с сайта. Я запускаю файл js, который очищает данные в командной строке и выводит нужные мне данные, но я хочу иметь...
1073 просмотров
schedule 07.03.2023

Асинхронный двойной обратный вызов в цикле NodeJS
Сегодня я перехожу к следующему шагу моего вебскреба! Я уже зацикливаюсь на массиве URL-адресов с async , и я бы снова зациклился на этом обратном вызове и дождался его выполнения перед перезапуском. Я не могу понять, как использовать два...
164 просмотров

Как я могу получить селекторы CSS для элемента по значению в NodeJS?
Я пишу веб-скребок с Node и рассматриваю возможность использования модуля, такого как Cheerio или JSDom, для анализа HTML в DOM для набора URL-адресов. Однако у меня есть конкретная функциональность, которая необходима. Моя цель — создать парсер,...
1518 просмотров

Собрать повторяющийся HTML в массив JSON с помощью Node
Я практикую очистку и пытаюсь очистить список агентов в массиве JSON. Мой код в настоящее время очищает последнего человека только 4 раза. Мне интересно, как перебирать каждый класс, который повторяется. var express = require('express'); var fs...
384 просмотров
schedule 14.07.2023

Как я могу получить исходный код изображения, заголовок и описание из этого html с помощью cheerio?
Я пытаюсь извлечь некоторый контент с веб-сайта, используя nodejs с cheerio. Я хочу извлечь следующее содержимое: Текст «Это мой пример текста заголовка». «Здесь будет текст моего описания». Источник изображения. Вот html:...
3068 просмотров
schedule 20.08.2022

Сокращение избыточности с помощью NodeJS и Cheerio
Мне просто интересно, как бы я уменьшил избыточность в этих двух парсерах, так как я не хочу, чтобы он дважды запрашивал веб-сайт. Я новичок в этом и не очень хорошо знаком с синтаксисом. Вот фрагмент кода: request(website_url,...
138 просмотров
schedule 08.07.2022

почему .forEach() действует асинхронно? - node.js
Я пытаюсь получить некоторую информацию с веб-страницы, используя request , чтобы получить страницу, а затем cheerio , чтобы пройти DOM к определенной части, которая мне нужна. Я повторяю этот процесс для нескольких элементов в массиве, используя...
552 просмотров
schedule 19.09.2022

Выберите узел с его дочерними элементами на основе его класса и превратите его в объект
Я хочу узнать, как очистить данные веб-сайта. Это интересующая меня часть html. Я использую cheerio для поиска данных, которые я нужно. <td class="col-item-shopdetail"> <div class="shoprate2 text-right hidden-xs">...
38 просмотров
schedule 21.11.2022

извлекать данные из таблицы html в почтовый запрос nodejs
Я заполняю html-таблицу данными из базы данных (электронные письма пользователей и их роли в моей системе (админы и пользователи)). router.get('/adminOffice', function(req, res){ database.connection.query("select email, role from users",...
2319 просмотров
schedule 19.01.2023

функция cheerio each() ведет себя странно
У меня есть код, который удаляет определенную страницу из Интернета. Для этого я использую puppeteer+cheerio. На моем ноутбуке код работает отлично. Но после развертывания на VDS селектор cheerio each() начал странно работать. (Но он все еще...
241 просмотров