Изображения являются ценным ресурсом для маркетологов, дизайнеров и всех, кому необходимо создать библиотеку визуальных ресурсов. Однако поиск и загрузка изображений с веб-сайта может занять много времени. Веб-скрапинг предлагает решение, автоматизируя процесс извлечения изображений. В этом уроке мы покажем вам, как собирать изображения с веб-сайта с помощью JavaScript и библиотеки Cheerio.
Шаг 1: Установите Cheerio
Первый шаг — установить Cheerio в ваш проект Node.js. Откройте терминал и выполните следующую команду:
npm установить приветствие
Шаг 2: Загрузите HTML
Далее нам нужно загрузить HTML-код с веб-сайта, который мы хотим очистить. Мы можем использовать встроенный HTTP-модуль Node.js, чтобы сделать запрос на веб-сайт и получить ответ в формате HTML. Вот пример:
const https = require('https');
const cheerio = require('cheerio');
постоянный URL = 'https://example.com';
https.get(url, (ответ) =› {
let data = '';
response.on('data', (chunk) =› {
data += chunk;
});
response.on('end', () =› {
const $ = cheerio.load(data);
константные изображения = [];
$('img').each((index, element) =› {
images.push($(element).attr('src'));
});
console.log(изображения);
});
});
Этот код отправляет запрос GET на сайт example.com и записывает в консоль массив URL-адресов изображений.
Шаг 3: Загрузите изображения
С URL-адресами изображений мы можем использовать встроенный API-интерфейс JavaScript для загрузки изображений. Вот пример:
const https = require('https');
const cheerio = require('cheerio');
const fs = require('fs');
постоянный URL = 'https://example.com';
https.get(url, (ответ) =› {
let data = '';
response.on('data', (chunk) =› {
data += chunk;
});
response.on('end', () =› {
const $ = cheerio.load(data);
$('img').each((index, element) =› {
const imageUrl = $(element).attr('src');
const imageName = imageUrl.substring(imageUrl.lastIndexOf ('/') + 1);
https.get(imageUrl, (response) =› {
response.pipe (fs.createWriteStream (imageName));
});
});
}); });
Этот код загружает HTML в Cheerio и выбирает все элементы img. Затем он перебирает каждый элемент img, извлекает атрибут src (который содержит URL-адрес изображения) и загружает изображение с помощью API-интерфейса fetch. Он сохраняет изображение в текущем каталоге с тем же именем, что и исходное изображение.
Извлечение изображений с веб-сайта может сэкономить ваше время и усилия, а также помочь вам создать мощную базу данных изображений. С помощью шагов, описанных в этом руководстве, вы можете извлекать изображения с любого веб-сайта с помощью JavaScript и Cheerio. Автоматизировав процесс извлечения и загрузки изображений, вы можете сосредоточиться на анализе и использовании изображений для достижения своих целей.