Изображения являются ценным ресурсом для маркетологов, дизайнеров и всех, кому необходимо создать библиотеку визуальных ресурсов. Однако поиск и загрузка изображений с веб-сайта может занять много времени. Веб-скрапинг предлагает решение, автоматизируя процесс извлечения изображений. В этом уроке мы покажем вам, как собирать изображения с веб-сайта с помощью JavaScript и библиотеки Cheerio.

Шаг 1: Установите Cheerio

Первый шаг — установить Cheerio в ваш проект Node.js. Откройте терминал и выполните следующую команду:

npm установить приветствие

Шаг 2: Загрузите HTML

Далее нам нужно загрузить HTML-код с веб-сайта, который мы хотим очистить. Мы можем использовать встроенный HTTP-модуль Node.js, чтобы сделать запрос на веб-сайт и получить ответ в формате HTML. Вот пример:

const https = require('https');
const cheerio = require('cheerio');

постоянный URL = 'https://example.com';

https.get(url, (ответ) =› {
let data = '';

response.on('data', (chunk) =› {
data += chunk;
});

response.on('end', () =› {
const $ = cheerio.load(data);

константные изображения = [];

$('img').each((index, element) =› {
images.push($(element).attr('src'));
});

console.log(изображения);
});
});

Этот код отправляет запрос GET на сайт example.com и записывает в консоль массив URL-адресов изображений.

Шаг 3: Загрузите изображения

С URL-адресами изображений мы можем использовать встроенный API-интерфейс JavaScript для загрузки изображений. Вот пример:

const https = require('https');
const cheerio = require('cheerio');
const fs = require('fs');

постоянный URL = 'https://example.com';

https.get(url, (ответ) =› {
let data = '';

response.on('data', (chunk) =› {
data += chunk;
});

response.on('end', () =› {
const $ = cheerio.load(data);

$('img').each((index, element) =› {
const imageUrl = $(element).attr('src');
const imageName = imageUrl.substring(imageUrl.lastIndexOf ('/') + 1);

https.get(imageUrl, (response) =› {
response.pipe (fs.createWriteStream (imageName));
});
});
}); });

Этот код загружает HTML в Cheerio и выбирает все элементы img. Затем он перебирает каждый элемент img, извлекает атрибут src (который содержит URL-адрес изображения) и загружает изображение с помощью API-интерфейса fetch. Он сохраняет изображение в текущем каталоге с тем же именем, что и исходное изображение.

Извлечение изображений с веб-сайта может сэкономить ваше время и усилия, а также помочь вам создать мощную базу данных изображений. С помощью шагов, описанных в этом руководстве, вы можете извлекать изображения с любого веб-сайта с помощью JavaScript и Cheerio. Автоматизировав процесс извлечения и загрузки изображений, вы можете сосредоточиться на анализе и использовании изображений для достижения своих целей.