Знакомство с BeautifulSoup4 и запросами

Если вы работаете со всем миром парсинга, вы должны много слышать о запросахиBeautifulsoup4. Если не? Тогда эта статья точно для вас.

Запросы

Запросы — это проект, в настоящее время поддерживаемый CERT Gouvernemental — GOVCERT.LU. Они называют ее элегантной и простой HTTP-библиотекой для Python, созданной для людей. . Мы должны поблагодарить создателя, который поддерживает этот проект, потому что с этим модулем нам не нужно иметь дело со сложным кодом только для того, чтобы просмотретьданные какой-либо веб-страницы. При использовании модуля requests это больше похоже на ввод чего-то в браузере, и данные просто появляются. Так просто.

Таким образом, мы используем модуль requests для получения нужных нам данных с веб-страницы. Вы можете найти домашнюю страницу здесь:



Вы также можете проверить это на PyPi.org



Чтобы установить этот пакет, откройте терминал и введите этот код:

pip install requests

Красивый суп4

Beautifulsoup4 играет важную роль в области парсинга. Это экономит программистам часы или дни работы. Он предназначен для быстрых проектов, таких как очистка экрана. Этот метод больше похож на Python и выполняет автоматическое кодирование документов. Beautifulsoup4 может разобрать все, что вы ему дадите. Вы можете сказать ему: «Найти все ссылки», или «Найти все ссылки класса externalLink», или «Найти все ссылки, URL-адреса которых совпадают с «doge.com», или «Найти заголовок таблицы, выделенный жирным шрифтом, а затем дать мне этот текст все возможно.

Домашняя страница проекта здесь:



А вот на PyPi:



Чтобы установить этот пакет, откройте терминал и введите этот код:

pip install beautifulsoup4

С помощью Requests вы получаете веб-данные, с помощью Beautifulsoup4 вы извлекаете данные в желаемом формате. Какое идеальное сочетание!

В следующей статье я объясню, как мы можем использовать эти два модуля, чтобы получать данные о популярных новостях с сайта Kumparan.com. А пока до встречи в следующих историях.

Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.