Знакомство с BeautifulSoup4 и запросами
Если вы работаете со всем миром парсинга, вы должны много слышать о запросахиBeautifulsoup4. Если не? Тогда эта статья точно для вас.
Запросы
Запросы — это проект, в настоящее время поддерживаемый CERT Gouvernemental — GOVCERT.LU. Они называют ее элегантной и простой HTTP-библиотекой для Python, созданной для людей. . Мы должны поблагодарить создателя, который поддерживает этот проект, потому что с этим модулем нам не нужно иметь дело со сложным кодом только для того, чтобы просмотретьданные какой-либо веб-страницы. При использовании модуля requests это больше похоже на ввод чего-то в браузере, и данные просто появляются. Так просто.
Таким образом, мы используем модуль requests для получения нужных нам данных с веб-страницы. Вы можете найти домашнюю страницу здесь:
Вы также можете проверить это на PyPi.org
Чтобы установить этот пакет, откройте терминал и введите этот код:
pip install requests
Красивый суп4
Beautifulsoup4 играет важную роль в области парсинга. Это экономит программистам часы или дни работы. Он предназначен для быстрых проектов, таких как очистка экрана. Этот метод больше похож на Python и выполняет автоматическое кодирование документов. Beautifulsoup4 может разобрать все, что вы ему дадите. Вы можете сказать ему: «Найти все ссылки», или «Найти все ссылки класса externalLink», или «Найти все ссылки, URL-адреса которых совпадают с «doge.com», или «Найти заголовок таблицы, выделенный жирным шрифтом, а затем дать мне этот текст все возможно.
Домашняя страница проекта здесь:
А вот на PyPi:
Чтобы установить этот пакет, откройте терминал и введите этот код:
pip install beautifulsoup4
С помощью Requests вы получаете веб-данные, с помощью Beautifulsoup4 вы извлекаете данные в желаемом формате. Какое идеальное сочетание!
В следующей статье я объясню, как мы можем использовать эти два модуля, чтобы получать данные о популярных новостях с сайта Kumparan.com. А пока до встречи в следующих историях.
Больше контента на plainenglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Получите эксклюзивный доступ к возможностям написания и советам в нашем сообществе Discord.