В этой статье API не используется, мы собираемся парсить сайт (https://www.worldometers.info/coronavirus/). Таким образом, у него нет ограничений на использование, и вы можете использовать его в других своих проектах.
Сначала давайте импортируем некоторые библиотеки.
from bs4 import BeautifulSoup import requests
Теперь давайте создадим наш базовый URL-адрес, получим HTML-код страницы, которую мы хотим очистить, и создадим объект beautyfulsoup.
Теперь давайте создадим класс, чтобы выполнить над ним некоторые функции. Мы собираемся создать функцию, которая находит страну с наибольшим количеством случаев коронавируса, находит общее количество случаев, смертей и выздоровлений в определенной стране.
Теперь давайте создадим функцию для поиска страны с наибольшим количеством случаев.
Как вы можете видеть на этом изображении, названия стран находятся в классе с именем mt_a
. Поэтому я нахожу их все. Поскольку страна с наибольшим количеством случаев является первой страной, порядок найти легко.
И одна функция выполнена.
Теперь давайте сделаем функцию для поиска смертей, случаев и выздоровлений в определенной стране. Базовый URL отличается, поэтому нам нужно создать новую переменную URL.
Как вы можете видеть это фото. значение относится к классу maincourt-number
. Итак, мы сначала находим этот класс на всей странице, после этого мы находим класс maincourt-number
и, наконец, находим значение диапазона и возвращаем его. Это вернет нам весь диапазон на веб-сайте, это означает, что он даст нам списки.