Я пройдусь по всем необходимым и важным функциям и методам и покажу на одном примере

Я использую JupyterLab для пошагового объяснения примера, очень похожего на Jupyter Notebook. Вы также можете использовать терминал в Linux и шпатлевку в случае операционной системы Windows.

  1. Импортируйте библиотеку Pandas и прочитайте данные из доступного формата (excel/csv/tsv/json/etc.)

2. Напечатайте головку набора данных, чтобы увидеть, как он выглядит (имена столбцов/значения/и т. д.).

3. Проверьте, сколько строк и столбцов в наших данных.

4. Количество пропущенных значений в наборе данных

5. Проверьте, сколько уникальных значений содержит каждый столбец.

6. Посмотрите на сводку набора данных

7. Вы также можете увидеть номер каждой категории в определенном столбце.

Это все, что касается исследования данных, в следующем я расскажу о визуализации данных.

Хотел углубиться: https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html