Я пройдусь по всем необходимым и важным функциям и методам и покажу на одном примере
Я использую JupyterLab для пошагового объяснения примера, очень похожего на Jupyter Notebook. Вы также можете использовать терминал в Linux и шпатлевку в случае операционной системы Windows.
- Импортируйте библиотеку Pandas и прочитайте данные из доступного формата (excel/csv/tsv/json/etc.)
2. Напечатайте головку набора данных, чтобы увидеть, как он выглядит (имена столбцов/значения/и т. д.).
3. Проверьте, сколько строк и столбцов в наших данных.
4. Количество пропущенных значений в наборе данных
5. Проверьте, сколько уникальных значений содержит каждый столбец.
6. Посмотрите на сводку набора данных
7. Вы также можете увидеть номер каждой категории в определенном столбце.
Это все, что касается исследования данных, в следующем я расскажу о визуализации данных.
Хотел углубиться: https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html