Тематическое исследование науки о данных: EDA по науке о тайнах

EDA с использованием инструментов Data Science: Python, визуализация данных, машинное обучение, статистические тесты и логические выводы, инструмент Custom Build ML и многое другое!

Что такое загадочная наука?

Суть вышеизложенного представляет собой исчерпывающий анализ данных Mystery Science (MS). MS — это стартап из Сан-Франциско, который работает над улучшением учебной программы K-5 в США и во всем мире.

Что в блокноте?

Блокнот демонстрирует типичный рабочий процесс EDA на отраслевых данных. Такие инструменты, как визуализация данных, машинное обучение и статистика, объединены для обеспечения тщательного анализа и ответа на некоторые важные для бизнеса вопросы.

Почему это должно волновать читателя?

Если вы заинтересованы в том, чтобы научиться:

  • Комплексно используйте набор инструментов для обработки и анализа данных
  • Узнайте об ошибках данных и модели с помощью итеративного построения моделирования
  • Feature Engineer нужные функции
  • Напишите эффективный код для рабочих процессов EDA

Тогда вам будет полезно прочитать этот блокнот!

об авторе

Александр — специалист по данным из Беркли, Калифорния. Ему нравится учиться, преподавать и применять науку о данных как в качестве специалиста по данным в промышленности, так и в рамках увлеченных проектов.

Вы можете ознакомиться с его работами на Github и LinkedIn.