Запуск анализа данных с помощью Python Pandas

На прошлой неделе я с удовольствием провел часть времени, изучая основы науки о данных в Udacity. Чтобы получить максимальную отдачу от этого, я предложил написать серию сообщений в блоге, чтобы обобщить то, что я узнал. В задачи этих постов не входит ни обсуждение того, почему наука о данных/машинное обучение/большие данные/и т. д. так модны и важны в наши дни, ни открытие новой дискуссии о том, что является лучшей платформой МООК.

Сказав это, давайте начнем веселье.

Прежде всего, не забывайте, что числа не всегда являются тем, чем кажутся. Найдите время, чтобы прочитать и понять парадокс Симпсона. Теперь, когда вы знаете, насколько злы числа, давайте начнем манипулировать ими.

Первоначально опубликовано на andresestevez.blogspot.com.