Манифест данных: почему наука о данных имеет значение?

Наука о данных важна. Черт возьми, это достаточно важно, чтобы многие генеральные директора теперь спрашивают своих финансовых директоров или директоров по маркетингу: «Занимаемся ли мы какими-либо большими данными?» И достаточно часто, что даже моя мама знает, что я работаю в «науке о данных».

Большинство из нас читали по крайней мере одну историю о компаниях, которые использовали науку о данных для предсказания будущего, революционизировали свой бизнес или даже подорвали отрасль. Хотя некоторые знают, что специалисты по данным «создают модели», «кодируют» и «делают прогнозы», вряд ли кто-то знает, что это означает или чем на самом деле занимаются специалисты по данным.

Ответ в том, что мы, специалисты по данным, находим закономерности в событиях.

Почему так важно найти закономерность? Представьте себе мир, в котором большинство людей может описать мир, а некоторые обладают навыками видеть связи между ними.

Первая группа видит, что после проливных дождей русла рек разливаются, и людям приходится укрываться на возвышенностях. Опишите это как:

Происходит потоп - ›Люди бегут -› Перейти на возвышенность

Вторая группа замечает, что в то время как наводнения приносят страдания, в поймах, как правило, будет больше сельскохозяйственной продукции в следующем году.

Происходит наводнение - ›Поймы производят больше еды в следующем году

Вторая группа - это люди, чьи навыки в конечном итоге станут известны науке о данных. Короче говоря, поиск закономерностей приводит к пониманию взаимосвязей между событиями и прогнозами, которые могут привести к решению проблемы или поиску нового ресурса («продуктивные поймы») для улучшения жизни.

Люди хорошо умеют находить закономерности, поскольку от этого зависело наше выживание и прогресс в раннем возрасте. Если бы вы были одним из первых охотников-собирателей, ваше благополучие зависело от поиска закономерностей в миграционных маршрутах диких животных («больше еды») или от того, что вы увидели тень в кустах, чтобы понять, что это горный лев («не надо» быть съеденным »). К сожалению, поскольку во втором случае наша выживаемость коррелировала с переоценкой, мы научились замечать закономерности там, где их нет. Следовательно, даже сегодня мы склонны видеть гораздо больше «ложных срабатываний», когда делаем мысленные оценки.

Другая причина, по которой мы производим больше ложных срабатываний, заключается в том, что большинство из нас не созданы для экспериментов, таких как, например, «A / B-тест» - еще один излюбленный инструмент специалистов по анализу данных. Это снова связано с эволюцией человека: представьте того же горного льва, теперь реального, смотрящего на двух наших предков, Джо и Джеффа. Джо видит льва и бежит, чтобы выжить, в то время как Джефф рассуждает: «Позвольте мне провести A / B-тест: вместо того, чтобы бежать, как Джо, я буду стоять здесь и смотреть, что произойдет». Ранние экспериментаторы A / B-тестов, такие как Джефф, если они существовали, в основном были исключены из генофонда из-за их любви к проведению A / B-тестов.

Какое отношение эта история имеет к науке о данных? С помощью современных инструментов и технологий специалисты по данным хорошо справляются с несколькими задачами: (i) находят кодифицированные закономерности, которые могут использоваться организациями и отраслью, и (ii) создают «эксперименты», в которых предложенные модели могут быть протестированы с помощью данные из реальной жизни и улучшаются с течением времени. Наука о данных радикальна, потому что она дает возможность гибкого, основанного на вычислениях поиска шаблонов и может привнести научные эксперименты, последовательность и объективность в решение проблем.

Привет. На написание этих статей уходит немало времени и усилий, поэтому, если вы нажмете на зеленое сердечко ниже, редакторы узнают, что вам понравились. Спасибо