Вот уже почти полдесятилетия я работаю с Data и занимал несколько должностей - специалист по принятию решений, специалист по данным, соучредитель и руководитель группы. Я работал с ведущими брендами, некоторые из которых входят в список Fortune 100, в различных областях маркетинга, цепочки поставок и мошенничества. Но всегда есть нерешенные вопросы о науке о данных. И я уверен, что эти вопросы существуют и для многих других специалистов по обработке данных, и для других бизнес-профессионалов, потому что меня постоянно спрашивают об этом.

Что такое наука о данных? Почему я позиционирую себя как профессионал в области данных? Почему так много молодых специалистов, как я, хотят стать специалистами по анализу данных? Почему университеты по всему миру начинают курсы Data Science с такой непомерно высокой скоростью? Как растет аналитик данных? Как блокчейн изменит способ работы специалистов по данным, если специалисты по данным в значительной степени полагаются на централизованное хранилище данных?

И есть еще так много вопросов, и хотя они выглядят такими безобидными с самого начала, ответы на эти вопросы по существу лежат в основе причины моего существования и для многих других молодых людей, таких как я, в профессиональной среде.

В этой статье я собираюсь глубоко погрузиться в первый и, возможно, самый важный вопрос.

Что на самом деле такое наука о данных?

Как всегда делают профессионалы в области данных, я решил сначала собрать данные. Я разговаривал с многочисленными профессионалами из Индии, США и Канады, которые занимали такие должности, как аналитик данных, специалист по принятию решений, специалист по данным, финансовый аналитик, менеджер по аналитике, менеджеры по продуктам, а также со многими студентами, которые в настоящее время обучаются по программам науки о данных и инженерные курсы. Что еще более важно, я представил результаты множеству профессионалов из разных организаций, чтобы понять, согласуется ли восприятие науки о данных с «принятым» определением науки о данных среди профессионалов в области данных.

Вот основные моменты моих выводов и моей интерпретации из этих интервью и бесед:

1. Наука о данных - это все о решении проблем. Ну, а какая часть бизнеса не связана с решением проблем? Каждому человеку, которому когда-либо платили в жизни, платили, потому что он / она решил проблему или, по крайней мере, попытался решить проблему. Но подождите, давайте не будем сразу отказываться от этого определения.

В то же время, безусловно, верно, что все части бизнеса решают проблемы, способ, которым профессионалы в области данных формулируют и подходят к проблеме, в корне отличается. Опытные специалисты по данным сосредоточены на определении проблемы. Фактически, многие из них посвящают около 80% времени определению проблемы, и это гарантирует, что они полностью понимают текущее состояние бизнеса и достигают консенсуса по поводу окончательного состояния. Но тогда эти цели не высечены на камне. Скорее они адаптируются к постоянно меняющейся деловой среде и потребностям конечных пользователей.

2. Наука о данных предполагает создание продуктов с использованием новейших инструментов и технологий, доступных в моей компании. Это то, что вы слышите от многих молодых амбициозных специалистов по данным, и большинство людей, давших такой ответ, были инженеры. Интересно, что подавляющее большинство людей в различных частях организации согласны с этим определением. Фактически, если вы обратитесь к людям, которые пытаются перейти в науку о данных, и спросите их, как они собираются это сделать, ответ номер один будет: «Я изучаю Spark / Hadoop / H2O». Но многие опытные специалисты по анализу данных ненавидят такое определение науки о данных. Для них это никогда не касается технологий, которые вы используете. Фактически, большинство бизнес-лидеров не заботятся о том, какие именно технологии или алгоритмы используются специалистами по анализу данных. Итак, очевидно, что опытные ученые и бизнес-лидеры не сильно беспокоятся о базовой технологии, если продукт / инструмент / команда решают проблему по приемлемой цене.

Но тогда почему это стало таким популярным ответом? И почему это было принято повсеместно, а не выше?

Что ж, возможно, это связано с тем, что в науке о данных, возможно, больше студентов, чем профессионалов по сравнению с любой другой дисциплиной. Единственная другая научная / инженерная дисциплина, имеющая такой перекос, - это, пожалуй, технология Blockchain.

А благодаря преимуществам, которые наука о данных и блокчейн могут дать предприятиям, лидеры, полагающиеся на опыт для решения бизнес-задач, не потерпят достаточного поражения, чтобы добиться большого успеха. Такой взгляд на мир побуждает даже такого консервативного человека, как я, сделать смелое пророчество: «Абсолютный Дикий Запад технологий только-только приближается к нам». Но это обсуждение в другой день.

3. Наука о данных предназначена для генерирования тактических идей на основе данных, которые позволяют лидерам разрабатывать стратегию и принимать решения. - Ну, это классический ответ менеджеров на вопрос «Как вы определяете науку о данных? / Какова роль специалиста по данным? » Большинство специалистов по обработке данных, как опытных, так и новичков, согласны с этим определением науки о данных. Интересно, что мужчины и женщины в красивых костюмах (консультанты) утверждали, что делают это на протяжении большей части прошлого века.

Что меня удивило, так это то, что у этого определения науки о данных не было слишком много последователей из других частей организации. Пользователи чувствовали, что они могут глубоко понять своих клиентов, и из-за стремительного роста инструментов самообслуживания, таких как Tableau, Alteryx и т. Д., Большинство команд в организации сегодня имеют доступ к данным и усилиям команды руководителей этих организаций и преувеличениям СМИ. гарантирует, что все (почти) руководствуются данными или пытаются принимать решения на основе данных в большинстве крупных организаций.

Наука о данных - это инженерные решения проблем, в которых инженеры позволяют системе формировать свои собственные правила на основе некоторых исторических данных. Похоже на безумное определение, правда? Я думал, что это и есть наука о данных. Когда вы думаете о таких проблемах, как сегментация клиентов, обнаружение мошенничества, комплектация продуктов и некоторые другие, над которыми я работал, кажется, что это определение выдерживает критику. Мои беседы с несколькими экспертами заставили меня понять, что проблема именно в этом. Мы делаем эти определения на основе нашего опыта. Сегодня люди из разных слоев общества подходят к решению своих проблем, ориентируясь на данные прежде всего. Таким образом, попытка принудительно подогнать любое определение к быстро развивающейся технологии приведет к неудаче.

Итак, мудрый человек сказал: «Ищите утешение в двусмысленности и дискомфорте, потому что это способствует росту».

Но подождите, ни одна работа специалиста по данным никогда не считается завершенной без быстрого синтеза, смелого прогноза (массовый прыжок веры) и следующих шагов / призыва к действию.

Синтез. Сегодняшним компаниям сложно дать определение науке о данных и понять, как можно использовать эту технологию, чтобы повлиять на чистую прибыль. Модель Plug & Play IT еще не существует в области науки о данных, за исключением нескольких стандартных проблем, таких как механизмы рекомендаций, обнаружение аномалий и т. Д. Кроме того, поскольку проблемы продолжают меняться, просто невозможно продолжать покупать продукты каждый раз, когда проблема меняется. Для продавцов в космосе просто неэкономично создавать огромный ассортимент продуктов для каждой небольшой проблемы. И даже если они это сделали, мне действительно жаль продавцов этой компании. Вот почему крупные поставщики (AWS, Azure, Google compute Engine) в этой сфере используют модель PaaS (платформа как услуга), а не модель SaaS (программное обеспечение как услуга).

Прогноз. В ближайшие несколько лет специальные роли, такие как специалисты по обработке данных / аналитики, исчезнут. Вместо этого ожидается, что основная часть рабочей силы будущего будет разбираться в науке о данных и работать вместе с машинами.

Некоторые лидеры в этой области уже начали называть такого сотрудника Citizen Data Scientist!

Они будут обладать следующими характеристиками:

  • Структурированный подход к решению проблем
  • Отсутствие горизонтального фокуса
  • Возможность использовать лучшие достижения в области технологий и математики для решения бизнес-задач
  • Обладать мышлением прежде всего о данных

Это приводит к большему количеству вопросов? Как нанять этот талант? Можем ли мы переобучить всю мою рабочую силу? Какие проблемы собираются решать эти люди? Как мы их ведем? Как нам их сохранить? Где мы их находим?

Что ж, эти вопросы для другого обсуждения !!

Пожалуйста, обрати внимание:

  1. Не стесняйтесь поделиться этой статьей на сайтах профессиональных сетей или в своей компании.
  2. С нетерпением жду ваших комментариев!
  3. Хотя в этой статье я постарался сохранить полную гендерную нейтральность, я мог неосознанно упомянуть пол. Пожалуйста, дайте мне знать, если это так. Я с радостью внесу исправления.