Профессор Томас Дэвенпорт из Колледжа Бэбсона, Гарвардской школы бизнеса и Школы менеджмента Слоуна Массачусетского технологического института выступил с основным докладом об истории анализа данных на Open Data Science Conference East 2017 в Бостоне под названием Четыре эры аналитики и науки о данных.

Выступление профессора Давенпорта охватило весь диапазон аналитики данных с точки зрения бизнеса, начиная с 1970-х годов и до наших дней, разбив эту практику на четыре основные эпохи.

История науки о данных чрезвычайно коротка по сравнению с длинными дугами биологии, химии и других дисциплин. Тем не менее, эта история по-своему богата, почерпнута из группы движущихся и встряхивающих, которые резко контрастируют с учеными, которые установили изучение физического мира много веков назад. Читайте дальше, чтобы понять, как мы прошли путь от «закулисных» аналитиков до «самой сексуальной работы 21 века».

Era One: Artisanal Analytics

По мнению профессора Давенпорта, серьезное развитие аналитики данных началось с того, что он назвал «кустарной аналитикой», в 1975 году. Эта методология была в первую очередь ориентирована на получение информации для внутреннего принятия решений с использованием небольших структурированных наборов данных.

С организационной точки зрения аналитик 1970-х годов играл принципиально иную роль, чем современный аналитик данных. Аналитики не создавали инструментов, ориентированных на клиентов, которые можно было бы использовать повторно. Вместо этого они отточили модели прогнозирования, основанные на человеческих гипотезах, для уточнения которых потребовалось значительное количество времени. Это означало, что аналитик находился не на переднем плане, а скорее как член службы поддержки, выражаясь словами доктора Давенпорта.

Давенпорт отмечает, что эта форма анализа никуда не делась, но уступила место другим методам, способным открывать идеи без вмешательства человека, таким как машинное обучение. Тем не менее, кустарные аналитики внесли значительный вклад, который продолжает использоваться, например, бизнес-ориентированная статистика и элементарная визуализация.

Вторая эпоха: Аналитика больших данных

Когда в конце 90-х - начале 2000-х годов в Кремниевой долине начался бум, объем и разнообразие данных, доступных аналитику, резко возросли. С новыми вызовами, которые возникли в этом меняющемся ландшафте, в лексикон вошло новое название: специалист по данным.

Давенпорт заметил: «Должен признаться, что, когда я впервые начал слышать о больших данных и ученых данных и так далее, я не был полностью уверен, что это действительно что-то отличное от той аналитики, о которой я говорил и писал. . Так что я начал их изучать ».

Давенпорт начал сотрудничать с Дханурджай« DJ Патил», который впоследствии стал первым главным научным сотрудником Управления науки и технологий США. В их беседах замечания Патил оказались поучительными при разделении границ между аналитиком и специалистом по анализу данных. По словам Давенпорта, Патил сказала бы, что специалисты по обработке данных должны быть на мостике… прямо там с капитаном Кирком, беря на себя ответственность за процесс принятия решений, а не поддерживая лидеров с тыла.

По мнению Давенпорта, «Поддержка принятия управленческих решений? Это мертвая зона.

Третья эра: аналитика экономики данных

До и примерно в 2013 году произошло еще одно серьезное изменение. По мере того как крупные технологические компании находили новые способы борьбы со своими огромными наборами данных, они также находили новые способы их превращения в товар. В дополнение к созданию продуктов на основе наборов данных, которые они поддерживали - модельные компании использовали в течение почти сорока лет, в рамках Дэвенпорта - они также начали продавать данные, которые они собирали от пользователей.

По словам Давенпорта, «промышленно развитое принятие решений в масштабе» стало новым способом использования данных, реагируя на изменения так же быстро, как поступала новая информация. В этот момент бизнес-аналитика стала почти неузнаваемой в следующую эпоху первой эпохи Давенпорта, когда модели не реагировали. к новой информации - тем более, что так мало новой информации появлялось на картинке в любой момент. Теперь компании могли не только собирать информацию от пользователей и продавать ее как товар, но и автоматически менять свои стратегии.

Эра четвертая: автономная аналитика

По словам Давенпорта, в прошлом году мы только что вступили в новую эру аналитики, характеризующуюся еще большей ролью автономного принятия решений - вероятно, самое расплывчатое определение искусственного интеллекта.

В этой модели машины не только выполняют анализ; они также действуют на основе идей, принимая решения быстрее и эффективнее, чем любой человек.

Davenport’s стоит особняком от многих паникеров по автоматизации, которые часто заявляют, что методы искусственного интеллекта и машинного обучения приведут к устареванию существующих рабочих мест. С его точки зрения, специалисты по обработке данных, которые отказываются обновлять свои наборы инструментов, оказываются в центре внимания. По его словам, «единственные люди, которые потеряют работу, - это люди, которые не принимают эти новые технологии».

Прежде всего, профессор Давенпорт подчеркнул, что перед современным специалистом по обработке данных стоит задача понять весь спектр техник, от тех, которые аналитики «закулисных» использовали в 70-х, до сложных методов глубокого обучения, которые сейчас в моде. К счастью, многие из этих техник логически основываются друг на друге, и если вы уже знакомы с предшественниками, сравнительно легко подобрать новые методы.

Вы можете найти полную видеолекцию профессора Давенпорта здесь - Четыре эпохи аналитики и науки о данных.

Прочтите больше статей по науке о данных на OpenDataScience.com