Трудно переоценить важность данных в современной экономике. Инструменты, которые мы используем, и действия, которые мы предпринимаем, потребляют и создают цифровую версию нашего мира, захваченную и ожидающую использования. Данные стали реальным ресурсом, представляющим интерес для большинства отраслей, и по праву считаются воротами к конкурентным преимуществам и разрушительной стратегии.

Наряду с ростом объемов данных появились две разные попытки использовать их потенциал. Один называется Data Science, а другой - Big Data. Эти термины часто используются как взаимозаменяемые, несмотря на то, что они играют принципиально разные роли в донесении потенциала данных до порога организации.

Хотя некоторые утверждают, что до сих пор существует путаница в отношении терминов Data Science и Big Data, это больше связано с маркетинговыми интересами, чем с честным взглядом на то, что эти термины обозначают. имею в виду на реальных проектах. Data Science стремится создавать модели, которые отражают основные шаблоны сложных систем, и кодировать эти модели в рабочие приложения. Большие данные предназначены для сбора и управления большими объемами разнообразных данных для обслуживания крупномасштабных веб-приложений и обширных сенсорных сетей.

Хотя оба предлагают потенциал для получения ценности из данных, фундаментальное различие между наукой о данных и большими данными можно резюмировать в одном утверждении:

«Коллекционирование не означает открытие»

Несмотря на то, что это заявление является очевидным, его истинность часто упускается из виду в спешке с целью дополнить арсенал компании технологиями, ориентированными на данные. Ценность слишком часто оформляется как нечто, что увеличивается исключительно за счет сбора большего количества данных. Это означает, что инвестиции в деятельность, ориентированную на данные, сосредоточены вокруг инструментов, а не подходов. Инженерная тележка ставится впереди научной лошади, оставляя организацию с большим набором инструментов и небольшим количеством знаний о том, как преобразовать данные во что-то полезное.

Перенос руды в пустую мастерскую

С наступлением железного века кузнецы использовали свои навыки и знания для превращения добытого сырья в различные ценные продукты. Используя специальные инструменты, кузнец выковывает, вытягивает, гнет, штампует и сваривает сырье, превращая его в полезные предметы. За годы исследований, проб и ошибок Blacksmith научился использовать избранные газы, определенные температуры, контролируемую атмосферу и различные источники руды, чтобы получить продукт, специально подобранный для его уникального применения.

С промышленной революцией появилась возможность преобразовывать сырье в ценные продукты более эффективно и в больших масштабах. Но упор на масштабирование был не в получении большего количества материала. Речь шла о создании инструментов, которые масштабировали и механизировали опыт преобразования. С этой механизацией возникла еще большая потребность в понимании этого ремесла, поскольку для эффективной работы, обслуживания и масштабных инноваций нужно было глубоко понимать процесс преобразования сырья в продукты, отвечающие постоянно меняющимся требованиям рынка.

В мире данных такой опыт преобразования называется Data Science. Причина, по которой для превращения сырых ресурсов во что-то ценное требуется наука, заключается в том, что то, что извлекается из «земли», никогда не бывает в полезной форме. «Необработанные данные» завалены бесполезным шумом, нерелевантной информацией и вводящими в заблуждение шаблонами. Чтобы превратить это в ту драгоценную вещь, которая нам нужна, требуется изучение ее свойств и открытие рабочей модели, отражающей интересующее нас поведение. Модель, несмотря на шум, означает, что организация теперь владеет началом дальнейших открытий и инноваций. Что-то уникальное для их бизнеса, которое дало им знания о том, что искать, и систематизированные описания мира, который теперь можно механизировать и масштабировать.

Преобразование должно масштабироваться перед сбором

Ни одна отрасль не будет инвестировать в добычу ресурса без опыта, необходимого для превращения этого ресурса в ценность. В любой отрасли это было бы плохим предприятием. Загрузка руды в грузовик только для того, чтобы он прибыл в пустую мастерскую, не приносит большой стратегической выгоды.

Прискорбный аспект больших данных заключается в том, что мы смотрим на крупнейшие компании, чтобы увидеть, какие решения они разработали, чтобы конкурировать на своих рынках. Но эти компании вряд ли представляют собой проблемы, с которыми сталкивается большинство организаций. Их доминирование часто означает, что они сталкиваются с совершенно другой конкуренцией, и их разработка выполняется в основном для обслуживания крупномасштабных приложений. Такая инженерия имеет решающее значение для повседневной работы и отвечает требованиям высокой пропускной способности и отказоустойчивой архитектуры. Но он очень мало говорит о способности обнаруживать и преобразовывать то, что собрано, в ценные модели, отражающие движущие силы, лежащие в основе работы их рынков. Способность объяснять и прогнозировать динамическую среду организации - вот что значит конкурировать, используя данные.

Понимание разницы между наукой о данных и большими данными имеет решающее значение для инвестирования в надежную стратегию обработки данных. Для организаций, желающих использовать свои данные в качестве конкурентного актива, первоначальные вложения должны быть сосредоточены на преобразовании данных в ценность. Основное внимание следует уделять науке о данных, необходимой для создания моделей, которые переводят данные из необработанных в релевантные. Со временем подходы к большим данным могут работать вместе с Data Science. Увеличение разнообразия извлеченных данных может помочь сделать новые открытия или улучшить способность существующей модели предсказывать или объяснять окружающую среду.

Наполните семинар навыками и опытом, необходимыми для преобразования данных во что-то полезное. Привозимая сюда руда станет продуктом, определяющим бизнес.

Этот пост изначально появился на LinkedIn Pulse.