«Я буду честен. Когда несколько лет назад пришел мой технический директор и начал говорить об «озере данных», я подумал, что он шутит». Это Джефф, руководитель высшего звена, который недавно связался с нами, чтобы поговорить о некоторых проблемах, связанных с тем, чтобы оставаться в курсе последних технологических разработок для бизнеса. «Я имею в виду, что сначала мы сохраняем все в облаке, а теперь у нас есть озера данных? Что дальше — поля файла? Ураганы данных

Технологическая индустрия может быть безжалостной, когда дело доходит до новейшего жаргона. На самом деле, одна из самых распространенных проблем, которую мы слышим от менеджеров программ, директоров и генеральных директоров, заключается в том, что они должны быть в курсе последних событий в своей области, и в то же время каким-то образом умудряться следить за технологиями в достаточной степени, чтобы быть в состоянии внедрить последние достижения для бизнеса. Жаргон может быть серьезным препятствием для некоторых. Иногда проще ухватиться за последнее модное словечко, а потом проверить факты. Однако иногда это может привести к серьезным недопониманиям. Вы действительно хотели предложить применить машинное обучение к проблеме или просто аналитику? Сегодня мы разбираемся с пятью наиболее часто употребляемыми модными словечками, чтобы помочь вам на следующей встрече с вашим техническим директором.

Прогнозная аналитика

Мы начнем с одной из самых распространенных фраз, которые вы услышите, когда дело доходит до данных: прогнозная аналитика. На первый взгляд, это кажется довольно простым. Благодаря прогностическому моделированию и прогнозированию эта практика позволяет аналитикам интерпретировать имеющиеся данные, чтобы сделать прогноз будущего поведения. Например, предприятия могут прогнозировать розничные покупки на основе прошлого поведения; аналитики могут помочь врачам или страховым компаниям прогнозировать будущие события в жизни пациентов на основе их истории болезни и историй других подобных пациентов; развлекательные компании могут разрабатывать контент, который читатели, скорее всего, будут потреблять, основываясь на их предыдущих привычках и предпочтениях в отношении чтения. Загвоздка в том, что это применимо только к ситуациям, когда у вас есть данные для начала! Мы чаще всего видим, как этот термин используется предприятиями, готовящимися к запуску нового продукта и сталкивающимися с вопросом: каких продаж мы можем ожидать в первом квартале или первом году? «Давайте просто пригласим сюда несколько человек и приступим к прогнозной аналитике» может звучать великолепно, но на самом деле это невозможно, если у вас нет исторических данных для начала.

Искусственный интеллект (ИИ)

Мы заметили растущую тенденцию к тому, что профессионалы используют искусственный интеллект почти как синоним решения проблем или даже позволяют компьютерам производить независимый анализ данных. На самом деле ИИ — это процесс, который является прямым результатом пользовательского ввода и обучения. Искусственный интеллект создается путем объединения больших объемов данных с быстрой обработкой и алгоритмами, которые позволяют программе автоматически обучаться на закономерностях или особенностях данных. Искусственный интеллект — это то, что придает вычислительную мощность прогнозной аналитике и имеет множество приложений. ИИ может генерировать отчеты и просто данные, чтобы их было легко понять не только специалистам по данным. Все это стало возможным благодаря алгоритмам машинного обучения, что подводит нас к следующему модному слову.

Машинное обучение (МО)

Хотите верьте, хотите нет, но самые распространенные заблуждения относительно этого термина заключаются в том, что он 1) является просто синонимом искусственного интеллекта или 2) возможно применим к машинам. Вместо этого машинное обучение описывает процесс обучения компьютеров тому, как учиться, интерпретируя данные, классифицируя их и внося коррективы на основе успехов и неудач. Одним из популярных примеров этого является программное обеспечение для распознавания голоса. Каждый раз, когда вы задаете Siri вопрос, запускается процесс, который переводит слуховой ввод (ваш голос) в данные, интерпретирует данные и определяет подходящий ответ на вопрос. Чтобы «научить» компьютер обрабатывать этот слуховой ввод, программисты должны были предоставить ему тысячи образцов записей и сопоставить эту слуховую информацию с данными. Проще говоря, машинное обучение работает с предыдущими программами, а также приспосабливается к новым условиям или изменениям.

Озеро данных

Следующее модное слово, пожалуй, самое неоднозначное, если вы не специалист по данным. Каким бы крутым ни был водоем, похожий на Матрицу, озеро данных на самом деле имеет дело с хранением данных в своем родном формате для исследования, предлагая необработанное представление данных. Для высококвалифицированных специалистов по данным озеро данных предлагает решения потенциальных проблем. Каждому элементу данных в озере присваивается идентификатор и тег, и при возникновении потенциальной проблемы или вопроса озеро данных может использоваться для получения соответствующих данных, и эти данные могут быть проанализированы для решения. Итак, чем озеро данных отличается от хранилища данных? Что ж, давайте на минутку представим, что вы собираете и складируете древесину, оставшуюся после строительных работ. Если вы следуете «модели хранилища данных», возможно, у вас уже есть полки для хранения на вашем складе с отсеками заданного размера (скажем, контейнеры 6 x 6 дюймов, выстроенные в линию на каждой полке). Ваш поставщик сбрасывает оставшуюся древесину разных размеров. Когда он прибудет, вы должны разрезать его на кусочки размером 6 x 6 дюймов, чтобы их можно было бережно хранить в контейнерах. Однако, если вы следуете модели «озера данных», вы просто принимаете древесину разных размеров как есть и сохраняете ее, чтобы ее можно было использовать для разных типов проектов. Чтобы использовать более техническое описание: в хранилище данных структура данных и схема определяются заранее, и все данные очищаются и обогащаются; в озере данных структура и схема не определяются заранее, и с данными можно выполнять различные виды анализа данных.

История данных

Рассказывание историй о данных — это практика создания повествования вокруг данных и предоставления дополнительного контекста, чтобы повлиять на то, как они будут поняты. Диаграммы и графики отлично подходят для визуального представления информации, но они не поддерживают какой-либо конкретный план действий. Представьте, что вы представляете информацию о продажах за последний квартал своему совету директоров. Ваша команда собирает информацию о том, какие товары были проданы, сколько, общую прибыль, производственные затраты и краткий обзор отзывов клиентов. Вы конвертируете эти данные в график и показываете его на доске. Просто показать диаграмму недостаточно, чтобы рассказать историю эффективности вашей компании или мотивировать совет директоров принять какое-либо конкретное решение. Вместо этого было бы полезно объяснить: были ли продажи выше или ниже, чем в предыдущем квартале, положительные ли отзывы клиентов, какие продукты популярны, а какие нуждаются в дополнительной маркетинговой поддержке, кто является средним потребителем и т. д.

Дело в том, что теперь ожидается, что лидеры в большинстве отраслей будут чувствовать себя комфортно, обсуждая последние технологические достижения, которые необходимы для сохранения конкурентоспособности в современном мире. Вы ищете более адаптированное обучение цифровой грамотности для себя или своей команды? Напишите [email protected] сегодня, чтобы узнать больше!