Что может сделать машинное обучение для вашего бизнеса?

Методы машинного обучения, преимущества и затраты

В этой статье я собираюсь изучить, как машинное обучение может принести пользу бизнесу. Я также изучу бизнес риски, связанные с включением машинного обучения в продукт.

Краткое определение

Для наших целей я буду определять машинное обучение как:

подход к вычислениям, который позволяет программам генерировать предсказуемый вывод на основе заданного ввода без использования логических правил

Это означает, что вместо разработки кода поведения вашего программного обеспечения вы должны обучить систему машинного обучения с помощью примеров, содержащих вывод, который вы хотеть.

Например, в приложении, которое распознает людей на фотографиях, вы не должны заранее запрограммировать характеристики каждого человека, которого вы хотите, чтобы оно узнало. Вместо этого алгоритм машинного обучения узнает, как выглядят лица разных людей, на примерах, помеченных людьми.

Классификация вещей

Распознавание лиц на фотографии - пример типа машинного обучения, называемого классификацией. Классификация полезна для продуктов, где мы хотим разделить вещи на категории. Примеры включают:

  • обнаружение объектов на изображении
  • оптическое распознавание символов
  • распознавание голоса
  • обнаружение эмоций

Чтобы построить продукт на основе классификации, нам нужны две вещи:

  1. Алгоритм классификации
  2. Набор помеченных обучающих данных

Чтобы лучше понять природу этого, я хотел бы, чтобы вы посмотрели видео ниже ...

В этом выпуске из Кремниевой долины освещается одна из ключевых проблем машинного обучения для бизнеса:

Относительно просто создать продукт, распознающий ограниченный набор объектов. Задача состоит в том, чтобы создать систему, которая будет использоваться для широкого диапазона входных данных.

Чтобы система могла классифицировать ряд различных объектов (а не хот-дог или не хот-дог), нам нужен разнообразный и точно обозначенный набор данных для обучения нашего алгоритма. Если бы мы создавали приложение для распознавания еды, ему нужно было бы классифицировать еду на множестве разных фонов, под разными углами, с разными условиями освещения и т. Д.

Эта способность классифицировать объекты в различных условиях называется надежностью. Устойчивость является функцией как алгоритма машинного обучения, так и качества используемых обучающих данных.

Сходство и кластеризация

Мы также можем классифицировать вещи, не предоставляя заранее большого количества помеченных данных. Для этого мы можем измерить сходство между вещами и / или сгруппировать похожие вещи. Например, в Noiiz мы разработали технологию под названием Noiiz DNA, которая позволяет пользователям искать звуки в большой базе данных по их сходству с другим звуком.

Одно из самых распространенных бизнес-приложений подобия - это рекомендация. Меры сходства используются Amazon, Spotify, Apple и Facebook, чтобы рекомендовать продукты, услуги или музыку миллионам пользователей.

Предсказание вещей

Еще одно применение машинного обучения - прогнозирование значения на основе известной информации. Это называется регрессом. Примером может служить прогноз цен на жилье на основе количества спален, размера, местоположения и возраста собственности. Другой пример - прогнозирование будущих цен на акции на основе даты.

Как и в случае классификации, нам нужен хороший объем высококачественных обучающих данных (таких как предыдущие цены на жилье), чтобы обучить нашу систему. Другой ключевой момент заключается в том, что между входными и выходными переменными должна быть причинно-следственная связь.

Например, мы не смогли построить систему, которая прогнозирует цены на жилье на основе названий домов и того, как часто владелец выгуливает свою собаку. Машинное обучение - это не волшебство.

Глубокое обучение

Глубокое обучение - это недавний прогресс в машинном обучении, который позволяет решать более сложные или сложные проблемы. Типичное применение глубокого обучения - обнаружение нескольких объектов на изображении, как показано выше. Однако глубокое обучение также можно использовать для генерации новых данных. Приложения глубокого обучения включают:

  • Генерация новых изображений в стиле уже существующих
  • Удаление шума из аудиозаписи
  • Создание музыки и речи на основе примеров
  • Распознавание почерка
  • Игра в шахматы и космические захватчики

Глубокое обучение развивается очень быстрыми темпами, чему активно содействуют такие компании, как Google и Facebook. Чтобы изучить передовые технологии, стоит взглянуть на недавние работы над проектом Deepmind.

Роль машинного обучения в вашем бизнесе

Пока я говорил только о некоторых потенциальных приложениях машинного обучения. Теперь я расскажу о некоторых последствиях включения машинного обучения в цифровой продукт.

Машинное обучение - не панацея или «серебряная пуля», которая волшебным образом поможет вашему бизнесу внедрять инновации. Это набор технологий и инструментов, которые можно использовать для решения определенных задач. Ограничения для включения машинного обучения в продукт аналогичны ограничениям для любых цифровых инноваций. Даже для самых, казалось бы, простых проблем потребуется определенное количество исследований и экспериментов, чтобы прийти к решению. После этого возникнут проблемы с интеграцией, производством и масштабированием.

Например, можно настроить базовую систему обнаружения объектов в 10 строк кода. Это замечательно, если вы хотите обнаружить один из 80 объектов в поддерживаемом списке, но если вы хотите обнаружить разные типы птиц или различные начинки для пиццы, вас нет удачи.

Затраты и риски

По моему опыту, любая система машинного обучения потребует начального периода экспериментов.

Если ваша компания плохо знакома с машинным обучением и / или у вас еще нет опыта в области машинного обучения, вам почти наверняка потребуется нанять консультанта для поддержки проекта. По словам Джин Росс, главного научного сотрудника Центра информационных систем Массачусетского технологического института:

Проведение цифровых экспериментов похоже на небольшую ставку на всех лошадей в гонке, а затем возможность увеличить любую ставку в различных точках гонки. Нет необходимости делать большую ставку, пока победитель не будет почти определен.

Создавать продукт на основе машинного обучения рискованно, поэтому, если все ценностное предложение вашего бизнеса не сосредоточено на технологии машинного обучения, лучше всего минимизировать риск, работая в небольших итерациях тестирования на ранней стадии и часто с клиентами. После создания прототипа производство должно начаться как можно раньше, чтобы быстро выявить любые проблемы масштабирования.

Примечание о данных

Для любого контролируемого приложения машинного обучения (которое включает в себя большую часть классификации, регрессии и глубокого обучения) для обучения системы потребуется набор данных с хорошей маркировкой.

Доступен ряд наборов данных, которые можно использовать для этой цели, но есть вероятность, что если вы делаете что-то новое, вам нужно будет либо создать, источник или уточнить набор данных в соответствии с требованиями вашего бизнеса. Работа с данными в машинном обучении очень сложна и требует много времени, и область Data Science быстро растет.

Согласно блестящей статье Вики Бойкис, нейронные сети - это просто люди:

Каждый элемент принятия решений в высокотехнологичной нейронной сети изначально зависит от человека, который вручную собирает что-то воедино и делает выбор.

Эту статью настоятельно рекомендуется прочитать, если вы хотите больше узнать о важности данных и маркировки.

Четкое определение проблемы

Возможно, наиболее важной частью внедрения машинного обучения в продукт является четкое определение проблемы, которую пытается решить ваш бизнес. Если проблема не может быть сформулирована простым языком и ясно понята заинтересованными сторонами, маловероятно, что система машинного обучения сможет ее решить. Еще одно хорошее практическое правило состоит в том, что если человек, не являющийся экспертом, будет бороться с классификацией чего-либо, то машина также может столкнуться с трудностями. Например, людям становится все труднее различать объекты по мере продвижения, и то же самое верно и в отношении машинного обучения. Опять же, машинное обучение - это не волшебство.

Возможно, как это ни парадоксально, но некоторые из самых трудноразрешимых и трудноразрешимых проблем имеют наибольшую потенциальную ценность для бизнеса. Итак, в конечном итоге необходимо принять решение, перевешивает ли риск ставки на эти более наукоемкие предприятия потенциальные выгоды.

Вы построили бизнес на основе машинного обучения или начали его рассматривать? Если да, то я хотел бы услышать мысли и переживания в комментариях ниже.