Машинное обучение - это наука, помогающая компьютерам обнаруживать закономерности и взаимосвязи в данных, а не программироваться вручную. Это мощный инструмент для создания персонализированных и динамичных впечатлений, и он уже управляет всем: от Facebook, рекомендующего, с кем вам следует дружить, Shazam, находящего треки, которые вы слушаете, до автономных транспортных средств и интерфейсов мозг-компьютер. Несомненно, большинство продуктов, которые вам нравятся ежедневно, основаны на технологиях машинного обучения. Но по мере того, как с ее помощью создается все больше и больше опыта, становится ясно, что менеджерам по продуктам еще многое предстоит узнать о том, как заставить пользователей чувствовать контроль над технологией, а не наоборот.

Как сказал Марк Кьюбан:

«Искусственный интеллект, глубокое обучение, машинное обучение - что бы вы ни делали, если не понимаете этого - изучите это. Потому что иначе через 3 года ты станешь динозавром ».

Машинное обучение может удовлетворить различные потребности пользователей, которые связаны с различными математическими задачами. Большинство проблем, которые он может решить, можно разделить на следующие категории:

Рейтинг

Facebook, решая, какие новости добавить в свою ленту новостей, от контента, размещенного вашими друзьями, до спонсируемых сообщений? Google, пытаетесь ответить на ваш запрос с наилучшими возможными результатами? Это проблемы ранжирования - помощь пользователям в поиске того, что нужно.

Рекомендация

Instagram, рекомендуете новых подписчиков? Netflix предлагает фильмы, которые могут вас заинтересовать? Это проблемы с рекомендациями - предоставление пользователям того, что им может быть интересно, без явного поиска в определенных случаях.

Регресс

Хоппер предсказывает цены на авиабилеты? Это проблема регрессии - прогнозирование числового значения вещи.

Классификация

Facebook, обнаруживая лица на фотографии, которую вы только что опубликовали? Gmail отмечает письмо как спам? Это проблемы классификации - выяснение, что это за вещь.

Как менеджеру продукта, работающему с функцией или продуктом машинного обучения, очень важно понимать машинное обучение. Под этим я, конечно же, не имею в виду, что вам нужно иметь глубокие знания алгоритмов машинного обучения или что вы должны быть в состоянии придумывать реальные модели. Прежде всего, менеджеры по продукту должны быть знакомы с приведенными ниже вопросами:

  • Как машинное обучение повысит ценность вашего продукта?
  • Чего можно достичь с помощью машинного обучения для вашего продукта и что потребуется для его выполнения (больше данных, лучший алгоритм и т. Д.)?
  • Можете ли вы определить разницу между шумихой и реально достижимыми вещами с помощью машинного обучения?
  • Насколько отличаются процессы создания продукта машинного обучения от продукта без машинного обучения?

Пытаясь ответить на эти вопросы, я сам или видел, как другие впадают в следующие заблуждения:

Заблуждение №1: Сосредоточьтесь больше на деталях модели, чем на удобстве использования.

Специалисты по обработке данных часто создают сложные модели, в которых бизнес не нуждается. Все, что создает команда по анализу данных, будет использоваться реальными людьми, и тот факт, что алгоритм имеет 12 функций, точность 97% и точность 98%, ничего не значит для конечного пользователя. По этой причине правило MVP с частыми итерациями также применяется в таких проектах. Например, модель может иметь точность 97%, и это может иметь огромный внутренний успех. Тем не менее, эти 3% могут привести к ухудшению пользовательского опыта из-за больших объемов. Следовательно, онлайн-оценка модели имеет такое же значение, как и офлайн. Напротив, модель с точностью 80% может показаться команде и заинтересованным сторонам низкой, но может принести значительную пользу бизнесу.

Кроме того, большее количество функций не означает более удобного использования. Элементы могут быть удалены из модели с небольшой потерей точности или без нее, в то время как их поддержание может привести к тому, что модель присвоит им некоторый вес, что может отрицательно повлиять на будущие изменения. Следовательно, должно стать ясно, что такие методы, как A / B-тестирование, частые выпуски и MVP, имеют решающее значение для успеха проектов машинного обучения.

Заблуждение №2. Не нужно согласовывать бизнес-показатели и математические показатели.

Модели машинного обучения, которые не соответствуют бизнес-моделям, не только беспричинно тратят время и деньги, но и подрывают доверие организации к машинному обучению. Это особенно верно для компаний, которые опоздали в науку о данных, скептически относятся к силе науки о данных или очень качественно руководят.

Успех такого проекта зависит от начальных бизнес-вопросов и бизнес-показателей, которые следует решать с помощью машинного обучения. Фактически, эти ответы побудят команду по анализу данных решить, какие типы алгоритмов они будут использовать и какие показатели будут использовать. Например, в начале каждого проекта команда машинного обучения GitHub определяет не только проблему или вопрос, который она решает, но и то, какими должны быть показатели успеха.

Кроме того, в задачах ранжирования специалисты по данным обычно проверяют метрику precision @ k, но прежде всего нужно ответить, как эта математическая проблема связана с бизнес-проблемой, например. увеличить рейтинг кликов пользователя.

Заблуждение №3: одна и та же модель может решать разные проблемы, поскольку они кажутся похожими.

Одна из самых простых ловушек в машинном обучении - это верить в то, что одну и ту же модель можно внедрить в разные компоненты, потому что они решают аналогичные проблемы. Тем не менее нет никакой гарантии, что модель будет полезной, если мы перейдем в новый контекст. Например, в Workable нам пришлось создать две отдельные модели разрешения идентичности, поскольку, хотя задача обоих компонентов заключалась в том, чтобы найти, какие пары кандидатов относятся к одному и тому же человеку, входные данные в каждом случае немного различались.

Помните, что эти алгоритмы черпают свою мощь из возможности сравнивать новые случаи с большим набором данных аналогичных случаев из прошлого. Таким образом, когда вы пытаетесь применить модель в другом контексте, случаи в наборе данных теперь могут быть другими, и то, что было сильной стороной в исходном контексте, теперь становится помехой. Однако бывают случаи, когда модель вне контекста может быть улучшением по сравнению с отсутствием модели вообще, если принимаются во внимание ее ограничения.

В любом случае переход на продукт, который следует другим принципам, определенно является сложной задачей. Как утверждает Фридерике Шур из Fast Forward Labs:

«Людям трудно понять, что значит работать в мире, где все является лишь вероятностью. Людям нужны точные цифры и определенные результаты. Даже всего два дня назад я был на встрече, и мы создали прототип для проверки концепции для клиента, и они просто спросили: «Это работает? Да или нет.'"

Поскольку все больше организаций стремятся внедрить машинное обучение в свои продукты, менеджерам по продуктам необходимо принять и возглавить изменение поведения, вызванное внедрением этого мощного набора инструментов для быстрого создания сложных систем (если все сделано правильно).

Некоторые ресурсы, которые могут оказаться полезными:

Если вам понравилась эта история, нажмите кнопку 👏 и поделитесь ею, чтобы помочь другим найти ее!