Бенедикт Эванс Как думать о машинном обучении.

Почти все, даже люди, не входящие в круг технических специалистов и стартапов, слышали или читали о машинном обучении и знают, что это «следующая большая вещь». Технически подкованные люди могут понять теорию нейронных сетей и то, как машинное обучение решает класс вопросов, которые ранее были «сложными для компьютеров и простыми для людей» или, что более полезно, «людьми трудно описать компьютерам».

Однако знание математики, лежащей в основе машинного обучения, или просмотр всех выступлений и крутых демонстраций видения не помогает нам структурно думать о том, какие новые возможности оно может дать, и что это будет означать для компаний в более широкой экономике.

Однако я не думаю, что у нас уже сложилось четкое представление о том, что такое машинное обучение означает.

Реляционные базы данных — параллельное сравнение

До того, как в конце 1970-х годов появились реляционные базы данных, базы данных представляли собой простые системы ведения записей. Выполнение произвольного запроса с перекрестными ссылками часто превращалось в заказной инженерный проект. Реляционные базы данных превратили их в системы бизнес-аналитики. Они изменили то, что могли делать компьютеры, предоставив новый фундаментальный включающий слой.

Благодаря этому новому уровню появились такие компании, как Oracle и SAP. Эти компании дали нам глобальную цепочку поставок «точно в срок», в свою очередь дав нам Apple и Starbucks. PeopleSoft, SuccessFactors, SalesForce и десятки новых компаний с миллиардами долларов — все они работали на реляционных базах данных. Эта технология стала вспомогательным слоем, который был частью всего.

Точно так же машинное обучение — это шаг вперед в том, что мы можем делать с компьютерами, новый уровень возможностей, на который компании могут опираться.

В конце концов, почти все будет иметь ML где-то внутри, и всем будет все равно.

Возникает вопрос: как перейти от объяснения соединений таблиц к размышлениям о Salesforce.com? Мы можем делать впечатляющие демонстрации распознавания голоса и изображений с помощью машинного обучения, но что с этим делать обычной компании?

Машинное обучение имеет ограниченный эффект «победитель получает все»

Машинное обучение — это все о данных, отсюда и поговорка: «Данные — это новая нефть». Легко поверить, что крупные компании, такие как Google, Microsoft, Amazon, BAT и т. д., имеют абсолютные преимущества, потому что у них «есть все данные». Однако данные очень специфичны для конкретных приложений и не взаимозаменяемы.

Больше данных о почерке улучшит распознаватель рукописного ввода, а больше данных о газовых турбинах также улучшит систему, которая предсказывает отказы в газовых турбинах, но одно не помогает с другим.

… машинное обучение позволяет нам решать классы проблем, с которыми раньше компьютеры не могли с пользой справиться, но каждая из этих проблем потребует другой реализации и других данных, другого пути выхода на рынок и часто другой компании. .

Машинное обучение *НЕ* человекоподобный робот с общим интеллектом

Люди часто думают, что мы создаем что-то антропоморфное, что-то с общим интеллектом. Однако то, что мы получаем в действительности, больше похоже на стиральные машины: они функционируют только при наличии определенных видов входных данных, они не являются универсальными даже в узкой области стирки.

Что же тогда является стиральными машинами машинного обучения для реальных компаний?

Два набора инструментов для размышлений о применении машинного обучения

1. Собирайте и обрабатывайте новые типы данных, задавайте новые типы вопросов

Машинное обучение позволяет нам:

  1. задавайте старые вопросы по старым данным и ожидайте лучших результатов, например, в качестве метода анализа или оптимизации.
  2. задавайте новые вопросы по старым данным, например. с анализом настроений компьютеры могут выполнять такие задачи, как «Прочитать все электронные письма и найти тревожные/сердитые».
  3. задавать новые/старые вопросы по новым данным
    Компьютеры с момента своего появления способны (и хорошо умеют) обрабатывать большие объемы текста и чисел. Благодаря машинному обучению аудио, изображения и видео могут стать «машиночитаемыми». Это открывает новые типы данных для анализа.

2. Автоматизация задач, которые раньше нельзя было автоматизировать

Например, «прослушать все телефонные звонки и найти злых», «разложить стопку фотографий на мужские и женские» и т. д. Задания, которые раньше требовал от человека, но под силу даже десятилетнему ребенку. Машинное обучение дает нам бесконечное число десятилеток, так что мы можем автоматизировать одну дискретную задачу в массовом масштабе. (за исключением того, что у десятилетних детей есть общий интеллект и здравый смысл, в отличие от любой нейронной сети, которую мы знаем, как построить)

В некоторых областях машинное обучение может даже находить уровни паттернов, выводов или следствий, которые человек не может распознать, просматривая огромное количество данных, которые ни один человек никогда не мог бы сделать за всю жизнь, и получать новые результаты (вспомните AlphaGo от Deepmind). . Опять же, вопрос, что делать с этой мощью автоматизации.

Но что бы вы сделали, если бы миллион пятнадцатилетних смотрели на ваши данные? Какие звонки вы бы слушали, какие изображения смотрели бы и какие передачи файлов или платежи по кредитным картам вы бы проверяли?

Финал

Мы только в начале бума машинного обучения. Что еще? Что это даст, кроме легко висящих фруктов, таких как проблемы с оптимизацией, распознавание изображений или вопросы анализа звука? Вероятно, осталось десять-пятнадцать лет, прежде чем мы исчерпаем все возможности.

Резюме

  1. Машинное обучение — новый уровень возможностей
  2. Машинное обучение имеет ограниченный эффект «победитель получает все»
  3. Машинное обучение сегодня далеко от общего интеллекта
  4. Машинное обучение позволяет обрабатывать новые данные и новые вопросы
  5. Машинное обучение открывает новые виды автоматизации
  6. Вопросы: что еще это даст? чего мы можем добиться с этой силой?