Раньше машинное обучение происходило за кулисами: Amazon добывал ваши клики и покупки для получения рекомендаций, Google добывал ваши поисковые запросы для размещения рекламы, а Facebook добывал вашу социальную сеть, чтобы выбрать, какие публикации вам показывать. Но теперь машинное обучение находится на первых полосах газет и является предметом жарких споров. Изучите алгоритмы вождения автомобилей, переводите речь и побеждайте в Jeopardy! Что они могут, а что нельзя? Являются ли они началом конца частной жизни, работы и даже всего человечества? Это растущее осознание приветствуется, потому что машинное обучение - основная сила, формирующая наше будущее, и нам нужно с ней справиться. К сожалению, вокруг этого возникло несколько заблуждений, и их устранение - первый шаг. Давайте кратко рассмотрим основные из них:

Машинное обучение - это просто обобщение данных. На самом деле основная цель машинного обучения - предсказывать будущее. Знание фильмов, которые вы смотрели в прошлом, - это только средство выяснить, какие из них вы хотите посмотреть в следующий раз. Ваша кредитная история поможет определить, будете ли вы оплачивать счета вовремя. Подобно ученым-роботам, алгоритмы обучения формулируют гипотезы, уточняют их и верят им только тогда, когда их прогнозы сбываются. Алгоритмы обучения еще не так умны, как ученые, но они в миллионы раз быстрее.

Алгоритмы обучения просто обнаруживают корреляции между парами событий. Такое впечатление складывается из большинства упоминаний о машинном обучении в средствах массовой информации. В одном известном примере рост числа поисковых запросов в Google по запросу "грипп" является ранним признаком его распространения. Это все хорошо, но большинство алгоритмов обучения открывают для себя гораздо более обширные знания, такие как правило Если родинка имеет неправильную форму и цвет и растет, то это может быть рак кожи.

Машинное обучение может обнаруживать только корреляции, а не причинно-следственные связи. Фактически, один из самых популярных типов машинного обучения состоит в том, чтобы пробовать различные действия и наблюдать их последствия - суть причинного открытия. Например, сайт электронной коммерции может попробовать множество различных способов представления продукта и выбрать тот, который приводит к наибольшему количеству покупок. Вы, вероятно, участвовали в тысячах этих экспериментов, даже не подозревая об этом. Причинно-следственные связи могут быть обнаружены даже в некоторых ситуациях, когда об экспериментах не может быть и речи, и все, что может сделать компьютер, - это посмотреть на прошлые данные.

Машинное обучение не может предсказать ранее невидимые события, также известные как «черные лебеди». Если что-то никогда не происходило раньше, его прогнозируемая вероятность должна быть равна нулю - что еще это могло быть? Напротив, машинное обучение - это искусство предсказывать редкие события с высокой точностью. Если A является одной из причин B, а B является одной из причин C, A может привести к C, даже если мы никогда не видели, чтобы это происходило раньше. Каждый день спам-фильтры правильно помечают только что сфабрикованные спам-письма. Черные лебеди, подобные жилищному краху 2008 года, на самом деле были широко предсказаны - только не на основе ошибочных моделей риска, которые большинство банков использовали в то время.

Чем больше у вас данных, тем больше вероятность, что у вас возникнут галлюцинации. Предположительно, чем больше телефонных записей просматривает АНБ, тем больше вероятность того, что невиновный будет идентифицирован как потенциальный террорист, потому что он случайно выполнил правило обнаружения террористов. Извлечение большего количества атрибутов одних и тех же сущностей действительно может увеличить риск галлюцинаций, но специалисты по машинному обучению очень хорошо умеют свести его к минимуму. С другой стороны, добыча большего количества сущностей с тем же набором атрибутов снижает риск, потому что правила, извлеченные из них, будут иметь более сильную поддержку. Некоторые алгоритмы обучения могут находить закономерности, включающие несколько объектов, что делает их еще более надежными: человек, снимающий на видео здание мэрии Нью-Йорка, может не вызывать подозрений, а другой, покупающий большое количество нитрата аммония, тоже может не вызывать подозрений; но если эти двое находятся в тесном телефонном контакте, возможно, ФБР следует проверить, просто чтобы убедиться, что это не заговор с бомбой.

Машинное обучение игнорирует уже существующие знания. Эксперты во многих областях, в которых машинное обучение пронизано, косо смотрят на подход «с чистого листа» алгоритмов обучения, которые они знают. Настоящие знания - это результат длительного процесса рассуждений и экспериментов, который невозможно воспроизвести, запустив общий алгоритм в базе данных. Но не все алгоритмы обучения начинаются с чистого листа; некоторые используют данные для уточнения уже существующей совокупности знаний, которые могут быть довольно сложными при условии, что они закодированы в форме, понятной компьютеру.

Модели, изучаемые компьютерами, непонятны людям. Это, естественно, вызывает беспокойство. Если алгоритм обучения - это черный ящик, как мы можем доверять его рекомендациям? Некоторые типы моделей действительно очень трудно понять, например глубокие нейронные сети, ответственные за некоторые из наиболее заметных успехов машинного обучения (например, распознавание кошек в видео на YouTube). Но другие вполне понятны, как правило диагностики рака кожи, которое мы видели ранее.

Все эти мифы пессимистичны в том смысле, что они предполагают, что машинное обучение более ограничено, чем оно есть на самом деле. Но есть и некоторые оптимистические мифы:

Более простые модели более точны. Это убеждение иногда приравнивают к бритве Оккама, но бритва говорит только о том, что более простые объяснения предпочтительнее, а не о том, почему. Они предпочтительнее, потому что их легче понять, запомнить и аргументировать. Иногда самая простая гипотеза, согласующаяся с данными, менее точна для предсказания, чем более сложная. Некоторые из самых мощных алгоритмов обучения выводят модели, которые кажутся необоснованно сложными - иногда даже продолжают добавлять к ним после того, как они идеально соответствуют данным, - но именно так они побеждают менее мощные.

Выявленные компьютерами закономерности можно принимать за чистую монету. Если алгоритм обучения выводит правило для диагностики рака кожи, которое мы видели ранее, и это правило очень точное (в том смысле, что почти все родинки, которые соответствуют ему, действительно являются опухолями), это не обязательно означает, что вы должны в это верить. Небольшое изменение данных может привести к тому, что алгоритм вызовет совсем другое - но столь же точное - правило. Можно доверять только тем правилам, которые надежно вводятся, несмотря на случайные вариации в данных, что они означают то, что они говорят, а не являются просто полезными инструментами для прогнозирования.

Машинное обучение скоро приведет к сверхчеловеческому интеллекту. Из ежедневных новостей о достижениях искусственного интеллекта легко создается впечатление, что компьютеры находятся на грани того, чтобы видеть, говорить и рассуждать так же хорошо, как и мы, после чего они быстро оставят нас в пыли. Мы, безусловно, прошли долгий путь за первые пятьдесят лет существования искусственного интеллекта, и машинное обучение является основной причиной его недавних успехов, но нам предстоит пройти еще долгий путь. Компьютеры могут очень хорошо выполнять многие узкие задачи, но у них все еще нет здравого смысла, и никто толком не знает, как их этому научить.

Вот и все. Машинное обучение одновременно мощнее, чем мы думаем, и меньше. Что мы с этим сделаем, зависит от нас - при условии, что мы начнем с его точного понимания.