Одной из первых вех компьютеризации процесса обучения было исследование с использованием игры в шашки [1], где была выдвинута гипотеза о том, что компьютер можно запрограммировать так, чтобы он научился играть в шашки лучше, чем человек, написавший программу. программа. Хотя был подчеркнут потенциал разработки схемы обучения, которая может превзойти действия человека, учитывая эпоху (1950-е годы) этой работы, структура обучения еще не была осуществима с экономической точки зрения для решения реальных жизненных задач. Современное общество превратилось в среду, обогащенную автоматизацией: от приложений личной помощи на смартфонах, распознающих голосовые команды, до потоковых сервисов, обучающихся предлагать фильмы.

Возможность программирования компьютеров для обучения и предоставления им возможности улучшать процесс принятия решений с течением времени высветила их потенциал в том, чтобы стать повсеместным в повседневной жизни и жизненно важным компонентом в промышленности. Успешное понимание того, как лучше всего позволить компьютерам учиться, позволит повысить эффективность многих повседневных задач.

Хотя степень, в которой их обучение сравнивается с человеческим, не была определена, потенциал очевиден. Обучение требуется в тех случаях, когда компьютерная программа для решения данной проблемы не может быть написана напрямую, а вместо этого требует примеров прошлого опыта или данных. Область машинного обучения связана с вопросом о том, как создавать компьютерные программы, которые автоматически улучшаются с опытом.

Рассмотрим пример задачи идентификации заболеваний в образцах тканей. Желаемым алгоритмическим результатом является указание на то, загрязнен ли образец следами болезни. Мы не можем преобразовать входные данные (образец ткани) в желаемый диагноз в чисто алгоритмических терминах, поскольку маркеры идентификации заболевания варьируются от образца к образцу. С введением данных, содержащих образцы как зараженных, так и незагрязненных образцов тканей, недостаток знаний может быть компенсирован с точки зрения изучения того, что представляет собой наличие болезни.

Введение данных позволяет алгоритмам машинного обучения принимать обоснованные решения на основе доступной информации. Неосознанно мы окружены примерами технологий, основанных на машинном обучении. Приложения персональной помощи на смартфонах учатся распознавать голосовые команды, позволяя использовать мобильный телефон без помощи рук в случае чрезвычайной ситуации. Стриминговые сервисы учатся предлагать пользователям фильмы на основе их истории выбора фильмов. В службе безопасности аэропорта автоматический паспортный контроль учится распознавать лица. Это снижает вероятность скопления пассажиров, а также расширяет возможности службы безопасности аэропорта. Что касается автономных транспортных средств, машинное обучение позволило им распознавать объекты. Это имеет первостепенное значение для безопасности человека в случае, если автономные транспортные средства станут постоянным элементом общества.

Хотя в каждом приложении был достигнут относительный успех, эффективность алгоритма машинного обучения обычно зависит от качества используемых данных. По правде говоря, модели, управляемые данными, хороши ровно настолько, насколько хороши данные, на основе которых они были построены.

[1] А. Л. Самуэль. Некоторые исследования в области машинного обучения с использованием игры в шашки. Журнал исследований и разработок IBM, 3(3):210–229, июль 1959 г.