Понимание машинного обучения как распознавания образов

Для тех, кто не понимает основных концепций машинного обучения, это просто введение.

Машинное обучение — это, по сути, распознавание образов. Чтобы объяснить, как это работает, мы возьмем простой пример, в котором вы, читатель, представляете машину, выполняющую обучение.

Для этого примера мы возьмем несколько предложений на иностранном языке, который, как мы предполагаем, вы не знаете. Это эквивалентно тому, что компьютер изучает что-то, о чем у него нет предварительных знаний.

Поскольку я когда-то изучал немецкий язык, я буду использовать это в качестве примера.

Возьмите следующие четыре предложения:

1. Ich bin oft sehr glücklich.
2. Ich bin oft sehr traurig.
3. Ich war часто sehr glücklich.
4. Ich war часто sehr traurig.

Если вы не знаете немецкого, то вы точно не знаете, что они означают. Но давайте сначала рассмотрим более простой вопрос, который часто возникает в машинном обучении. Каково настроение этих предложений? Другими словами, вы бы описали основное «чувство» писателя как положительное или отрицательное?

Если я скажу вам, что первое и третье — положительные, а второе — отрицательное, вы, вероятно, сможете догадаться о настроении четвертого.

Теперь это может показаться не очень эффективным способом проведения анализа настроений. Однако представьте, если бы вы могли читать 100 или 1000 предложений в секунду и запоминать миллионы предложений. Это то, на что способна машина, обученная проводить анализ настроений.

Концептуально так работает машинное обучение. Он идентифицирует закономерности в обучающих выборках (предложения 1–3) и использует их, чтобы предсказать (догадаться) что-то об аналогичном вводе (предложение 4), для которого ему не был дан ответ. В действительности, конечно, разработка и реализация алгоритмов машинного обучения намного сложнее, чем можно предположить из этого объяснения.

В случае, если это не очевидно, предложение 4 имеет негативную окраску.

Теперь давайте посмотрим на использование машинного обучения для перевода. Здесь мы предоставляем переводы для первых 3 предложений.

1. Ich bin oft sehr glücklich. = Я часто очень счастлив.
2. Ich bin часто sehr traurig. = Мне часто бывает очень грустно.
3. Ich war часто sehr glücklich. = Я часто был очень счастлив.
4. Ich war часто sehr traurig.

Вероятно, вы сможете сделать вывод о переводе четвертого предложения, зная первые три. Опять же, это кажется очень неэффективным способом выполнения перевода, но если у машины есть доступ к миллионам переводов, она часто может переводить предложения, которые не видела, потому что распознает похожие шаблоны. Опять же, я не говорю, что именно так работают алгоритмы машинного перевода, но это дает вам некоторое представление об ограничениях и потенциале машинного обучения в целом.

Эти простые примеры дают нам несколько важных уроков о машинном обучении:

  1. Эти типы машинного обучения, анализа настроений и перевода обычно могут работать только в том случае, если машине предоставлены помеченные обучающие данные. Под размеченными данными мы подразумеваем примеры с правильным значением. В этом случае это будет правильный тон или перевод для каждого предложения.
  2. Результаты настолько точны, насколько точны данные, которые были предоставлены для обучения.
  3. Для обучения компьютеров решению реальных задач часто требуется огромное количество данных.
  4. Машина не понимает текст, она только видит шаблоны, похожие на данные, для которых она знает правильный ответ.
  5. Важнейшим показателем успеха является то, может ли обученная модель обобщать, т. е. предсказывать выходные значения для данных (предложений здесь), на которых она не обучалась.
  6. Машинное обучение редко дает 100% точные результаты. Обычно он делает свое «наилучшее предположение», но обычно он также может сказать вам процентную вероятность того, что он правильный.

Для справки, перевод последнего предложения:

4. Мне часто было очень грустно.

Я надеюсь, что вы нашли этот пост в блоге информативным и/или наводящим на размышления.

Если у вас есть какие-либо мысли, комментарии или вопросы, пожалуйста, дайте мне знать.

Спасибо
Патрик