Может ли куча спичечных коробков быть разумной?

В последние годы вокруг искусственного интеллекта было огромное количество шумихи, и это справедливо; некоторые из последних открытий могут соперничать с научной фантастикой. ИИ побеждает чемпионов мира в настольных играх, создает картины и фотографии, пишет стихи, создает музыку, видео, кодирует, складывает белки и диагностирует у пациентов редкие заболевания. Кажется, нет предела его возможностям.

Слово «ИИ» часто встречается, и оно создает иллюзию, что есть одна вещь, которая становится все более компетентной. Когда эта компетентность достигает определенного порога, мы начинаем приписывать ей чувствительность, потому что мы связываем с чувствительностью определенные виды компетентности. Например, в 2016 году чемпион мира по игре в го Ли Седоль отметил, что AlphaGo продемонстрировала несколько неожиданных ходов, которые показались вдохновенными и творческими. В 2022 году инженер Google заявил, что их чат-бот (LaMDA) стал разумным.

Одна из способностей, которую мы часто путаем с разумом, — это способность системы учиться и адаптироваться. Он интуитивно чувствует, что такой тип поведения требует интеллекта и, по крайней мере, некоторой степени чувствительности. Однако существует потрясающий пример аналоговой системы, разработанной в 1961 году, которая может помочь взглянуть на вещи в перспективе.

Учим играть со спичечными коробками

Мы уже потеряли чувствительность к тому, что компьютеры могут учиться в цифровом пространстве. Однако задолго до появления персональных компьютеров была разработана система, способная обыграть человека в игре в крестики-нолики (крестики-нолики), и она сделала это, изучив игру с нуля.

Система называется MENACE (Matchbox Educable Noughs and Crosses Engine) и была создана исследователем искусственного интеллекта Дональдом Мичи в 1961 году.

Идея проста. Я предоставлю пошаговую разбивку, чтобы воспроизвести механизм.

Шаг 1 — Возьмите спичечные коробки и цветные бусины.

Первый шаг — иметь под рукой несколько пустых спичечных коробков и цветные бусины — в большом количестве. Вскоре мы вернемся к точным математическим расчетам, но на данный момент это не важно.

Шаг 2 — Назначьте цвет каждому квадрату на доске

Когда все материалы будут готовы, мы сможем проверить, какие цветные бусины у нас есть в наличии, и назначить цвет бусинок каждому квадрату на доске.

Шаг 3. Создайте спичечный коробок для каждого штата Совета по правовым вопросам

Наша следующая задача — выделить спичечный коробок для каждой допустимой конфигурации доски, которая требует от нас сделать ход. На этом этапе мы сталкиваемся с ограничениями из-за огромного количества возможных состояний, поэтому нам нужно проявить изобретательность. Общее количество доступных ходов составляет 5478, и это слишком много спичечных коробков, чтобы кто-либо мог с ними справиться.

Однако существуют некоторые стратегии, позволяющие сократить количество необходимых спичечных коробков.

Вот стратегии, принятые Дональдом Мичи:

УГРОЗА всегда запускает игру. Это означает, что спичечные коробки должны учитывать только возможные ходы одного игрока.
Повернутые положения доски можно хранить в одном и том же спичечном коробке, поскольку конфигурация доски одинакова независимо от угла, под которым мы на нее смотрим.
Зеркальные положения доски также можно хранить в том же спичечном коробке, поскольку стратегия выбора следующего шага остается прежней.

Приняв эти стратегии, общее количество требуемых спичечных коробков сократится до 304.

Когда спичечные коробки готовы, мы рисуем поверх них конфигурацию доски и для каждого пустого квадрата помещаем в спичечный коробок бусины соответствующего цвета. Эти цветные бусины представляют наши возможности движения.

Мы повторяем это для каждого допустимого хода на доске, в результате чего у нас остается 304 спичечных коробка с состояниями доски сверху и бусами, обозначающими доступные разрешенные ходы внутри них.

Шаг 4 — Сделайте ход

Теперь, когда у нас готовы спичечные коробки, пришло время действовать.

Чтобы сделать первый шаг, нам необходимо:

Найдите спичечный коробок с пустой доской. Поскольку доска пуста, внутри спичечного коробка будут находиться бусины всех доступных цветов, представляющие каждый квадрат доски.
Встряхните бусины внутри спичечного коробочка и, не глядя, выньте из коробочки одну бисеринку. Сделайте выбор как можно более случайным.
Поместите свой ход на квадрат, обозначенный цветом бусины.

После того, как противник сделает свой ход, повторите процесс, найдя спичечный коробок с соответствующим рисунком на доске.

Шаг 4. Наградите или накажите ход

После каждого хода мы сохраняем коробку и бусину, чтобы можно было отслеживать последовательность наших ходов. Мы применяем метод под названием обучение с подкреплением, чтобы помочь спичечным коробкам научиться играть.

Вот стратегия:

Если мы выиграем, то кладем обратно в коробку 3 бусины одного цвета.
Если мы проиграем, мы не положим бусину обратно в коробку.
Если рисуем, то кладем бусину обратно в коробочку.
Мы делаем это для всех ящиков, которые были частью нашей последовательности перемещения.

Шаг 5 — Обучение спичечным коробкам

Удивительно, но если мы сыграем достаточное количество игр, используя эту стратегию, наши спичечные коробки научатся накапливать цвета бусинок, которые с наибольшей вероятностью приведут к выигрышной последовательности ходов, и, таким образом, научатся играть в идеальную игру. За 150 игр спичечные коробки достигают уровня, на котором они постоянно рисуют вничью или выигрывают у людей.

Совершенно ошеломляет то, что груда спичечных коробков может на собственном опыте научиться побеждать игрока-человека.

Виртуальные спичечные коробки

Теоретически мы могли бы использовать тот же подход, чтобы обыгрывать людей в шахматы или го. Проблема в том, что у нас быстро заканчиваются спичечные коробки. Если бы у нас был спичечный коробок для каждой песчинки со всех пляжей и пустынь мира, нам все равно не хватило бы спичечных коробков для моделирования шахмат.

Но вот в чем дело. Нам не нужны спичечные коробки, потому что у нас есть компьютеры, и что хорошо в компьютерах, так это то, что они могут обрабатывать маленькие виртуальные спичечные коробки с умопомрачительной скоростью. Другая замечательная вещь заключается в том, что они могут управлять их астрономическим количеством.

Кроме того, у нас есть стратегии и алгоритмы, позволяющие добиться большего с меньшим количеством виртуальных спичечных коробков, поскольку использование подхода УГРОЗЫ в определенном масштабе становится расточительным и непрактичным.

Однако интересно то, что мы, по сути, делаем то же самое с сегодняшним ИИ, но разработали гораздо более изощренные способы сделать это. У нас есть стратегии, в которых мы заставляем ИИ играть против самого себя, генератор против дискриминатора или просто снабжать его гигантским набором данных.

Прощальные мысли

Хотя наш подход к обучению машины чему-либо удивительно плодотворен, он основан на экстремальной грубой силе. Вместо бусинок мы со скоростью света перетасовываем кусочки, и в конце концов у нас получается груда спичечных коробков, которые мы называем гирями. Эти веса дают невероятные результаты, но, кроме эффективности, в цифровой сфере нет ничего особенного. Это просто груда виртуальных спичечных коробков, стоящих неподвижно, лишенных каких-либо желаний, потребностей, мнений или чувств.
Если мы обеспечиваем правильные входные данные, выходные данные кажутся разумными, что может быть потому, что так оно и есть по своей сути, но это не так. с таким же успехом может быть, что это кажется таким, потому что внутри него мы видим отражение самих себя.
В заключение, хотя чудеса ИИ продолжают раскрываться изо дня в день, нам важно ценить их, потому что чем они на самом деле являются: чрезвычайно полезными инструментами, ставшими возможными благодаря возможностям современных компьютеров. Куча спичечных коробков разумна в некотором смысле; однако он примерно так же разумен, как и сегодняшний ИИ.