Или что значит быть интеллектуальной машиной?

Авторы Колтон Магнант, Дэвид Гамба и Алексис Каррильо Рамирес

Постоянно растущий интерес к обществу человека и машины не подлежит сомнению. И это больше не только для практиков ИИ: ИИ, как никогда, является междисциплинарным. Многие эксперты из самых разных областей (антропология, психология, нейробиология и когнитивная наука, социология) задают вопросы с разных точек зрения. Но есть один главный вопрос, который их всех объединяет: что такое «интеллект»? Может ли агент показать «общий» интеллект? Есть ли уникальный и универсальный интеллект? Эти вопросы заставляют многих из нас «удивляться» реальной значимости хорошо известных механизмов оценки, в частности теста Тьюринга.

Но подождите, о чем тест Тьюринга?

Алан Тернинг разработал простой тест для оценки интеллектуальных машин. Согласно тесту, если человек-оценщик не может различить естественный язык, исходящий от человека и от машины, значит, машина прошла.

В этой статье мы исследуем идею прохождения ИИ теста Тьюринга (или его варианта), а также того, актуален ли этот тест и нужен ли нам новый критерий.

Мы показываем три точки зрения на тест Тьюринга и последствия того, что машины преуспеют в нем.

Во-первых, мы обсуждаем интеллект с позиции когнитивной науки (в основном человека). Во-вторых, мы обсуждаем последствия с точки зрения социолога. Наконец, мы смотрим на это с точки зрения эксперта по машинному обучению (ML) и AGI (общего искусственного интеллекта).

Что говорит когнитивная наука?

В статье в Википедии об исходной статье Тьюринга есть параграф, который четко объясняет динамику теста:

Как отмечает Стеван Харнад, вопрос звучал так: «Могут ли машины делать то, что можем делать мы (как мыслящие сущности)?» Другими словами, Тьюринг больше не спрашивает, может ли машина «думать»; он спрашивает, может ли машина действовать неотличимо от того, как действует мыслитель. Этот вопрос позволяет избежать сложной философской проблемы, связанной с определением глагола «думать», и вместо этого сосредотачивается на рабочих способностях, которые делает возможными способность думать, и на том, как причинная система может их порождать.

Учитывая это, природа теста Тьюринга больше связана с эмулятором (или имитатором), а не с репликатором интеллекта. Это означает, что важен результат, а не промежуточный процесс. Разработка алгоритмов машинного обучения основана на этой фундаментальной идее: цель состоит не в воспроизведении, а в имитации сложного поведения. Например, искусственный нейрон (AN) использует идею биологических нейронов (BN) о получении некоторых входных данных, их объединении и выдаче выходных данных. В то время как BN достигает этого с помощью электрохимических процессов, AN действует с помощью матричной алгебры. В конечном итоге результат очень похож, но средства, задействованные в процессе, совершенно разные.

Идея определения интеллекта как чего-то, что машина может использовать, приводит нас к психологической (когнитивной науке) точке зрения на интеллект. Все психологические конструкции, которые исследует (когнитивная) психология, определяются в терминах наблюдаемого поведения, включая интеллект. Оценка интеллекта означает, что вы подсчитываете несколько действий, на которые способен человек, которые считаются тем, что может сделать умный человек. Однако нет единого мнения о том, какие действия обозначают интеллект.

Общий интеллект = человеческий интеллект

Достижения в области психометрии привели к появлению концепции интеллекта как уникальной сущности, которая обеспечивает высокий уровень производительности при тестировании нескольких способностей, известном как общий интеллект, который является основной моделью для понимания человеческого интеллекта. Психометристы, такие как Чарльз Спирмен, разработали математические формулировки, поддерживающие эти показатели: фактор g. В психологии до сих пор нет твердого слова об определении интеллекта, несмотря на все исследования; это область в текущем развитии. Если у нас нет четкого понимания или определения (человеческого) интеллекта, определения и значения (нечеловеческого) искусственного интеллекта могут быть только менее ясными. Если мы примем во внимание тот факт, что наше эталонное состояние (также известный как тест Тьюринга) в основном основано на оценке `` человеческого '' интеллектуального поведения агента (машины), мы можем спросить себя, имеет ли этот тест прочную основу, основанную на все еще «необъяснимое» понятие: наш собственный разум.

Актуален ли тест Тьюринга?

Тест Тьюринга был эталоном для оценки виртуального мира с неразличимыми взаимодействиями человека и машины. С самого начала ИИ мы предполагали, что прохождения теста Тьюринга должно быть достаточно, чтобы «подтвердить» подлинный интеллект агента. Однако есть много потенциальных возражений против теста Тьюринга. Мы уже положили на стол один из них:

Ограничение 1: нет четкого понимания человеческого интеллекта.

Однако можно утверждать, что тест Тьюринга может моделировать среду, в которой машина демонстрирует этот «человеческий» интеллект без какого-либо глубокого формализма того, что означает интеллект, верно? Итак, давайте посмотрим на некоторые дополнительные ограничения текущего теста Тьюринга.

Ограничение 2: не захватывает общий интеллект.

Современные системы искусственного интеллекта успешно демонстрируют интеллект в нескольких задачах (медицинская диагностика, компьютерное зрение, распознавание речи, распознавание лиц, NLU, финансовый анализ и т. Д.). ИИ сделал это впечатляющим и очень эффективным способом (иногда даже превосходя человеческие пороги). Однако очень немногие (если не почти ни один) из них были способны продемонстрировать интеллект «человеческого уровня». Давайте на минутку задумаемся о нас, людях. Мы способны решить (почти) любую проблему, и наш интеллект не ограничивается конкретной автоматизацией или конкретными задачами.

Проще говоря, мы не ограничены какими-то конкретными задачами (помимо наших предыдущих знаний, но всегда есть возможность улучшить, действительно используя наш интеллект).

Мы демонстрируем общий интеллект для решения наших повседневных проблем: независимо от характера задачи и предыдущего опыта мы можем найти путь, который приведет нас к решению (иногда более близкому к нашему желаемому результату, чем другие, то есть человеческой жизни).

Ограничение 3: измеряет только разговорный интеллект.

Что ж, вот еще одно ограничение оценок на основе теста Тьюринга (по крайней мере, до сих пор!). Тест Тьюринга фокусируется на измерении речевых способностей (которые, как вы, возможно, уже представляете ... наш человеческий интеллект включает в себя многие другие способности к рассуждению, помимо словесных рассуждений, таких как числовые, логические и иногда недооцененные: эмоциональный интеллект. интеллект - наше лучшее «оружие» для успешного сосуществования в нашем обществе. Будет ли он распространен на машины? Будет ли он ключом к плодотворному сосуществованию в «гибридном» обществе, в котором люди и машины может взаимодействовать на одном уровне? Может, нам стоит задуматься о том, каким будет это «сосуществование» с точки зрения прав и обязанностей и текущего регулирования (или отсутствия регулирования).

Наибольшие успехи?

Между тем вопрос о том, насколько мы далеки от этого будущего гибридного общества, остается спорным, но несколько хорошо зарекомендовавших себя компаний, таких как Google, были отмечены тем, что прошли тест Тьюринга. Давайте вместе вспомним бум с Google Duplex или Eugent Goostman. AlphaGo от Deepmind стал еще одной большой победой на пути к более интеллектуальному ИИ. Но можем ли мы когда-нибудь сказать, что машина от AlphaGo могла понять, какова была интуиция, лежащая в основе игры? Плюс случай с AlphaGo был немного сложнее. Опять же, ИИ смог превзойти человеческие возможности только в конкретной задаче: в игре. IBM Watson победила в битве человек против машины в Jeopardy! и приблизили нас к мечте об общем интеллекте: Watson смог побеждать в игровом соревновании в реальном времени и давать ответы в соответствии с правилами игры. Однако мы не живем в игре или моделируемой среде с ее определенными правилами, не так ли?

Наш мир намного сложнее, поэтому наличие теста, работающего при этих сильных предположениях с точки зрения репрезентативности окружающей среды реального мира, кажется немного наивным. Машине придется решать гораздо более сложные задачи, если она когда-либо будет представлена ​​в нашей системе (обществе): как индивидуально, так и как социальный член.

Но давайте возьмем тест Тьюринга как действительное «доказательство» «человеческого» индивидуального интеллекта. Что, если агент сможет пройти тест Тьюринга? Должно ли этого быть достаточно для «проверки» агента? Или нам нужен «этический» (моральный) тест Тьюринга, прежде чем применять его в «нашем мире»?

Мы, люди, по своей природе социальные животные. Если мы посмотрим на ИИ как на новый элемент (заинтересованное лицо) в социальном (уравнении), все станет еще немного сложнее. Многих социологов беспокоит текущая реальность: нам не хватает механизмов для `` имитации '' или, по крайней мере, моделирования реальной среды, в которой мы могли бы `` наблюдать / наблюдать '' за поведением любого немягкого агента ИИ перед тем, как представить его нашему реальному обществу. . Возможно, вопрос уже не в том, как мы должны оценивать производительность машин (особенно с индивидуалистической точки зрения), но позволить им быть «в дикой природе» и найти новые механизмы для более плавного перехода.

Тест Тьюринга полагается на разговорный интеллект для определения возможностей машины. Эксперты считают, что язык появился благодаря нашей социальной природе. Мы используем язык, чтобы кодировать наш опыт и выражать себя, даже в наших внутренних монологах. Возможно, для интеллекта не нужен язык, точно так же, как осьминоги не нуждались в обществе для формирования интеллекта.

Машины, которые так отличаются от нас, могут выражать совершенно разные способы интеллекта.

Таким образом, антропоцентрическая природа теста Тьюринга может заставить нас искать зеркало нашего собственного интеллекта, где мы не можем воспринимать что-то иное, нечто уникальное.

Итак, тест Тьюринга устарел?

Таким образом, возникает вопрос, устаревает ли Тест или все еще отражает действительную меру интеллекта. Это зависит от того, связываете ли вы интеллект с языком. Если да, то это означает, что машина, способная к ОИИ, должна быть разговорной? Или, если нет, как машина может без слов доказать свою «общую разведку»? Эти вопросы побуждают нас исследовать возможности различных тестов для AGI.

ИИ способен на многое, и список областей, в которых ИИ может превзойти даже человеческие возможности, постоянно растет. С другой стороны, системы искусственного интеллекта по-прежнему создаются людьми и ограничены в объеме их обучающими данными (возможно, расширенными за счет данных, которые могут быть сгенерированы в рамках заданных параметров).

Чтобы обсудить потенциал ИИ, чтобы стать «более человечным», чем человек, мы должны сначала подумать, что для нас значит быть человеком. Если мы определяем человечество по способности выиграть матч Jeopardy, победить другого пилота в воздушном бою или победить гроссмейстеров го или шахмат, то кажется, что ИИ уже взял верх, но истинное человечество намного сложнее.

Мы живем в постоянном повсеместном распространении «узкого» ИИ. Мы не останавливаемся, чтобы обдумать это, может быть, из-за суеты жизни или просто потому, что мы рассматриваем это как часть нашей нормальности, но ясно одно: ИИ уже является частью нашей повседневной жизни. Мы встроили ИИ в наши телевизоры, приложения GPS, мобильные телефоны или другие решения IoT в качестве виртуальных помощников (Alexa, Siri, Google Assistant); и, конечно же, невозможно представить, что мы потребляем товары для отдыха, не заглянув в некоторые популярные системы рекомендаций, такие как Netflix или Amazon.

Ситуация развивается еще быстрее из-за наших текущих неотложных потребностей из-за COVID-19. COVID подталкивает наше общество (к сожалению или нет) к тому, чтобы максимально использовать современные технические решения, включая многие решения, ориентированные на ИИ, которые позволяют нам быстро и менее рискованно отвечать на потребности человека (удаленная помощь). ИИ был ключевым фактором для борьбы с пандемией и контроля над ней во многих аспектах (обмен знаниями и результатами, оценка воздействия городской мобильности, выработка политики), но особенно в оказании помощи перегруженным медицинским учреждениям (чат-боты удаленного обслуживания, ультрасовременные роботизированные больницы в Китае, роботы для быстрой дезинфекции кабинетов радиологии с низким уровнем риска).

У людей чувство родства и принадлежности к сообществу иногда бывает настолько сильным, что мы можем видеть немного разных людей совершенно отличными от нас. В крайних случаях это может привести к агрессивному трайбализму, представлениям о превосходстве своей группы и дискриминации. Мы видели это (и, к сожалению, продолжаем видеть) с людьми разного цвета кожи, из разных стран, разных религий. Даже при искусственных различиях это влияние мощно, как, например, системы, навязанные колониализмом Африке, только для того, чтобы разделить устоявшиеся общины. Чтобы противостоять этому эффекту, часть нынешнего дискурса о равенстве опирается на невысказанное представление о том, что, хотя все мы можем выражать свое мнение по-разному, в своей основе мы одинаковы и заслуживаем равных прав и уважения.

Однако что мы делаем, когда сталкиваемся с существом, настолько сильно отличающимся от нас, что этот аргумент больше не актуален? Это один из ключевых вопросов, который поднимает общий ИИ при прохождении теста Тьюринга.

Эта статья появилась благодаря замечательной инициативе академии писателей Омдена! Статья изначально была опубликована в блоге Омдены.