Что не так с тестом Тьюринга?

Что такое тест Тьюринга?

Я уверен, что вы слышали о тесте Тьюринга, но если вам это интересно, читайте дальше! Короче говоря, тест Тьюринга — это мера интеллекта машины, разработанная английским математиком Аланом Тьюрингом. Тест определяет машинный интеллект как то, может ли машина неоднократно обманывать человека.

Тьюринг постулировал, что машина считается разумной, если она может пройти тест Тьюринга. Тест устроен следующим образом. Машина и человек размещены в двух отдельных помещениях. Человек-дознаватель или оценщик сидит в третьей комнате, где машина и человек отделены от следователя. Оценщик-человек может общаться с человеком и машиной только через текстурное устройство, такое как система обмена сообщениями на естественном языке. Используя одно и то же текстовое устройство для связи с машиной и другим человеком, следователь-человек должен попытаться отличить машину от человека на другом конце. Если следователь-человек не может их различить, то машина считается разумной. С помощью этого теста Тьюринг определяет, что отличительная черта машинного интеллекта заключается в том, что он может быть неотличим от человека.

Тест легко настроить после того, как будут установлены логика и правила текстового устройства. Однако тест изобилует недостатками, и было поднято много вопросов о достоверности теста Тьюринга.

Критика теста Тьюринга

Одна критика теста Тьюринга заключается в том, что тест распознает интеллект только у тех вещей, которые могут разговаривать с людьми. Почему интеллект можно распознать только в разговоре? Почему не в действии, или функции, или исследовании? Почему только люди? Что, если бы машину можно было научить понимать животных, разве это не было бы интеллектом? Если вести себя с текстом как человек, это не обязательно означает интеллект. Тест Тьюринга имеет ограниченные возможности. Кроме того, тестовая среда создается вручную и оказывает большое влияние на результат. Например, на результаты теста также может сильно повлиять характер самого текстового устройства или характер разговора. Недоброжелатели считают, что разведка не должна ограничиваться этим ограниченным сценарием. Машины способны автономно выполнять человеческие задачи (например, готовить и строить), исследовать новые среды, общаться с другими машинами и понимать аспекты поведения людей и животных. Эти типы способных систем, возможно, не следует списывать со счетов как неразумные только потому, что они не проходят надуманный тест Тьюринга. На эту критику Тьюринг отвечает, что если машина может поддерживать разговор с человеком, то мы знаем, что машина должна иметь интеллект, аналогичный человеческому. Таким образом, знание человеческого интеллекта служит полезным ориентиром для рассмотрения и оценки машины.

Другая критика заключается в том, что тест Тьюринга недостаточно сложен. В некоторых исследованиях простые, относительно неинтеллектуальные программы, такие как ELIZA (ранняя компьютерная программа обработки естественного языка), обманывали обычных наблюдателей в течение длительных периодов времени. Защита от этой критики заключается в том, что тест Тьюринга более сложен, чем простое одурачение обычных людей, наблюдаемых в разговоре; для этого требуется, чтобы машина выдержала допрос оценщика, который знает, что один из двух участников беседы — машина. Однако эта критика поднимает важный вопрос об определении сложности теста. Машина должна выдержать допрос в течение многократного количества испытаний. Слишком малое количество попыток существенно облегчает машине повторный обман следователя. Очень большое количество испытаний значительно усложняет работу машины. Во время испытаний должна ли машина лгать? Если человек долго допрашивает машину, а цель машины — помочь человеку, то что происходит, когда человек-дознаватель спрашивает: Вы машина? Еще одна проблема с тестом Тьюринга заключается в том, что он ограничивает рассмотрение машин цифровыми компьютерами. Однако есть много других типов машин, которые могут быть интеллектуальными. Некоторые примеры включают аналоговые компьютеры, непрерывные конечные автоматы и дискретные конечные автоматы. Сам Тьюринг даже соглашается с тем, что класс возможных машин охватывает даже машины, которые не являются цифровыми или технологическими.

Кроме того, тест Тьюринга не проверяет очень сложное интеллектуальное поведение. От машины не требуется решать сложные проблемы или придумывать решения для новых и невиданных проблем. Ему не нужно уметь мыслить логически или творчески, запоминать новую информацию или узнавать что-либо, интерполировать или экстраполировать. Если следователь дает человеку и машине сложное вычисление, которое человеку чрезвычайно трудно решить, но которое машина может вычислить легко, машина, скорее всего, без труда обманет оценщика. Обман следователя — единственный показатель успеха. Джон Сирл утверждал, что компьютер может имитировать интеллект, а не быть разумным. В своем эксперименте Китайская комната он показал, что такая машина может просто научиться выбирать ответы (китайские буквы), удовлетворяющие оценщика, но на самом деле не понимать, что означают ответы.

Наконец, последняя проблема заключается в том, что тест Тьюринга варьируется в зависимости от следователя и человека. Результаты теста зависят от интеллекта следователя и предшествующих систем убеждений относительно того, каким должно быть человеческое поведение. Решение следователя выбрать ту сторону, которая «действует более по-человечески», крайне субъективно. Интересно, что следователи-люди часто неправильно классифицируют людей как машины, потому что они считают, что человек должен был действовать более непоследовательно или уникально. Эта предвзятость проистекает из убеждения следователей в том, что люди будут демонстрировать некоторый явный показатель превосходства над машиной.

Несмотря на критику, сила и привлекательность теста Тьюринга заключаются в его простоте. Это также позволяет тестировать широкий спектр вещей, если они могут быть выполнены в интерактивном режиме.

Использованная литература:

[1] https://plato.stanford.edu/entries/turing-test/

Что не так с тестом Тьюринга?

Что такое тест Тьюринга?

Критика теста Тьюринга

Использованная литература:

Вопросы по теме