Недавно возобновился интерес к старому спору о символическом и несимволическом ИИ. Последняя статья Гэри Маркуса подчеркивает некоторые успехи на символической стороне, а также подчеркивает некоторые недостатки современных подходов к глубокому обучению и выступает за гибридный подход. Я сам также являюсь сторонником гибридного подхода, пытаясь объединить силу глубокого обучения с символическими алгоритмическими методами, но я бы не стал вести дискуссию по оси символ/несимвол. Как уже некоторое время отмечал сам Маркус, большинство современных исследований архитектуры глубоких сетей на самом деле уже имеют дело с той или иной формой символов, завернутой в жаргон глубокого обучения встраивания или распутанные скрытые пространства. Всякий раз, когда говорят о какой-то форме ортогональности в описательных пространствах, это на самом деле связано с понятием символа, которому можно противопоставить запутанные, неприводимые описания.

На самом деле есть нечто более глубокое, чем это поверхностное различие символов, которое здесь играет роль, и оно связано с самим опытом обучения. В основном есть две оси, в которых я вижу спектр вариаций, и которые должны помочь подумать о том, как правильно выйти за пределы текущей доминирующей парадигмы:

  • То, как новая информация внутренне модифицирует систему, другими словами: сам механизм обучения.
  • Как новая информация поступает и подается в систему.

Давайте посмотрим, как современные нейросетевые подходы позиционируют себя по отношению к этим двум вопросам, и какой альтернативный (и дополнительный) путь может существовать, который привел бы к плодотворным расширениям текущей парадигмы и потенциально помог бы устранить недостатки, на которые критики глубокого обучения обращали внимание. озвучивание.

Отказ от ответственности: для ясности, поскольку дебаты довольно жаркие, я не говорю здесь, что глубокое обучение упирается в стену или что им не следует заниматься. Я хочу отстаивать дополнительные и альтернативные подходы, которые будут укреплять глубокое обучение и ИИ в целом. Недавние исследования в области глубокого обучения, безусловно, принесут большой прогресс, и эти результаты сыграют центральную роль в решении сильного ИИ, но я считаю, что это только часть решения. Давайте посмотрим, почему в обсуждении ниже.

Дифференцируемость — это еще не все, что вам нужно

Что характеризует все текущие исследования методов, основанных на глубоком обучении, не только многоуровневых сетей, но и всех видов производных архитектур (трансформеры, RNN, в последнее время GFlowNet, JEPA и т. д.), так это не отказ от символов, по крайней мере, не в их возникающей форме. Это скорее требование сквозной дифференцируемости архитектуры, чтобы к обучению можно было применить некоторую форму метода на основе градиента. Это очень сильное ограничение, применяемое к типу исследуемых решений, и представляется как единственный вариант, если вы не хотите выполнять исчерпывающий поиск в пространстве решений, который, очевидно, не будет масштабироваться (критика, часто направленная против классических символьные методы ИИ).

Идея градиентного спуска смешивает две вещи: градиент и спуск. Часть «спуска» по праву ратует за процесс небольших пошаговых обновлений, направленных на улучшение локального решения: действительно, если у вас нет оракула, который мог бы показать, что вам нужно делать, то сразу «перескакивать» к хорошему решению, начиная с ниоткуда нельзя. Критериев для «расчета» глобального скачка просто нет. Все, что вы можете сделать, это попытаться постепенно двигаться к лучшему решению, зная, где вы находитесь в данный момент.

Теперь сделать небольшой шажок — это одно, но как именно выполнить это движение? Это «градиентная» часть. Если у вас есть возможность вычислить градиент, то это оптимальный выбор: просто немного продвиньтесь по этому градиенту в направлении улучшения, пересчитайте градиент по прибытии в пункт назначения, промойте и повторяйте, пока не достигнете (локального) значения. минимумы. Конечно, вокруг этой идеи есть много усовершенствований (SGD, ADAM и т. д.), но основной принцип тот же: если у вас есть градиент, у вас есть «локальный оракул», который говорит вам, куда пойти локально, чтобы улучшить вашу текущую ставку. .

Я бы сказал, что решающую роль здесь играет не «градиент», а «спуск» или осознание того, что вам нужно двигаться небольшими шагами вокруг вашего текущего положения (также называемое «градиентным спуском»). Если в вашем распоряжении нет градиента, вы все равно можете исследовать близлежащие решения (наугад или с помощью какой-либо эвристики) и выяснить, куда идти дальше, чтобы улучшить текущую ситуацию, взяв лучшее из проверенных мест. Наличие градиента просто более эффективно (фактически оптимально), в то время как выбор набора случайных направлений для исследования местного ландшафта, а затем выбор наилучшего варианта является наименее эффективным. И можно вообразить всевозможные промежуточные позиции вдоль этой оси, если вы сможете ввести некоторую предвзятость, специфичную для предметной области, в зондирующем отборе, вместо того, чтобы просто выбирать случайным образом.

Типичным примером поиска с использованием случайного зондирования текущей позиции является, конечно, эволюционная динамика. В случае с генами небольшие перемещения вокруг текущего генома выполняются, когда происходят мутации, и это представляет собой слепое исследование пространства решений вокруг текущей позиции с помощью метода спуска, но без градиента. В общем, несколько локаций исследуются параллельно, чтобы избежать локальных минимумов и ускорить поиск. Эволюционная динамика в целом применима ко многим областям, начиная с эволюции языка, и является чрезвычайно успешным методом исследования определенных пространств решений, для которых нельзя просто вычислить градиент (это непрерывные, но недифференцируемые пространства).

Здесь есть две заметные оговорки: во-первых, мы по-прежнему предполагаем, что пространство решений каким-то образом непрерывно, а это означает, что качество решения не меняется скачком в малой окрестности в пространстве решений, и имеет смысл исследовать локальные варианты . Контрпримером этого являются, например, хеш-функции, которые разработаны именно против этого свойства. Если вы нацеливаетесь на конкретный результат хеш-функции, то ваш единственный вариант — пробовать случайным образом, пока не найдете совпадение (на чем основаны задачи биткойн-хеширования). Таким образом, здесь действительно нечему учиться, и требование непрерывности или, по крайней мере, частичной непрерывности, вероятно, является разумным ограничением, которое следует соблюдать в контексте обучения. Во-вторых, размерность пространства решений может быть настолько велика, что случайный поиск, даже просто вокруг известной точки решения, невозможен. Я считаю, что это типичный случай, когда нам нужно поместить курсор где-то посередине оси градиент-случайность и ввести эвристику для управления поиском. Это в некоторой степени то, что уже сделано с AlphaGo или подобными недавними системами, когда оракул глубокого обучения используется для управления более систематическим поиском. Кроме того, такие алгоритмы, как CMA-ES, эффективно вычисляют аппроксимированный градиент из чисто случайной стратегии выборки и будут находиться прямо посередине оси, как и алгоритмы оптимизации черного ящика в целом.

Еще одна интересная подтема здесь, помимо вопроса «как спуститься», — с чего начать спуск. Конечно, вы можете выбрать начальное условие случайным образом или начать с нескольких позиций, чтобы избежать локальных минимумов, но на самом деле это гораздо более сложный вопрос, связанный с исследованиями, основанными на любопытстве, и, в более общем плане, с дискуссиями между исследованием и эксплуатацией, которые выходят за рамки рамки этого обсуждения.

Итак, возвращаясь к теме, основная проблема, ограничивающая глубокое обучение или, в более общем смысле, «дифференцируемое программирование», заключается не в отказе от символов (символы каким-то образом обрабатываются эмерджентным образом), а в его концентрации на обработке только пространств решений, которые случается, чтобы учесть вычисление градиента. Конечно, нет ничего плохого в изучении этих случаев, и каким бы ни было решение для сильного ИИ, можно поспорить, что методы, основанные на градиенте, станут его важной частью, но, вопреки тому, что часто утверждается, просто нет научного решения. причина думать, что это должен быть единственный путь вперед, с решительным отказом от всего, что не является «полностью дифференцируемым». Ось дифференцируемое/недифференцируемое существует, и я подозреваю, что многие основные проблемы сильного ИИ, такие как языковая основа или даже самоуправляемые автомобили, требуют решений, расположенных где-то на этой линии. Сочетание дифференцируемых методов, когда это применимо, с эволюционной динамикой на дискретных (= символических) структурах, когда это уместно, может привести к существенному прогрессу в этой области.

Не могу удержаться от небольшого отступления насчет параллели, которую можно провести с современными течениями в физике. До сих пор вся успешная физика формулировалась в рамках дифференциальных уравнений, действующих на непрерывные и дифференцируемые переменные. Это то, что Вигнер назвал необоснованной эффективностью математики в естественных науках. В последнее время все больше и больше исследователей изучают возможность того, что Природа лучше всего описывается в малых масштабах дискретными структурами, а эволюция формулируется как дискретное преобразование этих структур (см., например, работы Причинные множества, Петлевая квантовая гравитация или даже проект Физика Вольфрама). Как будто в какой-то момент неразумная эффективность заканчивается и реальность уже не может быть аппроксимирована моделями, предлагающими градиенты: мы должны спуститься к сырому машинному коду, который по своей сути является дискретным, ступенчатым, композиционным и нередуцируемым. . Можно задаться вопросом, правы ли эти физики (трудно придумывать предложения об экспериментах в таком масштабе, поэтому мы можем никогда не узнать об этом), и не присутствует ли в ИИ какая-то подобная дихотомия, как обсуждалось выше.

Дифференцируемые функции и программы

Изучение дифференцируемых функций может быть выполнено путем изучения параметров всех видов параметризованных дифференцируемых функций. Глубокое обучение создало особенно плодотворный класс параметризованных дифференцируемых функций в виде глубоких нейронных сетей, способных аппроксимировать невероятно сложные функции на входных данных с чрезвычайно большой размерностью. Теперь, если мы откажемся от ограничения, что функция, которую мы пытаемся изучить, дифференцируема, какое пространство представления мы можем использовать для описания этих функций? Что ж, самый простой ответ на этот вопрос — сделать шаг вперед с точки зрения общности и рассмотреть программы. Они могут быть такими же простыми, как двоичные деревья решений, или такими же сложными, как какой-то сложный код, похожий на Python, или какой-либо другой DSL (предметно-ориентированный язык), адаптированный для ИИ.

Важно отметить, что программы обладают следующими свойствами:

  • они дискретны по структуре и, следовательно, могут легко подвергаться мутациям, обеспечивая локальное неградиентное исследование решений.
  • они композиционны, допускают не только мутации, но и скрещивание
  • они носят иерархический характер, позволяя строительным блокам, из которых состоят программы, быть самими программами, обогащая выразительную силу поиска при попытке найти новые программы.

Случайное перемещение в пространстве программ было бы неэффективным. Вот пример гибридизации: использование методов глубокого обучения, например, графических нейронных сетей, чтобы помочь угадать начальную точку, а также предоставить оракула при исследовании данного существующего решения при выполнении спуска (вместо случайного изменения программ). ). Мы оказываемся здесь где-то посередине градиентно-случайной оси, о которой мы говорили выше, с не совсем случайным, но и не полностью детерминированным зондированием шага в спуске. Обратите внимание, что многие многообещающие исследования графовой нейронной сети уже дают результаты в части оракула, упомянутой выше.

Другой пример того, что можно сделать с точки зрения гибридизации, — это то, как мы могли бы использовать генетический алгоритм для разработки формальной грамматики для конкретного языка, используя большую языковую модель, такую ​​как GPT-3, в качестве оракула для вычисления пригодности путем сравнения типа предложения, которые произносят текущие кандидаты в грамматики, и оценивают, насколько статистически реалистично они звучат. Это хорошее сочетание статистической оценки (со всеми ее приближениями, но для приспособленности это приемлемо) и эволюции формальной структуры, которая дает много вычислительных преимуществ после стабилизации окончательной грамматики.

В качестве примечания интересно отметить, что требование дифференцируемых функций для обработки входных данных влечет за собой требование «сглаживания» данных в векторы для ввода (или матрицы, тензоры и т. д.). Этот процесс теряет потенциально рекурсивную структуру элементов входного пространства, которая может быть легко использована программой в недифференцируемой структуре (подумайте о графах, гиперграфах или даже самих программах в качестве входных данных). Конечно, можно восстановить часть структуры в нейросетевом каркасе, в частности, с помощью преобразователей и внимания, но это выглядит как очень запутанный способ сделать то, что задано в естественной исходной форме входных данных. . Значительные усилия с точки зрения времени исследования и времени вычислений направлены на то, чтобы обойти ограничение векторизации композиционной/рекурсивной сложной информации, чтобы восстановить то, что уже было с самого начала.

Возникновение человеческого интеллекта обусловлено культурой

Теперь давайте перейдем ко второму важному моменту, который я хотел обсудить. Обучение обычно включает в себя подачу в систему новой информации. Оказывается, особую роль здесь играет способ подачи информации. Не только с точки зрения того, насколько быстро он может сходиться, но и для всех практических целей (при условии конечного времени) с точки зрения способности сходиться вообще.

В большинстве случаев машинного обучения информация подается в систему пакетами. Это верно как для обучения с учителем, так и для обучения без учителя, когда для обучения системы собираются большие наборы изображений или видео. Это приводит к установлению контрольных точек, с которыми сравниваются конкурирующие модели. Сообщество хорошо осознает тот факт, что порядок представления обучающих примеров важен (это называется «обучение по учебной программе») и что тщательный выбор хорошей стратегии упорядочивания примеров может привести к гораздо лучшей скорости сходимости, конечной производительность или обобщение.

Гораздо реже признается важность интерактивного обучения, когда система не только усваивает поступающие ей данные, но и активно участвует в построении учебных ситуаций, из которых могут быть получены новые данные. Это называется «активное обучение». Это позволяет исследовать вопросы, связанные с причинностью (где, в конечном счете, необходима активная «действующая» часть, чтобы выйти за рамки извлечения корреляции), внутренней мотивацией и воплощением, поскольку активная часть требует некоторой формы действенного «моторного» измерения в система. Эти моменты на самом деле не игнорируются сообществом глубокого обучения, по крайней мере, не теми, кто находится на переднем крае исследований, но подход с набором данных остается доминирующим (отчасти также потому, что он позволяет четко определять показатели прогресса и сравнивать результаты). В более общем плане преобладающая философия заключается в том, что чем больше данных, тем лучше обучение, и что необработанные данные — это, по сути, все, что вам нужно. Это связано с наивным индуктивистским взглядом на то, что знание каким-то образом содержится в данных и что мы можем извлечь его с помощью соответствующих автоматизированных/детерминированных средств. Это не так: например, общая теория относительности не содержалась в данных прямых наблюдений во времена Эйнштейна, поскольку никто никогда не рассматривал отклонение света под действием гравитации. Его нужно было изобрести в творческом процессе, а затем получить дополнительные данные для его подтверждения. Самые интересные теории не могут быть созданы путем «перефразирования» данных с помощью статистических средств, они должны включать в себя творческий процесс, который содержит некоторую форму предвзятого случайного исследования.

Но интерактивный характер обучения — не единственная проблема (и опять же, некоторые исследователи машинного обучения признают это и работают над этим). Я бы сказал, что изолированная система, оснащенная активным обучением и телом в богатой среде, все равно не сможет достичь значительного уровня того, что мы можем признать человеческим интеллектом. Или, возможно, он сможет достичь определенного уровня интеллекта на уровне животных (что, возможно, было бы большим достижением, но мы здесь для игры с сильным ИИ). Сообщество глубокого обучения часто утверждает, что интеллект на уровне животных является важным шагом на пути к интеллекту на уровне человека, потому что геном животных на самом деле очень похож на геном человека (98% общих генов с обезьянами и более). чем 90% у большинства других млекопитающих), поэтому не может быть большого шага вперед к интеллекту человеческого уровня, когда у вас есть интеллект уровня животных. Следовательно, мы должны сосредоточиться на интеллекте животного уровня, а остальное подтянется быстро. Я считаю, что эта точка зрения неверна. Это геномоцентрический взгляд, который в основном говорит о том, что траектория развития и познания организма в основном объясняется геномом. Что игнорируется в этом рассуждении, так это монументальное влияние другого эволюционного тела: человеческой культуры. Правильная картина, скорее всего, включает в себя сложную и запутанную коэволюцию генов и культуры в случае гомо сапиенс, и разница в 2% генома с человекообразными обезьянами может кодировать не дополнительные интеллектуальные способности, а просто дополнительную сложность. это открывает культурную динамику, «культурный крючок» (больше нейронов для работы с такими вещами, как теория разума, построение совместных планов с сородичами и т. д.), с очень похожими общими интеллектуальными способностями. На самом деле, вы можете представить себе создание ИИ с очень ограниченным интеллектом на уровне животных, но как только вы поймаете «культурный крючок», он очень быстро поднимется до уровня, близкого к человеческому. Другими словами: чтобы добраться до интеллекта человеческого уровня, вам нужен агент, который активно учится, будучи погруженным в физическую и культурную среду, сильно влияющую на траекторию развития.

Различные «способы» обучения, о которых мы говорили, связаны не только с изучением учебного плана (порядок представления примеров), но и с обширным репертуаром «обучающих игр», которые представляют собой ритуализированные обучающие взаимодействия и стратегии, практикуемые взрослыми с младенцами. а затем дети и молодые люди, от детских игр до более продвинутой ритуализации, которой являются современные школьные системы. Короче говоря: интеллект на уровне животных + культурный крючок + культурная среда = интеллект на уровне человека. И часть на уровне животных может быть не самой важной частью в этом уравнении. Культурная среда важна и дополняет геномную среду, поскольку она определяет хорошие стратегии того, «как» учиться, по сравнению с текущей парадигмой машинного обучения, которая использует чрезмерно упрощенный взгляд, основанный на неинтерактивной, несоциальной стратегии показа обучающих примеров из набор данных (чего люди на самом деле никогда не делают).

Подводя итог, можно сказать, что правильная стратегия обучения, которая имеет шанс справиться со сложностью всего, что необходимо изучить для интеллекта человеческого уровня, вероятно, должна основываться на культурно обоснованных и социально обоснованных обучающих играх или стратегиях. Это особенно хорошо согласуется с тем, что называется развивающим подходом в ИИ (также и в робототехнике), черпая вдохновение из психологии развития, чтобы понять, как дети учатся, и, в частности, как язык укореняется в первые годы.

Ключевые элементы программы развития ИИ включают в себя в порядке сложности:

  • воплощение и преобразование символических абстракций в сенсомоторные инварианты
  • взаимодействие с физическим миром (наивная физика), но также и с социальным миром (теория разума)
  • языковая эволюция как основа для построения социально обоснованного интеллекта
  • специфические для человека социальные конструкции, такие как совместные планы, совместное внимание, нарративы (см., например, Томаселло Стать человеком для подробного анализа специфических для человека социальных способностей)

В частности, подход к языку здесь совершенно иной, чем в доминирующей сегодня парадигме НЛП: вместо того, чтобы рассматривать слова и грамматические структуры как поверхностно статистически связанные маркеры, он рассматривает слова и грамматику как результат эволюционного процесса, пытающегося максимизировать коммуникативную пригодность. , направленные на выполнение социально и экологически обоснованных совместных задач, требующих сотрудничества и согласования обоснованных смыслов. Основание таково, что слова относятся к перцептивным и концептуальным категориям, которые оказались полезными для эффективного общения, совместного достижения целей и уменьшения двусмысленности (слова или грамматические структуры, которые не отвечают этим потребностям, «отбираются» из возникающего языка посредством эволюционного процесса). динамика). Это создает прочную основу для языка, непосредственно связанного с физической и социальной реальностью, с целями и ситуациями, с особыми способами категоризации мира, так что результирующие категории ведут к успешным взаимодействиям. Улавливание этой сложности в машине позволило бы ей построить обоснованное значение (в качестве связи между внутренними сенсомоторными или концептуальными категориями и внешним словесным/грамматическим токеном) и помочь разрешить ловушки рассуждений здравого смысла, в которые попадают и будут попадать современные статистические машины НЛП. пока в процесс обучения не интегрирована надлежащая семантика.

Семантический слой содержится не в данных, а в процессе получения этих данных, поэтому особый подход к обучению современных методов глубокого обучения, ориентированный на контрольные показатели и пакетную обработку, не может охватить это важное измерение. Процесс получения данных, который мы могли бы назвать «обучающими играми», сам по себе подвергается эволюционному давлению и представляет собой актив, который разумный человек получает сразу после рождения, когда начинаются первые взаимодействия с родителями, а затем, когда субъект к обучению с помощью ритуализированных методов, изобретенных его/ее сообществом. Этот важнейший аспект обучения должен быть интегрирован в конструкцию интеллектуальных машин, если мы надеемся достичь интеллекта человеческого уровня или сильного ИИ.

VR как эффективный способ проведения экспериментов

На более конкретном уровне реализация вышеуказанной программы развивающего ИИ предполагает создание похожих на детей машин, которые погружаются в богатую культурную среду с участием людей, где они смогут участвовать в обучающих играх. Эти игры не являются врожденными (они являются частью культурного фона, поэтому они подвержены иному типу эволюционной динамики, чем один из генов), им необходимо учиться у взрослых и передавать их другим поколениям. Здесь существует существенная диссимметрия между «старыми» агентами, которые несут информацию о том, как учиться, и «новыми» агентами, которые ее приобретут и, возможно, мутируют.

Обучающие игры, включающие только физический мир, можно легко запускать в симуляции с ускоренным временем, и в настоящее время сообщество ИИ уже в некоторой степени делает это. Для социального аспекта, включающего взаимодействие с людьми, гарнитура виртуальной реальности является очень многообещающим интерфейсом, обеспечивающим естественные взаимодействия, включая выражение лица (некоторые гарнитуры VR уже поддерживают это), следование взглядом, жесты и положение тела, а также многие другие невербальные коммуникативные сигналы. которые имеют решающее значение для запуска изучения языка.

Без помощи виртуальной реальности единственным вариантом, который рассматривался, было создание роботов, способных взаимодействовать с людьми. Это была программа развития робототехники, в которой я участвовал, когда работал в Sony, а позже в Softbank Robotics Europe. Суть робототехники в том, что вы не можете избежать столкновения со всеми проблемами воплощения и сенсомоторного заземления лицом к лицу. Это интересно, но это также очень серьезное ограничение: оно делает невозможным изучение когнитивных вопросов более высокого уровня, таких как эволюция языка, социальные взаимодействия или индукция причинно-следственных связей, без предварительного решения низкоуровневых вопросов, таких как хватание, двигательный контроль, ходьба и т. д. Если если добавить эти проблемы к тому факту, что роботы дороги, требуют обслуживания и больших инженерных усилий, вы можете увидеть, что барьер для входа высок.

Один очень интересный аспект VR-подхода заключается в том, что он позволяет нам обойти эти проблемы, если это необходимо (и только если у нас есть веские основания полагать, что построение нижнего уровня не имеет решающего значения для создания каркаса высокого уровня). Можно обеспечить «функцию захвата», которая будет просто выполнять инверсную кинематику с волшебным захватом и фокусироваться на социальных/теоретико-психологических аспектах конкретной обучающей игры. Мы могли бы дойти до предоставления графа сцены существующих и видимых объектов, предполагая, что идентификация и обнаружение объектов потенциально могут быть выполнены через глубокие сети дальше по архитектуре (с добавлением к смеси потенциального влияния сверху вниз). Суть здесь в том, чтобы сосредоточиться на изучении культурного взаимодействия и того, как работает культурный крючок, а не на интеллекте животного уровня, который в этом подходе к развитию не обязательно является самой важной частью для достижения интеллекта человеческого уровня.

Заключение

Здесь я приводил аргументы в пользу двух основных отклонений от общепринятой парадигмы в области искусственного интеллекта и машинного обучения:

  • расширить область методов поиска от градиентного спуска до постепенного спуска, что позволяет исследовать недифференцируемые пространства решений, в частности решения, выраженные в виде программ.
  • стратегия обучения должна выйти за рамки пакетного обучения и перейти к интерактивному, воплощенному социальному обучению, оформленному как «обучающие игры», которые сами подвержены эволюции. Необходимое взаимодействие с людьми в режиме реального времени предполагает, что виртуальная реальность будет хорошим инструментом для проведения экспериментов и обучения.

Я считаю, что это абсолютно необходимо для продвижения к ИИ человеческого уровня или «сильному ИИ». Нынешнее квази-исключительное внимание академических кругов и промышленности к сквозным дифференцируемым моделям наносит ущерб этой области, и невероятный прогресс, вероятно, не за горами, если мы просто рассмотрим дополнительную идею недифференцируемых моделей и отнесемся к ней серьезно. , не формулируя вопрос о символическом и несимволическом ИИ, который, я считаю, не является здесь основной проблемой. Речь идет не о том, «если» вы можете сделать что-то с нейронными сетями (вероятно, вы сможете, в конце концов), а о том, «как» вы можете сделать это наилучшим образом, используя наилучший доступный подход, и ускорить наше продвижение к цели.

Рекомендации

Майкл Томаселло. Культурные истоки человеческого познания. Издательство Гарвардского университета, 1999.

Люк Стилс и Жан-Кристоф Бэйли. Общее обоснование описаний событий автономными роботами. Робототехника и автономные системы, 43(2–3):163–173, 2003.

Джош Абрамсон, Арун Ахуджа, Иэн Барр, Артур Брюсси, Федерико Карневале, Мэри Кассин, Рачита Чапария, Стивен Кларк, Богдан Дамок, Эндрю Дудзик и др. Имитация интерактивного интеллекта. Препринт arXiv arXiv:2012.05672, 2020.

Анируд Гоял и Йошуа Бенжио. Индуктивные предубеждения для глубокого изучения познания более высокого уровня. Препринт arXiv arXiv:2011.15091, 2020.

Иудейская жемчужина. Причинно-следственный и контрфактический вывод. Справочник по рациональности, страницы 1–41, 2018.

Алан М Тьюринг. Вычислительная техника и интеллект. Разум, 59(236):433–460, 1950.

Жан-Кристоф Бэйли. Искусственный интеллект: точка зрения развивающейся робототехники. В Фундаментальных проблемах искусственного интеллекта, стр. 415–424. Спрингер, 2016».

Бренден М. Лейк, Руслан Салахутдинов и Джошуа Б. Тененбаум. Концептуальное обучение на уровне человека с помощью вероятностной индукции программы. Наука, 350(6266):1332–1338, 2015.

Люк Стилс и Манфред Хильд. Языковая основа роботов. Springer, 2012.

Лаланд К.Н., Уллер Т., Фельдман М.В., Стерельный К., Мюллер Г.Б., Мочек А. и другие. Расширенный эволюционный синтез: его структура, предположения и прогнозы. Труды Королевского общества B, 282 (1813),
1–14, 2015 г.

Марта Гарнело, Кай Арулкумаран и Мюррей Шанахан. На пути к глубокому символическому обучению с подкреплением. Препринт arXiv arXiv:1609.05518, 2016.

Пьер-Ив Удейер и Фредерик Каплан. Что такое внутренняя мотивация? типология вычислительных подходов. Границы нейроробототехники, 1, 2007.

Линда Смит и Майкл Гассер. Развитие телесного познания: шесть уроков от младенцев. Искусственная жизнь, 11(1–2):13–29, 2005 г.