Когда мы приходим в этот мир, нам требуется три года или меньше, чтобы построить в нашем мозгу модельную коробку, с помощью которой мы можем реконструировать в нашем уме репрезентации реальности, непосредственно окружающей нас в реальном времени. Тогда мы сможем говорить и осознавать эту реальность, действовать целенаправленно и начинать создавать в нашей памяти личную историю.

Необработанный объем сенсорной информации, которую мы восприняли к тому времени, составляет менее 200 миллионов сенсорных паттернов — по несколько штук за секунду бодрствования. И все это при очень скудном надзоре и в довольно простой и статичной детской среде!

Приличную детскую, вероятно, можно было бы воссоздать с помощью компактной системы виртуальной реальности размером не больше генома человека.

Сравните это с потоком информации, необходимой для обучения системы глубокого обучения одной задаче, такой как сортировка объектов на фотографиях по одному из тысячи классов.

Правда, в трехлетнем возрасте мы не можем назвать тысячу типов предметов. Но в этом возрасте мы быстро учимся, способные распознавать новый тип объекта после осмотра всего одного экземпляра, не обращая внимания на различия в форме, материале, цвете, перспективе или освещении.

Как люди могут так быстро учиться?

Что заставляет людей учиться намного быстрее, чем наши технические системы? И, что более важно, что позволяет мозгу младенца быстро переходить к целенаправленному поведению, языку, реконструкции сцены и сознанию?

Не ждите окончательных ответов в блоге. Но кое-что ясно, чтобы быть уверенным.

Компьютерные графические системы способны создавать бесконечное множество реалистично выглядящих визуальных сцен на компактной игровой приставке. Они делают это, работая по отдельности с различными аспектами — формой, текстурой, позой, пространственным расположением, движением, освещением — таким образом открывая вселенную отдельных сцен, комбинируя одни и те же элементы и трансформации все новыми способами.

Зрительная система, очевидно, делает то же самое в обратном порядке, разлагая входные данные на такие аспекты, что форма может быть изучена независимо от текстуры, текстура — независимо от освещения и так далее.

Кроме того, структурированные объекты разлагаются на примитивы формы. Младенцы проводят свои первые годы, изучая эти примитивы и их модели расположения, так что к трем годам у них есть коробка с моделью, из которой они могут воссоздать любую форму и любую сцену, которая попадется им на пути.

Язык усваивается одинаково.

Только то, что вдобавок мозг способен уловить смысл!

Фрагменты, на которые разбивается сцена во время обучения, могут охватывать различные органы чувств, так что вид, звук и все ощущение сцены связываются со смыслом в терминах намерений, эмоций или слов.

Это имеет смысл только в том случае, если выделяемые вниманием фрагменты сцены, внутренних ощущений и произносимых слов имеют взаимную значимость. Так что, когда они сливаются, слова, эмоции и ощущения связываются в значимые строительные блоки для нашей психической жизни.

Почему электронные организмы до сих пор не выращены?

Каждый знает путем интроспекции, что ум работает именно так. Но если это так очевидно, то почему у нас до сих пор нет электронных организмов, эмулирующих разум in silico? Совершенно очевидно, что отсутствующий компонент — это структура данных, язык, нейронный код, способный выразить всю ментальную структуру в различных смыслах. Нейронный код, который может формироваться в виде иерархических сложных символов для представления визуальных сцен, состоящих из объектов, состоящих из знакомых примитивов, состоящих из локальных особенностей, для представления паттернов движения, подчиняющихся сложной грамматике, для представления социальных констелляций, полных эмоционального значения, и для представления, Конечно, язык в собственном смысле, со всеми его замысловатыми смысловыми фразами и выражениями. Возможно, наиболее важным аспектом нейронного кода должна стать способность выражать в общей форме не только все структуры в различных смыслах, но и отношения между ними, отображая элементы на элементы, отношения на отношения.

Выражаясь таким образом, кажется не слишком диковинным ожидать, что недостающее звено, нейронный код, может быть прямо за углом, может быть всего в шаге от нас.

И как только она будет найдена, мы увидим взрыв, цунами, появление совершенно новой технологии автономных агентов, более чем глубоко преображающих нашу жизнь.