Тенденции в области ИИ: предшественники ИИ «здравого смысла»

[Обновлено: повторно опубликовано для исправления неработающих ссылок. Прости.]

Умные роботы и смартфоны, очки «смешанной реальности» и самодельный хакерский самоуправляемый автомобиль — все это стремится к лучшему виду искусственного интеллекта.

Эта колонка является чем-то вроде дополнения к регулярной колонке Эрла Вайенберга «ИИ в новостях». В то время как Эрл обычно имеет дело с последними историями об ИИ в науке и популярной прессе, я буду иметь дело с тенденциями и разработками, которые могут быть не такими недавними, но которые я считаю важными.

Одна из концепций, о которой я писал и говорил в течение прошлого года, — это то, что я назвал ИИ здравого смысла. (См., например, последнюю версию моего рабочего документа ИИ, подход «здравого смысла».) Под здравым смыслом в данном контексте я подразумеваю то, что Аристотель назвал здравый смысл, а средневековье — здравый смысл. Это ментальная способность, которая берет данные от всех наших различных физических чувств и интегрирует их в единую модель или восприятие мира. (См. Аристотелевский здравый смысл в Википедии.) Я утверждаю, что эта способность интегрировать чувственные данные в восприятие физического мира, состоящего из отдельных объектов, лежит в основе естественного интеллекта, и таким образом, искусственный общий интеллект (AGI).

Есть как минимум четыре очень интересных разработки, которые, я думаю, стоит упомянуть в этой области.

Все они представляют собой усилия, предпринятые пару лет назад, и каждое из них представляет собой аспект тенденции к созданию автономных систем, которые начинают демонстрировать целостное восприятие мира, модель, в рамках которой может работать искусственный интеллект.

Танго от Google

Tango — это аппаратно-программный проект на базе Android, ориентированный на зрение, пространственное восприятие и область «здравого смысла», как я его использовал. Слоган на их веб-сайте гласит: «Комплект разработчика Project Tango оснащен технологией, которая позволяет ему понимать пространство и движение. Давайте создадим что-то потрясающее вместе».

Этому проекту уже несколько лет, и он привел к созданию ряда аппаратных платформ, и ожидается, что в этом году он станет потребительским продуктом. Текущая платформа разработки имеет большой набор датчиков для интеграции: камера слежения за движением, 3D-камера с датчиком глубины, акселерометр, окружающий свет, барометр, компас, GPS и гироскоп. Программное обеспечение концентрируется на трех основных возможностях: отслеживание движения, изучение области и восприятие глубины.

До сих пор большая часть технологий, показанных в Tango, представляла собой более традиционную графику, 3D-картографирование и подход к виртуальному миру, но ранее в этом году Google и производитель чипов Tango 3D Vision, Movidius, объявили о планах внедрить технологию глубокого обучения (DL). на мобильные устройства (см., например, эту статью от Yahoo Finance). Google является лидером в практической технологии глубокого обучения, и интеграция в чип, который можно использовать в небольших устройствах, и в платформу Tango станет шагом в направлении использования реализации здравого смысла, аналогичной реализации в естественных системах.

Хотя Project Tango явно нацелен на портативные устройства, телефоны и планшеты, они были развернуты на ряде мобильных устройств. К ним относятся колесные и гусеничные роботы, квадрокоптеры и даже плавающие спутники НАСА SPHERE на борту Международной космической станции (видно здесь).

HoloLens от Microsoft

В то время как Google стремится интегрировать системы машинного зрения в мобильные устройства, телефоны и планшеты, Microsoft стремится модернизировать виртуальную реальность (VR) и специализированное оборудование, а именно очки VR, до того, что они называют «смешанной реальностью», гибридизируя создание убедительных симуляций. миры с «дополненной реальностью», отображающие визуальную информацию, интегрируются в представления реального мира. Их премьера в этой области — устройство HoloLens и сопутствующая (неверно названная) «голографическая технология» в Windows 10.

Чтобы создать и поддерживать убедительную смешанную реальность, системе HoloLens необходимо создавать и поддерживать точную модель мира, а также положение и ориентацию устройства в этом и реальном мире. Опять же, это только самое начало разработки типа комплексной интеграции нескольких режимов и источников сенсорных данных, но это только начало. Как и Google, Microsoft развернула в сети API и библиотеки машинного обучения с открытым исходным кодом.

Microsoft недавно начала продавать и поставлять модель HoloLens для разработчиков за 3000 долларов. (см. «Inside Microsoft HoloLens» на Verge). Пока неизвестно, насколько мир в целом заинтересован в принятии таких массивных очков виртуальной реальности, как HoloLens, или даже легких устройств, таких как Google Glass, но рассматриваемых как один из элементов экосистемы, включающей Kinect, и Windows Hello, функция визуального распознавания Windows 10 (которая, как и Tango, использует технологию камеры Intel RealSense), Microsoft определенно движется в направлении разработки технологии искусственного здравого смысла.

Робот Autonomous для глубокого обучения

В то время как Google и Microsoft концентрируются на устройствах, которые носят или носят люди, Autonomous выпустила платформу разработки, специально предназначенную для интеграции глубокого обучения в мобильные устройства. Аппаратное обеспечение, используемое в Deep Learning Robot, во многом похоже на устройства разработчика Project Tango. Основным процессором в обоих является 192-ядерный графический процессор Nvidia Tegra K1. DL Robot использует 3D-камеру глубины Asus Xtion Pro. Предустановленное программное обеспечение включает Ubuntu, Google TensorFlow, Caffe, Torch, Theano, cuDNN v2 и CUDA 7.0.

Еще неизвестно, как эта платформа будет использоваться, но за 1000 долларов она, похоже, хорошо подходит для продвижения искусства искусственного здравого смысла.

Автомобиль Джорджа Хотца

Моя последняя тенденция — это особенное и интересное развитие общей тенденции к автономным и, в конечном итоге, самоуправляемым автомобилям. Джордж Хотц, также известный как геохот, — молодой хакер, который впервые привлек внимание всего мира подростком, разблокировав iPhone, а затем взломал Sony PlayStation и Samsung Galaxy S5. С тех пор он работал в Facebook и Google. Его возраст и хакерский опыт сделали его довольно неожиданным новичком в зарождающемся бизнесе беспилотных автомобилей, но в конце 2015 года он создал компанию Comma.ai с поддержкой в размере 3 миллионов долларов, чтобы создать модернизацию беспилотных автомобилей. комплект для ряда автомобилей последних моделей.

В январе Bloomberg опубликовал статью под названием «Первый человек, взломавший iPhone, построил беспилотный автомобиль. В его гараже», взяв у него интервью и показав демонстрацию его самоуправляемой взломанной Acura ILX 2016 года на калифорнийском шоссе (когда она была опубликована, он получил приказ прекратить и воздерживаться). Согласно интервью, автомобиль является продуктом двух скоординированных усилий. Во-первых, он взломал компьютерную сеть, которая управляет Acura, и добавил свой собственный джойстик для управления управлением по проводам, что позволило ему управлять автомобилем напрямую, а не через руль и педали. Во-вторых, он добавил в машину лидар и несколько камер и подключил эти датчики к компьютеру с системой глубокого обучения.

Вместо того, чтобы пытаться запрограммировать навыки вождения и правила в машине, он использовал систему DL, чтобы сначала контролировать его вождение, а затем, когда она стала достаточно опытной, взять на себя управление и вести себя. Как и команда AlphaGo, он обнаружил, что процесс обучения навыкам в хорошо построенной системе глубокого обучения идет очень быстро. Он был чрезвычайно доволен, когда заметил, что машина научилась тому, что когда есть велосипедная дорожка с велосипедами на ней, нужно немного съехать влево от центра своей полосы, чтобы дать им место, навык, которого он не имел намеренно. научил этому.

Хотя неясно, есть ли у Acura здравый смысл, подход Хотца к самостоятельному вождению, заключающийся в создании автономной системы машинного обучения со сложным набором органов чувств и последующем обучении ее навыкам на примере, безусловно, вписывается в образ мышления, который вероятно, приведет к здравому смыслу ИИ.

Тенденции в области ИИ: предшественники ИИ «здравого смысла»

Танго от Google

HoloLens от Microsoft

Робот Autonomous для глубокого обучения

Автомобиль Джорджа Хотца

Вопросы по теме