Пограничные устройства, оснащенные искусственным интеллектом (ИИ), становятся повсеместными, что приводит к резкому росту спроса на нейроморфные процессоры, способные естественно и эффективно обрабатывать информацию. Большинство современных приложений ИИ, работающих на периферийных устройствах, таких как смартфоны, камеры наблюдения и беспилотные автомобили, требуют чрезмерных совокупных затрат памяти и мощности, что побуждает пользователей прибегать к облаку (центрам обработки данных) для предоставления полного спектра услуг. Хотя запуск приложений ИИ в облаке может привести к значительному расширению ограниченной функциональности, предлагаемой современными периферийными устройствами, например, их использование для распознавания лиц и голоса, обслуживание большего количества устройств и перенос большего количества задач в облако, приведет к загадке дизайна. Согласно недавнему исследованию Cisco, предполагается, что данные, генерируемые интеллектуальными устройствами, превысят примерно 600 ZB в этом году (2020 г.) и ~850 ZB к 2021 г. (см. рис. 1). Несмотря на то, что только 10% этих данных могут потребовать хранения или облачной обработки, 85 ЗБ данных все равно в 4,2 раза больше, чем текущий глобальный трафик центра обработки данных [1]. Такие большие объемы данных, несомненно, создадут серьезные препятствия для перемещения данных как в сети, так и в центрах обработки данных в ближайшем будущем.

Есть два ключевых возможных решения, которые можно рассмотреть для решения вышеупомянутых проблем. Первое решение уже было принято несколькими компаниями. Это предполагает расширение пропускной способности сетей связи и центров обработки данных. Однако это расширение влечет за собой увеличение количества мобильных базовых станций. За последнее десятилетие мы наблюдаем почти двукратное увеличение количества мобильных базовых станций в большинстве частей мира. Аналогичные сценарии наблюдаются и для центров обработки данных (например, центров обработки данных Akamai [2]). Эти расширения сопровождаются значительным увеличением энергопотребления, более чем на 20 000 ГВтч в год [3], и стоимости услуг облачных вычислений [4].

Тогда возникает вопрос, как долго длится расширение сетей и центров обработки данных? В какой-то момент сети не смогут выдержать всю эту инфляцию, и проблема снова обострится. Это приведет нас ко второму решению, которое является более перспективным. Это решение предполагает обработку данных в непосредственной близости от устройства, то есть на самих пограничных устройствах или рядом с ними, без или с ограниченным обменом данными с облаком. Возможные результаты такого подхода включают:

  • Улучшение времени отклика периферийных устройств, поскольку нет необходимости передавать данные туда и обратно между устройствами пользователей и облаком. Это может быть чрезвычайно полезно для приложений, которые не допускают длительных задержек, таких как беспилотные автомобили.
  • Повышение конфиденциальности данных, поскольку пользователям не нужно загружать данные в облако в обмен на услуги ИИ. Например, вся биометрическая аутентификация, такая как распознавание голоса и лица, может выполняться локально на устройствах.
  • Это надежнее, потому что нет необходимости в постоянном доступе к облаку. Это делает ИИ доступным для критически важных приложений.
  • Уменьшите нагрузку на сеть и эффективно используйте пропускную способность сети.

Хотя вышеупомянутые возможные результаты привлекательны, их достижение не так просто, поскольку локальная обработка данных на периферийных устройствах сопряжена с рядом проблем. Самые большие из них связаны со строгими ограничениями ресурсов и ограниченным бюджетом мощности периферийных устройств, а также со сложностью алгоритмов ИИ. Запуск алгоритмов искусственного интеллекта на периферийных устройствах может замедлить эти алгоритмы и привести к более быстрому разряду батареи. В первую очередь это связано с физическим разделением блоков вычислений и памяти (известным как архитектура фон Неймана). Манипуляции с данными в архитектурах на основе фон Неймана включают перемещение данных туда и обратно между вычислительными модулями и блоками памяти, что влечет за собой значительные затраты в виде задержки и энергопотребления [5]. Однако недавние результаты исследований [6] указывают на возможность преодоления большинства вышеупомянутых препятствий за счет изменения вычислительной парадигмы. Биологические системы, такие как человеческий мозг, передают несколько ключевых аспектов дизайна, которые могут помочь формировать периферийные устройства с функциональной и архитектурной точки зрения. Особенности включают в себя совместную память и обработку, компактность, малый вес, сверхнизкое энергопотребление, высокоскоростные вычисления и надежность.

Здесь важно упомянуть, что перенос биологических вычислительных возможностей на периферийные устройства, с одной стороны, требует абстрагирования от существенных структурных и алгоритмических свойств мозга. С другой стороны, необходимо идентифицировать примитивы. В то время как первое является постоянной исследовательской задачей, второе стало свидетелем радикальных достижений, ведущих к появлению новых устройств, которые имитируют несколько биологических примитивов. Одним из классических примеров является мемристорное устройство, имитирующее биологические синапсы. Появление таких устройств привлекло несколько инициатив по созданию вычислительных систем, вдохновленных мозгом (нейроморфных систем). Среди них чип Pyragrid, разработанный в Neuromorphic AI lab Рочестерского технологического института [7].

Pyragrid — это нейроморфный чип со смешанными сигналами (аналоговые и цифровые компоненты) на основе мемристоров, основной алгоритм которого смоделирован на основе иерархической временной памяти (HTM), биомиметического алгоритма, вдохновленного неокортексом человека. Pyragrid отличается отказоустойчивостью, помехоустойчивостью, быстрым временем отклика и непрерывной адаптацией при изучении модели мира. Pyragrid также демонстрирует энергоэффективность, поскольку включает вычисления в памяти и разреженную активацию нейронных вычислительных блоков. Вдохновленный концепциями VLSI (очень крупномасштабная интеграция), Pyragrid применяет повторное использование данных и виртуальные синаптические пути, которые устраняют основные узкие места в энергопотреблении.

Помимо ключевых преимуществ, упомянутых ранее, Pyragrid предлагает единую вычислительную платформу, где пространственно-временная информация обрабатывается в режиме реального времени для выполнения интеллектуальных задач. Это делает его подходящим для множества приложений, включая медицинскую диагностику, GPS-навигацию, распознавание объектов, прогнозирование фондового рынка, обнаружение мошенничества и обнаружение аномалий. Наше первоначальное исследование, посвященное смартфонам, показывает, что использование Pyragrid может не только расширить их вычислительные возможности, но и продлить срок службы батареи. Предварительные результаты показывают, что если мы сможем переложить 25% задач, возложенных на ЦП и ГП, на Pyragrid, мы сможем продлить срок службы батареи устройства на 1–3 часа при выполнении ресурсоемких задач, т. е. при запуске приложений ИИ, таких как лица и голос. признание. Эта экономия может меняться в зависимости от размера сети и целевой задачи.

Ссылка:

[1] Networking, Cisco Visual, Глобальный облачный индекс Cisco: прогноз и методология, 2015–2020 гг. информационный документ (2016 г.), Cisco Public, Сан-Хосе.

[2] Ян, М., Чан, К.А., Гайгакс, А.Ф., Ян, Дж., Кэмпбелл, Л., Нирмалатас, А., и Леки, К., Моделирование общего энергопотребления служб и приложений мобильных сетей (2019 г.). ), Энергии, 12(1), 184.

[3] Годовой отчет China Mobile Limited (2019 г.), доступен в Интернете: http://www.chinamobileltd.com/en/ir/ reports/ar2019.pdf.

[4] https://www.deltapartnersgroup.com/can-edge-computing-enable-international-carriers-build-global-cloud-platform

[5] Себастьян А., Ле Галло М., Хаддам-Альджамех Р. и Элефтериу Э. Устройства памяти и приложения для вычислений в памяти (2020 г.), Nature Nanotechnology, 1–16.

[6] Индивери Г. и Лю С. К., Память и обработка информации в нейроморфных системах (2015 г.), Труды IEEE, 103 (8), 1379–1397.

[7] Зиара, А. М., Гомес, К., и Кудитипуди, Д., Нейроморфная система для обработки пространственной и временной информации (2020), IEEE Transactions on Computers, 69(8), 1099–1112.