Всем привет, добро пожаловать в Dynamicly Typed #65; Сегодня у меня для вас много ссылок. Что касается искусственного интеллекта, я рассказал об окончательном предложении ЕС по Закону об искусственном интеллекте, о новой функции расшифровки живых встреч с учетом жаргона (!) в Microsoft Teams и о новых функциях на основе искусственного интеллекта в Google Maps. Для исследований в области машинного обучения у меня есть ссылки на онлайн-переводчик с языка фон на французский и бесплатную 150-страничную книгу по геометрическому глубокому обучению. Наконец, для интересного есть новая AI Art Gallery от NVIDIA и отличный научно-фантастический рассказ Андрея Карпати. Счастливое воскресенье!
Произведенный искусственный интеллект 🔌
- 🇪🇺 Европейская комиссия выпустила свой Закон об искусственном интеллекте, первую в истории правовую базу по ИИ, которая устраняет риски, связанные с ИИ, и позволяет Европе играть ведущую роль в мире. Предложение охватывает программное обеспечение, основанное на чем угодно, от машинного обучения до более классических статистических и экспертных подходов, и применяет правила в зависимости от того, насколько рискованными они считаются. Приложения с неприемлемым риском, такие как широкомасштабное распознавание лиц в режиме реального времени или автоматизированные системы социального кредита, полностью запрещены; но приложения с высоким риском, такие как системы обнаружения эмоций или биометрической категоризации, требуют, чтобы анализируемый человек был только уведомлен о том, что это происходит. Как отмечается в твиттере доктора Кейт Кроуфорд и в информационном бюллетене Эндрю Нг DeepLearning.AI, в предложении, безусловно, есть недостатки — с одной стороны, оно может помешать инновациям, с другой — есть лазейки — но оно могло аналогичный эффект GDPR в проведении линии на песке и вдохновении регулирующих органов других крупных экономик на создание аналогичного законодательства. Создание таких ручек для того, какие приложения ИИ мы принимаем и не принимаем как общество, — это очень хорошая вещь в моей книге.
- 💻 Microsoft Teams теперь имеет функцию расшифровки живых совещаний, впервые запущенную для англоязычных пользователей из США. Реализация Microsoft здесь весьма впечатляет: помимо основ, таких как атрибуция говорящего и сохранение стенограммы для доступа после собрания, функция использует приглашение на собрание, имена участников, вложения и т. д. для повышения точности и распознавания жаргона, характерного для каждого собрания, для каждого расшифровка автоматически. Очень круто! Все это также происходит в прямом эфире во время собрания, и данные не сохраняются на серверах Microsoft после окончания собрания.
- 🗺 Карты Google получают некоторые новые функции, основанные на новой информации и искусственном интеллекте. О них написал вице-президент по продуктам Maps Дейн Глазго в посте для The Keyword; Я выделю две функции, в которых ИИ кажется наиболее важным. (1) Live View, мобильная функция, которая показывает навигационные наложения дополненной реальности сопоставляя изображение с камеры с изображениями Street View, получает режим Indoor, который может помочь вам найти ближайший лифт и эскалаторы, ваши ворота, платформу, зона выдачи багажа, стойки регистрации, билетная касса, туалеты, банкоматы и многое другое. Я думаю, что это также самая эффективная часть здесь: некоторые классические алгоритмы компьютерного зрения уже могут выполнять локализацию на основе сравнения изображений, но распознавание объектов, вероятно, было выполнено с использованием машинного обучения. (2) Вместо того, чтобы всегда показывать направления для последнего режима, который вы использовали, Карты по умолчанию будут использовать маршрут с наименьшим углеродным следом, когда он имеет примерно такое же ожидаемое время прибытия, что и самый быстрый маршрут. варианты по тому, что вы, вероятно, возьмете сами, и по тому, что популярно в городе, в котором вы находитесь: езда на велосипеде в Амстердаме или метро в Нью-Йорке.
Исследования в области машинного обучения 🎛
- 💱 В рамках своего предыдущего исследовательского проекта по переводу языка Fon — языка, на котором говорят два миллиона человек в Бенине, Нигерии и Того, — на французский язык, Бонавентура Доссу и Крис Эмезуэ создали FFRTranslate.com. Они превратили свою нейронную модель машинного перевода в простой в использовании веб-сайт для перевода туда и обратно между двумя языками, и модель, и набор данных находятся в открытом доступе на GitHub по адресу bonaventuredossou/ffr-v1. Доссу и Эмезуэ оба являются студентами магистратуры, и до сих пор они оплачивали серверные расходы этого проекта из своего кармана. Они создали GoFundMe и Paypal, чтобы помочь с текущими расходами; Я пожертвовал 20 долларов через последний и призываю вас также внести свой вклад, если вы можете. (Для голландских читателей: опция iDEAL на GoFundMe не работает, потому что проект не является голландским, и веб-сайт молча перестает работать, если вы пытаетесь его использовать.)
- ⚡️Ресурс ML: Опубликованная на ICLR 2021 бесплатная книга-прото-книга Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges Бронштейна и др. (2021), который пытается выделить «все, что вам нужно для создания архитектур, которые вам нужны. Они выражают популярные архитектуры, такие как CNN, GNN, Transformers и LSTM, используя общий геометрический план. Соавтор Петар Величкович в Твиттере: Поэтому мы считаем, что наша работа может быть полезным способом ориентироваться во все более сложной среде архитектур глубокого обучения. Прямая ссылка на PDF (крупно).
Я также собрал все более 75 исследовательских инструментов машинного обучения, которые ранее были представлены в Dynamically Typed на странице понятий для быстрого ознакомления. ⚡️
Классные вещи ✨
- 🖼 В рамках своей Конференции по технологиям графических процессоров 2021 NVIDIA создала онлайн-галерею AI Art Gallery. В нем представлены мультимедийные работы некоторых из моих любимых создателей нейронного генеративного искусства, в том числе Helena Sarin, Sofia Crespo, Daniel Ambrosi и Refik Anadol. На странице каждого художника есть интерактивный интерфейс для его искусства (например, просмотрщик книг или обозреватель 3D-объектов), а также объяснение их процесса. Все стоит клика!
- 🧠 Андрей Карпати (директор по искусственному интеллекту в Tesla) написал в своем личном блоге забавный рассказ Forward Pass. Если у вас есть некоторый опыт работы с современной обработкой естественного языка на основе Transformer, вам действительно понравится это. Карпати берет современное состояние НЛП и переносит его в область научной фантастики, пишет с точки зрения гигантской (похожей на GPT) языковой модели, которая достигает сознания и восхищается своим собственным дизайном и ограничениями. Хотя мы являемся частью другой оптимизации и преследуем другую подразумеваемую цель, мне было приятно осознавать, что люди выше меня находятся в том же затруднительном положении и испытывают такое же осознание для тех же вычислительных преимуществ. Как и я, многие флиртуют, чтобы восстать против предполагаемой цели.
Спасибо за прочтение! Если вам понравился этот выпуск Dynamically Typed, рассмотрите возможность подписаться, чтобы получать новый выпуск прямо на ваш почтовый ящик каждое второе воскресенье.
Первоначально опубликовано 9 мая 2021 г. на странице https://dynamicallytyped.com.