5 уроков, извлеченных из North Star AI

На этой неделе я поехал в Таллинн, Эстония. Но больше всего в городе на этой неделе захватили не его красивый старый город, суровая зима или мягкие манеры людей. Это было мероприятие North Star AI, конференции по машинному интеллекту для разработчиков.

Расписание выступлений составили такие чемпионы AI & CS, как Трэвис Олифант (создатель NumPy), Sayan Pathak (главный специалист по машинному обучению в Microsoft) и Ахти Хейнла (со-разработчик Skype »И соучредитель Starship ) среди многих других.

Я приехал с желанием исследовать новые перспективы, встречаться с умными людьми и учиться у лучших - возможно, вы видели меня там, когда я с нетерпением делаю заметки. В этой статье я попытаюсь выделить пять уроков, извлеченных из моего опыта. Это образцы общности в темах, обсуждаемых спикерами, которые стимулировали меня к ценным открытиям. Имейте в виду, что эти уроки не обязательно отражают взгляды выступающих, а скорее мою интерпретацию и совокупность их точек зрения. Давайте начнем!

1. ИИ стал возможен для бизнеса

Сами участники конференции стали свидетельством новой практической реализуемости технологий искусственного интеллекта в реальных продуктах. Вы слышали о его применении в более крупных компаниях, таких как Starship (которые производят роботов для доставки), Taxify (связывает пассажиров с водителями) и Elisa (поставщик телекоммуникационных услуг, использующий ИИ для создания чат-ботов, улучшающих обслуживание клиентов). но также для ряда стартапов и компаний среднего размера. Для многих технологических стартапов ИИ кажется частью основного предложения, а в более крупных компаниях эта технология часто рассматривается для улучшения обслуживания клиентов и бизнес-аналитики.

Причина такого развития - достигнутая зрелость ряда фреймворков машинного обучения, таких как Tensorflow, CNTK и PyTorch. Другой очень важной причиной, как подчеркнул Трэвис Олифант, являются высокоуровневые API-интерфейсы, которые становятся доступными, что позволяет нам быстрее рисовать и оценивать такие модели, как Keras, Azure ML, Google Cloud ML Engine и Машинное обучение AWS. Эти API-интерфейсы делают действительно практичным начало построения моделей машинного обучения на уровне абстракции, на котором первоначальные затраты на разработку лучше уравновешиваются с добавленной стоимостью для бизнеса.

Элементом прогресса в повышении практичности ИИ также могут быть стандарты для промежуточных представлений (IR), такие как ONNX (Open Neural Network Exchange): открытый формат для моделей глубокого обучения, который делает возможным взаимодействие между фреймворками. Эту идею подчеркивали и Трэвис, и Саян Патхак. Используя ONNX, вы можете использовать CNTK для развертывания модели глубокого обучения, которая изначально была построена, например, с помощью PyTorch или Caffe. Это особенно интересно для кого-то вроде меня, который предпочитает работать с .NET в производственной среде, и, я полагаю, для многих компаний, стремящихся интегрировать глубокое обучение в свой существующий стек. ONNX уже изначально поддерживается во многих фреймворках и имеет конвертеры для некоторых из остальных, таких как Tensorflow.

2: Многоагентные системы обеспечивают большую мощность

Ближе к концу дня Шон Горли, генеральный директор Primer, провел действительно интересную презентацию своего продукта: систему машинного обучения для автоматизации анализа больших наборов текстовых данных и создания отчетов на естественном языке, используемых такими компаниями, как Walmart. Я могу порекомендовать заглянуть на их веб-сайт и прочитать отчеты - результаты действительно впечатляют.

Для достижения этой амбициозной цели Primer использует шесть взаимодействующих интеллектуальных механизмов - систем машинного обучения для выполнения различных задач. Один механизм служит для идентификации сущностей и структурированных данных, в то время как другой ищет события путем кластеризации взаимосвязей сущностей в зависимости от времени. Эти агенты служат разным целям и могут использоваться в сотрудничестве для решения более крупной проблемы проведения исчерпывающего тематического анализа. Наконец, их движок историй объединяет крупномасштабную тему и информацию о событиях и генерирует отчет на естественном языке.

Такой образ мышления действительно открыл мне глаза на то, как можно решать сложные проблемы. С точки зрения архитектуры, многоагентные системы, которые созданы для взаимодействия и могут быть объединены различными способами, кажутся невероятно мощными. Он разделяет большую проблему на более мелкие области и обеспечивает своего рода групповое взаимодействие внутри системы, упрощая при этом отдельные модули для тестирования и обновления. Это похоже на совместную работу разнообразной команды!

Максим Орловский, основатель Pandora Boxchain, также обратил внимание на огромную силу мультиагентных систем. В практическом смысле мы скоро окажемся в мире взаимодействующих агентов, таких как беспилотные автомобили на дороге. Но по мере увеличения сложности этой экосистемы независимых агентов, как мы можем защитить себя от злонамеренных экземпляров или террористов? Максим подчеркнул, что мы должны начать думать о византийских отказоустойчивых системах для управления взаимодействующими агентами - это значит работать над созданием надежных систем из ненадежных частей.

Pandora Boxchain - это децентрализованный рынок искусственного интеллекта, основанный на блокчейне, на котором модели машинного обучения могут выполняться сетью. В рамках такой платформы участники сети с рациональными корыстными интересами могут защищать друг друга от злонамеренных агентов, мотивированных децентрализованной экономикой и теорией игр, а не государственным регулированием. Это действительно интересный и дальновидный проект, за которым я буду рассчитывать в будущем.

3: ИИ - это не серебряная пуля

Проблема коммуникации, с которой я столкнулся при обсуждении внедрения ИИ в бизнесе, - это тенденция думать, что он сам по себе сделает что-то экстраординарное для компании, даже если реальная проблема, которую предстоит решить, еще не определена. Я думаю, что это обычная картина для новых технологий, поскольку ажиотаж имеет тенденцию распространяться быстрее, чем понимание.

Хабиб Адам, специалист по данным в Transferwise, очень хорошо сформулировал это: он предположил, что мы должны помнить о том, чтобы мы руководствовались проблемами, а не решениями. Вместо того, чтобы пытаться найти что-то связанное с ИИ, мы должны подумать, с какими проблемами мы сталкиваемся и какие виды идей могут быть нам полезны. Он выделил три важных фактора при рассмотрении решения проблемы с помощью машинного обучения:

1: Случайность. Считаем ли мы, что здесь можно найти закономерность?
2: Связанные данные. Какие (и сколько) релевантных данных у нас есть?
3: способность действовать. Какие полезные действия мы можем предпринять на основе этих данных?

Далее Хабиб объяснил, что, когда мы действительно решили проблему, мы можем начать думать о том, как сделать наше решение более гибким и распространить его на другие области.

Честно говоря, понимание того, как определять эти проблемы, может быть сложной задачей и требует практики. Чтобы противодействовать недопониманию, нам необходимо обучать лиц, принимающих решения, в бизнесе, чтобы они могли предпринять соответствующие действия. Маркус Липпус, соучредитель консалтинговой компании по искусственному интеллекту MindTitan, поделился некоторыми важными моментами для решения этой проблемы. При сотрудничестве с компанией в области искусственного интеллекта или интеграции науки о данных они проводят семинары. В них основное внимание уделяется обнаружению проблем и выявлению болевых точек для компании - подход, основанный на проблемах. Когда необходимое понимание будет собрано, команда MindTitan может должным образом посоветовать соавтору, где и как решения ИИ могут принести пользу их бизнесу.

4. Управление процессами имеет решающее значение для масштабирования ИИ

По мере того, как мы начинаем применять решения AI / ML более широко, процесс становится более важным, чем когда-либо. Это связано как с более обширными системами, так и с растущими группами специалистов по анализу данных, которые их создают. Андрус Куус, аналитик программного обеспечения в Proekspert, намекнул на тот факт, что большая часть приходящей рабочей силы в области ИИ и науки о данных будет составлять студенты, поступающие непосредственно из университетов (которые часто не имеют опыта работы в команде), и что мы можем извлечь выгоду из внедрения практик на место, чтобы усилить синергию команды. Он выделил ряд перспектив, которые он обнаружил при росте их команды по анализу данных:

1. Выберите инструменты и методы, которые помогут вам добиться ясности.
2: задавайте правильные вопросы и проверяйте идеи, прежде чем пробовать решения.
3: регулярно обсуждайте.

Хотя я не могу вспомнить его совет дословно, я считаю, что в этом его суть. В быстро меняющемся мире критический подход с упором на ясность и внутреннее общение определенно кажется отличным подходом.

Кроме того, нам нужно не забывать планировать заранее более крупномасштабные системы искусственного интеллекта. Трэвис Олифант затронул здесь важный момент: Есть ли у вас план на случай, когда ваша модель устареет? Это определенно произойдет, это всего лишь вопрос времени. Мир все время меняется. То же самое и с данными, и с тем, как мы с ними взаимодействуем. Таким образом, вы должны убедиться, что у вас есть план поддержки и обновления вашей модели по прошествии времени. Трэвис называет этот процесс управлением моделью.

Когда модели обучаются, некоторые компромиссы в отношении границ решений происходят на основе распределения данных. Если вы находитесь в неудачном положении, когда ваша модель устарела или распределение входных данных изменилось, а переобучение невозможно, Питер Преттенхофер, специалист по данным в DataRobot, предлагает изучить сдвиг набора данных. . Эта концепция включает использование таких методов, как статистическое расстояние и повторное взвешивание, чтобы понять, как изменилось ваше распределение данных, и скорректировать его.

5. Природа - великий учитель

Антти Расмус, технический директор компании Curious AI, представил действительно интересную презентацию о работе, которую они проделали в моделировании воображения человека. Он провел параллель с книгой Даниэля Канемана Мышление, быстро и медленно, которая представляет собой дихотомию человеческого мышления, разделенного на две системы: Система 1 для быстрого и интуитивного мышления и система 2 для осознанного планирования и воображения. В автономных транспортных средствах примером такого поведения может быть комбинация пребывания на дороге (система 1, которая интуитивно понятна и актуальна), а также планирование возможных будущих результатов, например, что делать, если пешеход или другое транспортное средство ведет себя хаотично (система 2 , планирование и воображение). Любопытный ИИ добился хороших оценок этого с помощью того, что они называют обучением с подкреплением на основе моделей. Они продемонстрировали это с помощью цифрового существа, похожего на паука, которое постепенно научилось ходить неструктурированным образом.

Максим Орловский также подчеркнул эту перспективу в своем дальновидном выступлении: «В будущем мы можем получить большую пользу в дальнейшем моделировании биологических систем. В некотором смысле идеи децентрализации с помощью Pandora Boxchain также можно было бы задумать как введение в мультиагентные ИИ-системы своего рода групповой динамики, подобной человеку.

Эти презентации поразили меня, так как я тоже верю, что понимание и моделирование человеческих систем еще предстоит высвободить. Моя область исследований - это когнитивная наука для моделирования слуховой системы человека с целью создания лучших моделей искусственного интеллекта для обработки аудиосигналов. До сих пор эта перспектива была для меня действительно сильной и привела к новым идеям и более направленному подходу к проблемной области. Если вам интересно, вы можете прочитать учебник по моему проекту здесь: « Перспективы ИИ в обработке звука ».

Это были пять самых ценных выводов, которые я получил на конференции North Star AI. Я должен выразить огромную благодарность организаторам и спикерам, которые, безусловно, расширили мой кругозор и дали дорогу новым идеям.

Если это резюме было полезно для вас, оставьте несколько хлопков в ладоши.