Резюме 2-го семинара «Непрерывное обучение» на NeurIPS 2018

Основные моменты, открытые вопросы и направления на будущее

Введение

Непрерывное обучение - захватывающая тема, которая в последнее время привлекает все больше внимания в сообществе ИИ. Хотя семинар Непрерывное обучение зародился в NeurIPS в 2016 году, он не состоялся в 2017 году, что привело к его второму и самому успешному выпуску в 2018 году, седьмому. декабря, всего несколько дней назад, более 400 участников и более 80 представленных! 😮 🔥

Стоит упомянуть, что, хотя это, несомненно, один из самых важных и успешных семинаров, существующих на сегодняшний день по этой теме, за последние несколько лет было предложено множество по аналогичным темам (извините, если я пропустил некоторые из них), что проясняет сильные и растущий интерес к этим идеям:

В этом кратком сообщении в блоге я попытаюсь подвести итог с моей собственной точки зрения и, без каких-либо гарантий полноты, основных моментов 2-го выпуска семинара CL. , особенно для тех, кто не смог посетить семинар в этом году! 😃 🚀

В центре внимания семинара

В 1-м издании семинара основное внимание уделялось определению полного списка желаемых возможностей системы с непрерывным обучением (CL). 2-е издание посвящено:

как оценивать методы CL
как CL сравнивается со связанными идеями (например, обучение на протяжении всей жизни, бесконечное обучение, трансферное обучение, мета-обучение ) и как достижения в этих областях могут быть полезны для постоянного обучения.

Беседы / приглашенные доклады

С полным расписанием семинара можно ознакомиться здесь вместе с принятыми докладами, которые можно найти здесь.

Семинар начался с удивительного введения в практикум от Марка Ринга с его определением непрерывного обучения, которое он предложил еще в 90-х в своей новаторской диссертации « Непрерывное обучение Обучение в среде подкрепления »», и сейчас он продолжает развиваться в контексте своего стартапа в Кремниевой долине Cogitai!

За ним последовали три выступления в центре внимания: Разван Паскану, Наталья Диас Родригес и Мэтью Ример. Первые два были посвящены тестам и оценке CL, а второй - часто игнорируемому компромиссу между передачей и вмешательством знаний в постоянно обучающихся системах.

В первом приглашенном выступлении Челси Финн смогла предоставить обширный обзор метаобучения перспективы непрерывного обучения, вскоре последовали вдохновляющие выступления Райи Хадселл и Марка'Аурелио Ранзато. Меня впечатлила решительная ставка Райи на Непрерывное обучение как истинный путь к AGI (Я согласен 😃). Марк Аурелио вместо этого сосредоточил внимание на огромной важности эффективности как фундаментальной алгоритмической функции, которую мы не можем игнорировать в целом, но особенно для CL.

После обеда и прекрасной стендовой сессии семинар возобновился с приглашенных лекций Юргена Шмидхубера и Ярина Гала. Я был впечатлен присутствием Джеффри Хинтона во время выступления Юргена, которое, как вы понимаете, было потрясающим! Ярин снова сфокусировался на надежности оценки CL с отличными выводами, которые также содержатся в его недавней статье «На пути к надежной оценке непрерывного обучения».

Семинар продолжился тремя докладами в центре внимания: Сиддхарт Сваруп, Рахаф Альджунди и Шагун Содхани (которые выделили несколько интересных аспектов непрерывного обучения при работе с вариативным , методы регуляризации и последовательного обучения) и финальную презентацию Марты Уайт с невероятной подачей!

Панель

После переговоров и в конце семинара была проведена обширная (более 2 часов) панель. В группу входили Йи Уай Тех, Рич Саттон, Марта Уайт, Юрген Шмидхубер, Марк’Аурелио Ранзато и Челси Финн.

На многие вопросы были даны ответы в неформальной (мы очень весело провели время), но захватывающей и супер информативной сессии вопросов и ответов! Думаю, среди наиболее важных тем, которые возникнут после переговоров и в ходе панельной дискуссии, мы могли бы выделить две из них:

Что такое непрерывное обучение и как оно связано с RL?
Как оценивать алгоритмы непрерывного обучения?

Которые в значительной степени соответствуют фокусу этого 2-го выпуска семинара и по-прежнему представляют две основные проблемы, по которым сообществу еще предстоит прийти к общему согласию.

Споры о номенклатуре и определениях

Как я уже обсуждал в своем предыдущем сообщении блога Почему непрерывное обучение является ключом к машинному интеллекту »в 2017 г. (см. Раздел о номенклатуре), термин непрерывное обучение может иметь разное значение для разных исследователей. По сути, это произошло из-за отсутствия формального определения в течение многих лет и очень похожих концепций, плавающих под разными названиями и преследующих разные цели.

Для Ричарда Саттона, Марка Ринга и Юргена Шмидхубера CL по сути является частью обучения с подкреплением (см. формальное определение, предложенное Марком Рингом в статье На пути к формальным рамкам для непрерывного обучения, 2005 г.).

Для других, таких как Райя Хадселл, Разван Паскану и Марк'Аурелио Ранзато, это, по сути, синоним непрерывного обучения и может рассматриваться как ортогональное парадигмы обучения с учителем, без учителя и обучения с подкреплением; просто набор свойств и желаний систем, которые никогда не перестают учиться. Похоже, что до конвергенции еще далеко.

Обсуждение оценок

Учитывая новизну темы, особенно в сообществе глубокого обучения, многие статьи по CL в контексте контролируемого обучения и обучения с подкреплением оценивают недавно предложенные методы с различными тестами / средами, метриками и схемами оценки.

Несмотря на то, что и в этом контексте общая установка еще не возникла, похоже, что многие участники дискуссии и участники семинара согласились с необходимостью очень большого набора тестов и других различных метрики оценки для оценки непрерывного обучения в различных сценариях и с учетом нескольких факторов, которые стоит учитывать для реальных систем, которые непрерывно обучаются (поэтому мы предложили CORe50 и новые метрики помимо оценки катастрофического забывания).

Заключение

2-е издание семинаров «Непрерывное обучение» предоставило прекрасную возможность пообщаться с людьми, работающими над этой быстро развивающейся темой, которую многие из нас считают фундаментальной для будущего ИИ.

Я думаю, что подобные события имеют первостепенное значение для обмена идеями, подпитки прогресса и появления общего понимания открытых проблем и возможных решений в этой области.

Я хотел бы глубоко поблагодарить Марка Ринга, Развана Паскану, Йи Уай Тех, Марка Пикетта, организаторов семинара и всех компьютеров, которые сделали это возможным.

Я действительно надеюсь участвовать в других подобных мероприятиях в будущем. А пока я приглашаю вас присоединиться к ContinualAI.org: открытому сообществу (которое вскоре станет официальной некоммерческой исследовательской организацией), объединяющее более 230 исследователей и энтузиастов работают вместе над темой Непрерывное обучение и над многими проектами с открытым исходным кодом! присоединяйтесь к нам сегодня на слабину! 😄 🍻

Если вы хотите видеть больше сообщений о моей работе над искусственным интеллектом и непрерывным / непрерывным глубоким обучением, подпишитесь на меня в Medium и в моей социальной сети: Linkedin, Twitter и Facebook!
Если вы хотите связаться или просто узнать больше обо мне и моих исследованиях, посетите мой сайт vincenzolomonaco.com или оставьте комментарий ниже! 😃