Основные моменты, открытые вопросы и направления на будущее
Введение
Непрерывное обучение - захватывающая тема, которая в последнее время привлекает все больше внимания в сообществе ИИ. Хотя семинар Непрерывное обучение зародился в NeurIPS в 2016 году, он не состоялся в 2017 году, что привело к его второму и самому успешному выпуску в 2018 году, седьмому. декабря, всего несколько дней назад, более 400 участников и более 80 представленных! 😮 🔥
Стоит упомянуть, что, хотя это, несомненно, один из самых важных и успешных семинаров, существующих на сегодняшний день по этой теме, за последние несколько лет было предложено множество по аналогичным темам (извините, если я пропустил некоторые из них), что проясняет сильные и растущий интерес к этим идеям:
- 2-й семинар по непрерывному обучению: подход к обучению с подкреплением @ ICML / IJCAI 2018
- 1-й семинар по непрерывному бесконтрольному сенсомоторному обучению @ ICDL-EpiRob 2018
- 1-й семинар по непрерывному обучению: подход к обучению с подкреплением @ ICML 2017
- Машинное обучение на протяжении всей жизни и компьютерное чтение Интернета @ KDD-2016
- Учебное пособие: машинное обучение на протяжении всей жизни в эпоху больших данных @ IJCAI 2015
В этом кратком сообщении в блоге я попытаюсь подвести итог с моей собственной точки зрения и, без каких-либо гарантий полноты, основных моментов 2-го выпуска семинара CL. , особенно для тех, кто не смог посетить семинар в этом году! 😃 🚀
В центре внимания семинара
В 1-м издании семинара основное внимание уделялось определению полного списка желаемых возможностей системы с непрерывным обучением (CL). 2-е издание посвящено:
- как оценивать методы CL
- как CL сравнивается со связанными идеями (например, обучение на протяжении всей жизни, бесконечное обучение, трансферное обучение, мета-обучение ) и как достижения в этих областях могут быть полезны для постоянного обучения.
Беседы / приглашенные доклады
С полным расписанием семинара можно ознакомиться здесь вместе с принятыми докладами, которые можно найти здесь.
Семинар начался с удивительного введения в практикум от Марка Ринга с его определением непрерывного обучения, которое он предложил еще в 90-х в своей новаторской диссертации « Непрерывное обучение Обучение в среде подкрепления »», и сейчас он продолжает развиваться в контексте своего стартапа в Кремниевой долине Cogitai!
За ним последовали три выступления в центре внимания: Разван Паскану, Наталья Диас Родригес и Мэтью Ример. Первые два были посвящены тестам и оценке CL, а второй - часто игнорируемому компромиссу между передачей и вмешательством знаний в постоянно обучающихся системах.
В первом приглашенном выступлении Челси Финн смогла предоставить обширный обзор метаобучения перспективы непрерывного обучения, вскоре последовали вдохновляющие выступления Райи Хадселл и Марка'Аурелио Ранзато. Меня впечатлила решительная ставка Райи на Непрерывное обучение как истинный путь к AGI (Я согласен 😃). Марк Аурелио вместо этого сосредоточил внимание на огромной важности эффективности как фундаментальной алгоритмической функции, которую мы не можем игнорировать в целом, но особенно для CL.
После обеда и прекрасной стендовой сессии семинар возобновился с приглашенных лекций Юргена Шмидхубера и Ярина Гала. Я был впечатлен присутствием Джеффри Хинтона во время выступления Юргена, которое, как вы понимаете, было потрясающим! Ярин снова сфокусировался на надежности оценки CL с отличными выводами, которые также содержатся в его недавней статье «На пути к надежной оценке непрерывного обучения».
Семинар продолжился тремя докладами в центре внимания: Сиддхарт Сваруп, Рахаф Альджунди и Шагун Содхани (которые выделили несколько интересных аспектов непрерывного обучения при работе с вариативным , методы регуляризации и последовательного обучения) и финальную презентацию Марты Уайт с невероятной подачей!
Панель
После переговоров и в конце семинара была проведена обширная (более 2 часов) панель. В группу входили Йи Уай Тех, Рич Саттон, Марта Уайт, Юрген Шмидхубер, Марк’Аурелио Ранзато и Челси Финн.
На многие вопросы были даны ответы в неформальной (мы очень весело провели время), но захватывающей и супер информативной сессии вопросов и ответов! Думаю, среди наиболее важных тем, которые возникнут после переговоров и в ходе панельной дискуссии, мы могли бы выделить две из них:
- Что такое непрерывное обучение и как оно связано с RL?
- Как оценивать алгоритмы непрерывного обучения?
Которые в значительной степени соответствуют фокусу этого 2-го выпуска семинара и по-прежнему представляют две основные проблемы, по которым сообществу еще предстоит прийти к общему согласию.
Споры о номенклатуре и определениях
Как я уже обсуждал в своем предыдущем сообщении блога Почему непрерывное обучение является ключом к машинному интеллекту »в 2017 г. (см. Раздел о номенклатуре), термин непрерывное обучение может иметь разное значение для разных исследователей. По сути, это произошло из-за отсутствия формального определения в течение многих лет и очень похожих концепций, плавающих под разными названиями и преследующих разные цели.
Для Ричарда Саттона, Марка Ринга и Юргена Шмидхубера CL по сути является частью обучения с подкреплением (см. формальное определение, предложенное Марком Рингом в статье На пути к формальным рамкам для непрерывного обучения, 2005 г.).
Для других, таких как Райя Хадселл, Разван Паскану и Марк'Аурелио Ранзато, это, по сути, синоним непрерывного обучения и может рассматриваться как ортогональное парадигмы обучения с учителем, без учителя и обучения с подкреплением; просто набор свойств и желаний систем, которые никогда не перестают учиться. Похоже, что до конвергенции еще далеко.
Обсуждение оценок
Учитывая новизну темы, особенно в сообществе глубокого обучения, многие статьи по CL в контексте контролируемого обучения и обучения с подкреплением оценивают недавно предложенные методы с различными тестами / средами, метриками и схемами оценки.
Несмотря на то, что и в этом контексте общая установка еще не возникла, похоже, что многие участники дискуссии и участники семинара согласились с необходимостью очень большого набора тестов и других различных метрики оценки для оценки непрерывного обучения в различных сценариях и с учетом нескольких факторов, которые стоит учитывать для реальных систем, которые непрерывно обучаются (поэтому мы предложили CORe50 и новые метрики помимо оценки катастрофического забывания).
Заключение
2-е издание семинаров «Непрерывное обучение» предоставило прекрасную возможность пообщаться с людьми, работающими над этой быстро развивающейся темой, которую многие из нас считают фундаментальной для будущего ИИ.
Я думаю, что подобные события имеют первостепенное значение для обмена идеями, подпитки прогресса и появления общего понимания открытых проблем и возможных решений в этой области.
Я хотел бы глубоко поблагодарить Марка Ринга, Развана Паскану, Йи Уай Тех, Марка Пикетта, организаторов семинара и всех компьютеров, которые сделали это возможным.
Я действительно надеюсь участвовать в других подобных мероприятиях в будущем. А пока я приглашаю вас присоединиться к ContinualAI.org: открытому сообществу (которое вскоре станет официальной некоммерческой исследовательской организацией), объединяющее более 230 исследователей и энтузиастов работают вместе над темой Непрерывное обучение и над многими проектами с открытым исходным кодом! присоединяйтесь к нам сегодня на слабину! 😄 🍻
Если вы хотите видеть больше сообщений о моей работе над искусственным интеллектом и непрерывным / непрерывным глубоким обучением, подпишитесь на меня в Medium и в моей социальной сети: Linkedin, Twitter и Facebook!
Если вы хотите связаться или просто узнать больше обо мне и моих исследованиях, посетите мой сайт vincenzolomonaco.com или оставьте комментарий ниже! 😃