Проект в рамках ContinualAI.org

В последние месяцы я работал над новым проектом ContinualAI.org, открытым сообществом энтузиастов непрерывного обучения. Это произошло благодаря счастливой случайности найти Винченцо Ломонако на facebook, когда я искал другого своего друга-нейробиолога Винченцо. Благодаря тому, что у меня была хорошо заметная личная и постоянная страница проекта AI, я решил проявить бесстыдство и с таким же успехом добавить его в друзья в facebook. Почему нет? его исследования и интересы казались такими близкими к шахтам и проектам ЕС H2020, над которыми я работал (МЕЧТА)…, и он казался таким же компьютерным глубоким учеником, как я… Конечно, он согласился и через год после того, как он приехал в мою лабораторию. Мы работали над новым опросом по непрерывному обучению и робототехнике, разработали некоторые показатели и запланировали некоторую работу над реальными приложениями непрерывного обучения, такими как Рой дронов для поисково-спасательных операций на море, который был представлен на AI for Good Семинар NeurIPS в декабре прошлого года в Монреале, Канада, а также доклад о показателях, призванных оценить больше, чем просто катастрофическое забывание нейронных сетей. Благодаря ContinualAI.org я также начал еще один проект непрерывного обучения использованию компьютерного зрения для увеличения автономии слепых и слабовидящих. Это еще один проект AI for Good под названием Lazarillo.

Сейчас на ContinualAI.org мы почти закончили оформление документов, чтобы стать некоммерческой организацией, а на нашем слабом канале работает 286 человек! Но что такое непрерывное обучение?

Большинство моделей машинного обучения (ML) ограничены, когда дело доходит до использования передачи знаний и адаптации к новым условиям. Их необходимо постоянно переобучать по мере изменения данных, что имеет место во многих реальных приложениях. Например, если мы погуглим термины Trump и Myspace, оба они теперь имеют разные коннотации и актуальность, чем в 2000 году. Однако, имея возможность постоянно учиться на нестационарных и эфемерных потоках данных (особенно там, где данные не могут быть сохранены для легальных, конфиденциальность или аппаратные ограничения), по сути, представляют собой реальную проблему для современных методов глубокого обучения. Непрерывное (или непрерывное) обучение (CL) [Chen and Liu, 2018] направлено на решение этих проблем. CL состоит из алгоритмов, которые непрерывно и адаптивно узнают о внешнем мире во времени, обеспечивая постепенное1 развитие все более сложных навыков и знаний. Вместо того, чтобы предполагать, что фиксированный и репрезентативный обучающий набор доступен априори, как это обычно делается в обычном языке, алгоритмы CL имеют дело с возможно неидентифицированным и неограниченным потоком данных или задач. Следовательно, основная причина CL - эффективное обучение в режиме онлайн, не забывая ранее изученные концепции. CL может предоставить широкие возможности для ИИ в целом, например, опыт автономного вождения автомобиля, полученный в одной стране, можно было бы использовать и использовать (как небольшую проблему обучения) в совершенно разных погодных условиях и сценариях вождения на другом конце света. . Несмотря на наличие надежных исследовательских структур по обучению с подкреплением (RL), таких как OpenAI Gym и Google Dopamine, они затрагивают только одну сторону приложения ML, то есть RL. В других прикладных областях обработки естественного языка (NLP) и компьютерного зрения (включая классификацию, генеративные модели или робототехнику) отсутствуют структуры с такой зрелостью.

В частности, нам не хватает единых базовых показателей глубокого обучения, сред, согласованных протоколов оценки, контрольных показателей и показателей для объективной оценки различных сценариев с точки зрения CL. Это мотивирует потребности фреймворка Avalanche. Avalanche будет служить исследовательскому сообществу для надежного и эффективного прототипирования и лучшей оценки методов CL с точки зрения катастрофического забывания (одна из основных проблем, на решение которой направлено непрерывное обучение [Kirkpatrick et al., 2017, Maltoni and Lomonaco, 2018]), передачи знаний и возможности масштабируемого обобщения в рамках ограничений памяти / вычислительных ресурсов, по доменам и тестам. Мы считаем, что эти проблемы имеют практическое значение, которое стоит учитывать при развертывании реальных систем искусственного интеллекта, которые постоянно учатся.

Мы просим вас знать:

Какие функции, возможности и типы наборов данных вам потребуются для поддержки платформы Avalanche, чтобы она была полезна для развертывания ваших реальных приложений ИИ? (пишите в комментариях! :))

Если вы заинтересованы в участии, присоединяйтесь к ContinualAI.org. Этот пост предназначен для поддержки моего участия в стипендии Toptal. Моя цель с этим приложением состоит в том, чтобы подвести итог:

  • Изменить мир, следуя видению того, что работу над ИИ можно выполнять удаленно, из любого места, если мы все поддерживаем, вносим свой вклад и развиваем сообщество энтузиастов при содействии ContinualAI.org. Я предлагаю разработать общую структуру с инструментами, метриками и наборами данных, что является решающим и естественным первым шагом к этому видению.
  • Я планирую достичь этой цели, используя стипендию исключительно для поддержки затрат на разработку программного обеспечения для платформы программного обеспечения с открытым исходным кодом (через специального инженера-исследователя, работающего полный рабочий день). Если результаты являются многообещающими, следующая вакансия для стажировки может быть расширена для поддержки одной или нескольких стипендий PhD: https://www.paristech.fr/sites/default/files/documents/ensta2-these_csc_2018_2019_diaz_subject_2.pdf
  • Было бы здорово получить поддержку, обратную связь и наставничество со стороны единомышленников из Кремниевой долины, например, при посещении таких конференций, как Google I / O, NeurIPS, ICML, ICLR и других форумов, на которых размещаются ссылки на современные научные достижения.

Члены команды, с которыми этот проект будет невозможен:
• Винченцо Ломонако (аспирант Болонского университета, Италия)
• Тимоти Лесор (аспирант), ENSTA ParisTech и Inria Flowers
• Дэвид Филлиат (профессор), ENSTA ParisTech и Inria Flowers
• Давид Мальтони (профессор, Болонский университет, Италия)

среди прочего. Я также благодарю Марка Пикетта и Чжиюан (Бретт) Чен за отзывы. Подробнее о непрерывном обучении здесь.

Ссылки

[Caselles-Dupré et al., 2018] Caselles-Dupré, H., Annabi, L., Hagen, O., Garcia-Ortiz, M., and Filliat, D. (2018). Flatland: легкая двумерная среда от первого лица для обучения с подкреплением. Электронные распечатки ArXiv.

[Чен и Лю, 2018] Чен, З., Лю Б. (2018). Машинное обучение на протяжении всей жизни. Синтез лекций по искусственному интеллекту и машинному обучению, 12 (3): 1–207.

[Киркпатрик и др., 2017] Киркпатрик, Дж., Паскану, Р., Рабинович, Н., Венесс, Дж., Дежарден, Г., Русу, А.А., Милан, К., Куан, Дж., Рамальо, Т. ., Grabska-Barwinska, A., et al. (2017). Преодоление катастрофического забывания в нейронных сетях. Proc. национальной академии наук.

[Lesort et al., 2018] Лесорт, Т., Диас-Родригес, Н., Гуду, Дж., И Филлиат, Д. (2018). Обучение представлению состояния для управления: обзор. Нейронные сети, абс. / 1802.04181.

[Ломонако и Мальтони, 2017] Ломонако, В., Мальтони, Д. (2017). Core50: новый набор данных и эталон для непрерывного распознавания объектов. На 1-й конференции по обучению роботов, 2017 г.

[Мальтони и Ломонако, 2018] Мальтони Д. и Ломонако В. (2018). Непрерывное обучение в сценариях с одной инкрементальной задачей. Препринт arXiv arXiv: 1806.08568.

[Макклоски и Коэн, 1989] Макклоски, М. и Коэн, Н. Дж. (1989). Катастрофическое вмешательство в коннекционистских сетях: проблема последовательного обучения. Психология обучения и мотивации - достижения в области исследований и теории, 24 (C): 109–165.

[Raffin et al., 2018] Раффин, А., Хилл, А., Траоре, Р., Лесорт, Т., Диас-Родригес, Н., и Филлиат, Д. (2018). S-RL Toolbox: среды, наборы данных и показатели оценки для обучения государственному представлению. Электронные распечатки ArXiv.

[Sünderhauf et al., 2018] Sünderhauf, N., Brock, O., Scheirer, W., Hadsell, R., Fox, D., Leitner, J., Upcroft, B., Abbeel, P., Burgard, W., Milford, M. и др. (2018). Пределы и возможности глубокого обучения для робототехники. Международный журнал исследований робототехники, 37 (4–5): 405–420.

[Lesort et al. 2019] Непрерывное обучение для робототехники. 2019. https://arxiv.org/abs/1907.00182

  • Https://scikit-multiflow.github.io/
  • Сценарии робототехники ИИ-системы должны постоянно учиться, а не забывать и восстанавливаться, включая потерю воплощения
    (рука / глаз, снижение зрения), адаптивность, способность справляться с чрезвычайными ситуациями (сокращение времени на решение одной и той же задачи) и т. Д.
  • Https://github.com/IDSIA/sacred