Еженедельный информационный бюллетень с более чем 100 000 подписчиков, в котором обсуждаются важные исследовательские работы по машинному обучению, интересные технические выпуски, деньги в ИИ и реальные реализации.



📝 От редакции: Распределенное обучение машинному обучению станет проблемой для всех

Крупномасштабное распределенное обучение — одна из тех проблем машинного обучения (ML), которую легко игнорировать. В конце концов, только крупные лаборатории искусственного интеллекта, такие как Google, Facebook и Microsoft, работают с этими огромными моделями, для обучения которых требуется множество графических процессоров. Я определенно так думал, пока не появились трансформеры. Если есть один вывод из появления моделей-трансформеров, так это то, что большие модели лучше, по крайней мере, на данный момент. Для обучения базовой модели трансформатора на основе BERT требуется довольно много инфраструктуры и распределенных процессов. В результате распределенное обучение постепенно становится основной проблемой для всего сообщества ИИ.

Как человек, которого мало интересовало распределенное обучение машинному обучению, я следил за исследованием периферийно, не вдаваясь в детали. Это изменилось за последние пару лет, когда я начал играть с все более и более крупными моделями. Уровень исследований и разработок, встроенных в распределенные фреймворки для обучения машинному обучению, поражает воображение. Такие фреймворки, как Horovod и Ray, безусловно, более известны, но на этом инновации не останавливаются. Буквально на этой неделе Microsoft открыла несколько новых дополнений к своей распределенной учебной библиотеке DeepSpeed. В то же время Facebook и Tencent опубликовали очень продвинутое исследование по масштабированию распределенного обучения моделей-трансформеров. Инновации в этой области, безусловно, продолжатся в ближайшие несколько лет, и на данный момент распределенное обучение следует считать ключевым строительным блоком любого современного конвейера машинного обучения.

🗓 На следующей неделе в TheSequence Edge:

Преимущество №117:мы обсуждаем, как преобразователи выходят за рамки обработки естественного языка (NLP) в сценарии компьютерного зрения; рассказать об ImageGPT, адаптации OpenAI своей модели GPT к сценариям компьютерного зрения; изучите библиотеку Hugging Face, одну из немногих платформ, которая включает модели преобразования для компьютерного зрения.

Edge#118:мы рассматриваем WhyLabs — платформу сквозного наблюдения и мониторинга ИИ, которая обеспечивает прозрачность на разных этапах конвейера машинного обучения.

🔎 Исследование машинного обучения

PipeTransformer: масштабирование распределенного обучения

Исследователи из Facebook, Tencent и Университета Южной Калифорнии опубликовали документ, в котором предлагается PipeTransformer, платформа на основе PyTorch для эластичного распределенного обучения моделей трансформаторов -›подробнее читайте в блоге PyTorch

Причинно-следственная связь в наборах данных временных рядов

Исследование Amazon опубликовало документ, в котором подробно описан метод обнаружения причинно-следственных связей в наборе данных временных рядов -›подробнее читайте в блоге Amazon Research.

Отслеживание происхождения клеток

IBM Research опубликовала статью, в которой обсуждаются методы машинного обучения, которые можно использовать для реконструкции деревьев клеточных линий -›подробнее читайте в блоге IBM Research

🛠 Машинное обучение в реальном мире

Управление аппаратными ресурсами больших данных в Uber

Команда инженеров Uber опубликовала анализ инфраструктуры и процессов, используемых для управления аппаратными ресурсами в своих решениях для больших данных и искусственного интеллекта -›подробнее читайте в блоге Uber

🤖 Крутые релизы AI Tech

DeepSpeed ​​MoE

Microsoft Research представила смесь экспертов DeepSpeed ​​(MoE) — дополнение к библиотеке DeepSpeed, позволяющее обучать массивно-большие модели MoE -›подробнее читайте в блоге Microsoft Research

TensorFlow Lite MoveNet

TensorFlow представила версию своей библиотеки определения позы MoveNet, оптимизированную для TensorFlow Lite -›подробнее читайте в блоге TensorFlow

💸 Деньги в ИИ

  • Компания GraphQL Apollo привлекла 130 миллионов долларов в раунде серии D при оценке более чем в 1,5 миллиарда долларов. Insight Partners возглавили раунд. Найм.
  • Инструмент для поиска и навигации по коду Sourcegraph привлек 125 миллионов долларов в раунде финансирования серии D при оценке в 2,6 миллиарда долларов. Андреессен Горовиц лидировал в раунде. Найм дистанционно.
  • Стартап по наблюдению за данными Монте-Карло привлек $60 млн финансирования под руководством Iconiq Growth. Найм по всем командам.
  • Платформа исследования и визуализации данных Preset привлекла 35,9 млн долларов в рамках финансирования серии B под руководством Redpoint Ventures. Найм в Калифорнии, США.
  • Компания Metabase, занимающаяся бизнес-аналитикой с открытым исходным кодом, привлекла раунд раунда B на сумму 30 миллионов долларов под руководством Insight Partners. Много удаленных вакансий.
  • Платформа прогнозирования стоимости авиабилетов и отелей Hopper привлекла $175 млн в ходе раунда серии G под руководством GPI Capital. Найм по всему миру.
  • Стартап по автоматизации колл-центров Balto привлек 37,5 млн долларов в раунде финансирования серии B под руководством Stripes. Найм в штате Миссури, США или удаленно.
  • Создатель робота-оператора Rapid Robotics привлекла 36,7 млн ​​долларов в рамках раунда серии B под руководством Кляйнера Перкинса и Tiger Global. Найм в Сан-Франциско, США.
  • Стартап по проверке страховых компаний TrustLayer привлек раунд серии A $15,1 млн под руководством Craft Ventures. Найм в Тампе, Лос-Анджелесе или удаленно.
  • Инструмент дизайна Uizard привлек 15 миллионов долларов финансирования от Insight Partners. Найм дистанционно.
  • Платформа для автоматизации корпоративного комплаенса Regology привлекла $8 млн в Серии А под руководством Acme Capital.
  • Стартап в области искусственного интеллекта в сфере здравоохранения Cardiomatics привлек посевной раунд на сумму 3,2 миллиона долларов под руководством венчурного капитала из Центральной и Восточной Европы Kaya. Найм в Польше.
  • Компания SwoopTalent, занимающаяся технологиями машинного обучения, была приобретена SAP. Компании договорились не раскрывать цену покупки и другие финансовые детали этой сделки.