Еженедельный информационный бюллетень с более чем 80000 подписчиков, в котором обсуждаются важные исследовательские работы по машинному обучению, крутые технические выпуски, деньги от ИИ и реальные реализации.

Sequence Scope - это сводка наиболее важных опубликованных исследовательских работ, опубликованных новостей о технологиях и стартапах в экосистеме ИИ за последнюю неделю. Этот сборник является частью информационного бюллетеня TheSequence. Специалисты по обработке данных, ученые и разработчики из Microsoft Research, Intel Corporation, Linux Foundation AI, Google, Lockheed Martin, Кардиффского университета, Колледжа наук Меллона, Варшавского технологического университета, Политехнического университета Валенсии и других компаний. и университеты уже подписаны на TheSequence.



📝 От редакции: пространство MLOps становится переполненным и сбивает с толку

MLOps - один из самых популярных и перегруженных терминов в современном машинном обучении. Как правило, связанные с платформами, которые управляют различными аспектами моделей машинного обучения, сегодня MLOps, похоже, используются без разбора для описания всего, от обучения модели до мониторинга. В результате организации и группы специалистов по анализу данных, пытающиеся объединить возможности MLOps в своих конвейерах машинного обучения, по-настоящему сбивают с толку. Буквально на этой неделе я прочитал отдельные пресс-релизы о раундах финансирования для стартапов MLOps, таких как Comet и Snorkel, которые работают в таких разных областях, как мониторинг моделей и маркировка данных соответственно. Так что не расстраивайтесь, если вы не знаете, что такое MLOps😉

Перенаселенность MLOps является результатом огромного уровня инноваций в сфере машинного обучения. Чтобы разобраться в этом шуме, можно подумать о трех основных категориях платформ MLOps:

В одну группу вы можете поместить большие облачные платформы, такие как AWS, Microsoft и Google, которые создали возможности MLOps в своих сервисах машинного обучения.

Вторая релевантная группа - это сквозные среды выполнения MLOps, такие как KubeFlow или MLFlow, которые управляют многими аспектами жизненного цикла решений машинного обучения.

Наконец, у нас есть стартапы, которые сосредоточены на отдельных функциях конвейеров машинного обучения, таких как обучение или мониторинг. Текущий рынок машинного обучения достаточно фрагментирован, поэтому на данном этапе имеет смысл делать ставку на лучшие в своем классе стартапы в отдельных категориях, зная, что консолидация на рынке MLOps готова к приличному уровню консолидации в ближайшем будущем. .

🗓 На следующей неделе в TheSequence Edge:

Грань № 79: Что такое быстрое обучение; Прототипные сети как одна из самых популярных архитектур для быстрого обучения; TorchMeta - это тренажерный зал метаобучения OpenAI

Грань №80: подробно рассмотрим вариант использования маркировки данных от Snorkel AI.

Подпишитесь сейчас

Теперь давайте рассмотрим самые важные события в индустрии искусственного интеллекта на этой неделе

🔎 Исследования машинного обучения

Создание текста из данных

Amazon Research опубликовала сообщение в блоге, в котором объясняется исследование, лежащее в основе DataTuner, модели с открытым исходным кодом, которая может генерировать текст из структурированных наборов данных -› подробнее в блоге Amazon Research

Набор данных случайных разговоров

Facebook AI Research (FAIR) опубликовал документ, описывающий случайные разговоры, набор данных с открытым исходным кодом для повышения справедливости в системах компьютерного зрения -› подробнее в блоге FAIR

Использование трансформаторов для изучения органической химии

IBM Research опубликовала увлекательную статью, в которой описывается модель трансформатора, способная извлекать грамматику органической химии, изучая химические реакции -› подробнее в блоге IBM Research

🤖 Крутые релизы AI Tech

Ищите оборудование

AWS объявила о выпуске Lookout for Equipment, нового сервиса, в котором используются модели машинного обучения, оптимизированные для масштабной защиты клиентского оборудования -› подробнее в пресс-релизе AWS

Trifacta + Databricks

Trifacta анонсировала встроенные возможности интеграции для платформы Databricks, чтобы включить возможности управления качеством данных на своей платформе Lakehouse -› подробнее в исходном пресс-релизе

💸 Деньги в AI

  • Стартап MLOps Snorkel AI собрал раунд серии B 35 миллионов долларов и представил Application Studio, визуальный конструктор с шаблонными решениями для распространенных сценариев использования ИИ и простым построением новых и настраиваемых сценариев использования (в настоящее время находится в предварительной версии). Созданный в Стэнфордском университете в 2016 году, Snorkel стал очень популярным проектом с открытым исходным кодом для маркировки данных. Snorkel Flow - это комплексная платформа, построенная на принципах проекта Snorkel.
  • MLOps-стартап Comet привлек $ 13 млн в раунде финансирования серии А. (Мы рассмотрели их в Edge # 11). Comet - одна из платформ машинного обучения, которая набирает все большую популярность в командах по анализу данных. Платформа упрощает создание моделей машинного обучения и экспериментов в разных фреймворках.
  • Streamlit привлек 35 миллионов долларов в рамках серии B. Это платформа приложений с открытым исходным кодом для групп машинного обучения и обработки данных, помогающая им превращать скрипты данных в приложения для работы с данными. Все на Python.
  • Платформа для проектирования озер данных без кода Upsolver собрала 25 миллионов долларов. Они упрощают преобразование необработанных данных в данные, доступные для запроса, с помощью визуального пользовательского интерфейса SQL и автоматизируют сотни задач разработки озера данных для оптимизации производительности.
  • Платформа мониторинга машинного обучения Апория собрала посевной раунд на 5 миллионов долларов. Они утверждают, что ядро ​​их платформы - это мощный механизм мониторинга машинного обучения, дополненный гибким, совместным пользовательским интерфейсом, который превращает настройку и модификацию монитора в легкое и даже забавное занятие.
  • Стартап по синтетическим данным Synthesis AI привлек 4,5 миллиона долларов в рамках своего раунда финансирования. Используя запатентованную комбинацию генерирующих нейронных сетей и кинематографических конвейеров CGI, он создает огромное количество синтетических данных с идеальной маркировкой для построения более эффективных моделей компьютерного зрения.
  • Платформа разработки компьютерного зрения CrowdAI привлекла раунд финансирования серии A $ 6,25 млн. Это комплексная платформа без кода, которая создает собственный ИИ для автоматизации визуального контроля клиентов и помогает им анализировать изображения и видео.