Добро пожаловать в обновленную версию машинного обучения (ML UTD) 3! Блог LifeWithData отделяет сигнал от шума на сегодняшнем лихорадочном фронте пересечения между программной инженерией и машинным обучением.

LifeWithData стремится постоянно доставлять кураторские информационные бюллетени по машинному обучению, которые указывают читателю на ключевые события без большого количества предыстории для каждого. Это позволяет получать частые и краткие обновления по отрасли, не перегружая читателей информацией.

ML UTD 3 приносит инновации в области данных, вычислений и платформ.

[Данные] Смотри, Высокие Измерения!

Визуализация данных — это развлечение и игра, пока вы не попытаетесь использовать ее на векторе в больших размерах. В качестве альтернативы TSNE или UMAP Facebook создал HiPlot, который использует параллельные графики для обнаружения корреляций и закономерностей в многомерных данных. Библиотека кажется отличной; Я, пожалуй, напишу об этом подробный отчет. Посмотрите их репозиторий здесь.

[Данные] Данные порождают гораздо больше данных

Вышла новая версия фантастической библиотеки для увеличения изображений imgaug. Расширение данных — это удобный инструмент, помогающий нейронным сетям, нуждающимся в данных, обобщать новые данные.

Naver Labs Europe выпустила набор данных KITTI2. Прошу прощения за плохие новости, но это не набор изображений котят. Тем не менее, это все еще довольно круто и даже полезнее, чем изображения кошек. Набор данных представляет собой набор фотореалистичных видеоматериалов игрового движка Unity. Такие данные помогают быстро обучать нейронные сети для автономной навигации транспортных средств.

[Вычисления] Colab, возьми мои деньги!

В какой вычислительной среде вы выполняете исследовательский анализ данных? Блокноты Vanilla Jupyter — это вчерашний день. Среда Google Colab предлагает версию с большим количеством батарей. Теперь Colab представила платное предложение. За ежемесячную плату в размере 10 долларов ваши ноутбуки будут иметь более длительное время работы, больше оперативной памяти и доступ к более мощным графическим процессорам. Подробнее читайте на их странице регистрации.

[Вычисления] Наука о данных, а не DevOps

Говоря об эволюции ноутбука Jupyter, DeepNote привлекла финансирование, чтобы объединить лучшее из традиционной IDE с ноутбуком Jupyter. Я тянусь к ним!

[Вычисления] Oh My Bash с ИИ

Какой ваш любимый терминал? Бьюсь об заклад, он не питается от ИИ… пока. IBM разработала CLAI с открытым исходным кодом, чтобы использовать обработку естественного языка, чтобы сделать вашу жизнь на терминале bash еще более эффектной. Его текущие навыки включают следующее:

  • Естественный язык для команды (nlc2cmd): из вопроса на естественном языке о желаемой команде предложите правильный терминальный синтаксис для нее
  • Автоматизация облачного развертывания: узнайте, как выполнять развертывание облачного программного обеспечения на основе исторических развертываний, выполненных вручную.
  • Fixit: из неудачной команды предложите соответствующий набор команд, которые выполнят то, что, по мнению CLAI, намеревался выполнить пользователь.
  • Проводник справочной страницы: из описания желаемой команды на естественном языке извлеките и откройте «справочную страницу» (руководство) для команды.

[Платформы] Tensorflow.js превосходит React Native

В последние годы React Native произвел огромный фурор в сообществе пользовательского интерфейса, объединив чудеса React с JSX для iOS и Android. Теперь библиотека Tensorflow Javascript доступна для общего использования с React Native. Это еще больше снижает барьер для разработки мобильных приложений, не зависящих от платформы, которые основаны на машинном обучении!

Будьте в курсе

Это все, что касается ML UTD 3. Однако в академических кругах и в промышленности все происходит очень быстро! Помимо ML UTD, следите за новостями в блоге LifeWithData.

Если вы не являетесь поклонником информационных бюллетеней, но все же хотите быть в курсе, рассмотрите возможность добавления lifewithdata.org/blog в настройку агрегации Feedly.

Первоначально опубликовано на https://lifewithdata.org 16 февраля 2020 г.