AWS re: Invent находится в нескольких часах езды. Как вы понимаете, в ближайшие дни будет объявлено о множестве новых услуг и функций. Прежде чем шлюзы откроются, давайте взглянем на некоторые из наших недавних анонсов в области машинного обучения.

Amazon Rekognition

Сервис анализа изображений и видео постоянно совершенствуется. Последнее обновление делает его еще более эффективным при обнаружении лиц даже в сложных ситуациях (поворот, плохое освещение, частично скрытые лица и т. Д.). Вот небольшой пример с одной из моих фотографий: было обнаружено 96 лиц.

Амазонка Полли

В сервис преобразования текста в речь добавлено несколько новых голосов:

  • ‘Bianca’, новый женский голос для итальянского языка,
  • «Люсия», новый женский голос для кастильского испанского языка,
  • «Mia», новый женский голос для мексиканского испанского языка.

Amazon Polly теперь поддерживает 57 голосов на 28 языках.

Amazon Transcribe

Сервис преобразования речи в текст теперь поддерживает транскрипцию в реальном времени! В этом репозитории Github вы найдете образец Java-приложения. Вот небольшая демонстрация.

Amazon Translate

Служба переводов только что добавила 8 новых языков: датский, голландский, финский, иврит, индонезийский, корейский, польский и шведский. Таким образом, общее количество поддерживаемых языков составляет 21, а общее количество языковых пар - 417. Вы можете просмотреть полный список в документации.

$ aws translate translate-text --source-language-code auto --text "I can now speak 21 different languages" --target-language-code ru
{
    "TranslatedText": "Теперь я могу говорить на 21 разных языках",
    "SourceLanguageCode": "en",
    "TargetLanguageCode": "ru"
}
$ aws translate translate-text --source-language-code auto --text "Теперь я могу говорить на 21 разных языках" --target-language-code he
{
    "TranslatedText": "עכשיו אני יכול לדבר 21 שפות שונות",
    "SourceLanguageCode": "ru",
    "TargetLanguageCode": "he"
}
$ aws translate translate-text --source-language-code auto --text "עכשיו אני יכול לדבר 21 שפות שונות" --target-language-code fr
{
    "TranslatedText": "Maintenant, je peux parler 21 langues différentes",
    "SourceLanguageCode": "he",
    "TargetLanguageCode": "fr"
}

Amazon Comprehend

Служба обработки естественного языка теперь поддерживает две настраиваемые функции:

Традиционно для использования продвинутых алгоритмов оба метода требовали опыта машинного обучения. Здесь все, что вам нужно сделать, это внести свои собственные помеченные данные в файлы CSV, и Comprehend обучит вам модель. Не требуется опыта, нет инфраструктуры, с которой нужно иметь дело.

Amazon SageMaker

В последнее время служба машинного обучения получила довольно много обновлений.

Особенности инфраструктуры

  • Пакетное преобразование теперь может выполняться внутри VPC.
  • Все API SageMaker, включая экземпляры записных книжек, теперь поддерживают AWS Private Link. Это гарантирует, что весь трафик останется внутри вашего VPC, даже не через общедоступный Интернет.
  • SageMaker теперь интегрирован с Apache Airflow, системой управления рабочим процессом. Используя Airflow, вы можете создать рабочий процесс для обучения SageMaker, настройки гиперпараметров, пакетного преобразования и развертывания конечных точек. Вы можете использовать любую платформу SageMaker Deep Learning или алгоритмы Amazon для выполнения этих операций в Airflow. Вот пример.

Особенности алгоритма

  • Метрики обучения (потери, точность и т. Д.) Теперь видны в Amazon CloudWatch. Вы также можете запросить их с помощью SageMaker SDK.
  • Встроенный контейнер TensorFlow теперь поддерживает TensorFlow 1.11. Теперь вы также можете написать свой скрипт, используя Python 3.
  • Автоматическая настройка модели теперь поддерживает теплый старт, то есть вы можете начать новое задание по настройке на основе результатов предыдущего. Таким образом, вы можете продолжать исследовать то же пространство параметров без повторной настройки с нуля.
  • Недавно были добавлены два новых встроенных алгоритма: Object2vec, универсальный алгоритм встраивания, и IP Insights, алгоритм неконтролируемого обучения, который изучает шаблоны использования адресов IPv4. Таким образом, общее количество встроенных алгоритмов достигает шестнадцати.

Pfew. pre: Invent был довольно загружен в этом году :) Боюсь, это ничто по сравнению с тем, что будет в ближайшие дни 😱

Я, конечно, буду держать вас в курсе. Для прямых трансляций подписывайтесь на меня в Twitter.

Молния ударит нормально 🤘