All The AWS re: Invent 2020 Выпуски машинного обучения и их значение

На прошлой неделе виртуально стартовала ежегодная технологическая конференция AWS re: Invent 2020. Обычно в этом году в Лас-Вегасе проводится недельная физическая конференция, в связи с продолжающейся пандемией COVID19, конференция перешла в виртуальное трехнедельное мероприятие. Если вы обратили внимание на re: Invent, последние пару лет машинное обучение всегда занимало центральное место во время выступлений re: Invent. Настолько сильно, что оно затмило другие выпуски в этом году, и справедливо решили AWS, что машинное обучение заслуживает отдельного выступления.

Зачем вам это нужно? Хотя большинство экспериментов с машинным обучением может начинаться локально, вы в конечном итоге попадаете в облако, когда начинаете заниматься машинным обучением в производственном масштабе. Кроме того, если посмотреть на эти рабочие нагрузки, они в подавляющем большинстве состоят из алгоритмов TensorFlow, PyTorch и MXNet. И, наконец, более 90% облачного машинного обучения на основе TensorFlow и PyTorch выполняется на AWS.

Начнем с оборудования.

AWS Trainium Чип машинного обучения, специально разработанный AWS для обучения моделей машинного обучения в облаке. Это второй кремний от AWS после AWS Infrentia, использующий тот же AWS Neuron SDK для разработчиков. Почему это важно? Экономичное и высокопроизводительное обучение глубокому обучению в облаке.

Инстансы EC2 на базе ускорителей Habana Gaudi. Экземпляры EC2 на ускорителях Habana Gaudi. Также доступно через Amazon SageMaker, AWS ECS и AWS EKS.

Почему это важно? Повышение соотношения цены и производительности до на 40% по сравнению с текущими инстансами EC2 на базе графического процессора. Это, в свою очередь, обеспечивает экономичное масштабирование вашего обучения глубокому обучению.

Amazon SageMaker - это полностью управляемый сервис машинного обучения от AWS, который позволяет создавать, обучать и развертывать машинное обучение. Это также самый надежный сервис машинного обучения в облаке на сегодняшний день. Вот некоторые из релизов SageMaker на эту тему: Invent.

SageMaker Data Wrangler позволяет обрабатывать, преобразовывать и визуализировать данные, необходимые для машинного обучения, с помощью нескольких щелчков мышью. Почему это важно? Недифференцированная задача подготовки данных, которая занимает большую часть времени в машинном обучении. Data Wrangler упрощает очистку и предварительную обработку ваших данных с помощью более 300 встроенных преобразований, давая вам представление о том, что происходит за кулисами. Вы также можете создавать многоразовые пользовательские преобразования в PySpark, SQL и Pandas.

Магазин функций SageMaker Специальное хранилище позволяет хранить, обновлять, извлекать и делиться функциями. Почему это важно? Предоставляет простой способ повторно использовать и совместно использовать расширенные функции и избежать дублирования работы в группах. Ваша команда может регистрировать и проверять функции, аналогичные тому, как они работают с репозиториями кода. Автономные и онлайн-варианты позволяют легко достичь согласованности во время обучения и вывода, когда вам нужна низкая задержка.

SageMaker Pipelines Служба CI / CD, созданная для рабочих нагрузок машинного обучения.

Почему это важно? В прошлом вы могли объединить конвейер, используя комбинацию AWS Lambda, Step Functions и CodeCommit. С помощью конвейеров вы можете создавать рабочие процессы прямо из студии SageMaker. В конвейерах есть встроенные шаблоны, которые позволяют быстро приступить к работе, а также у вас есть возможность создавать свои собственные шаблоны, используя формирование облака. Вы можете определять настраиваемые этапы и создавать как автоматические, так и ручные утверждения. Совет: перед тем, как опробовать конвейеры, вам или вашему администратору необходимо включить шаблоны проектов в SageMaker studio.

SageMaker Profiler For Debugger позволяет избежать узких мест и максимально использовать ресурсы во время обучения с помощью одного параметра. Профилировщик - это дополнительная возможность отладчика Sagemaker, и вы можете включить ее с помощью пары дополнительных параметров без каких-либо значительных изменений кода. Почему это важно? Раньше вам приходилось писать собственные сценарии или комбинировать информационную панель из CloudWatch, чтобы отслеживать использование ресурсов во время обучения. Profiler упрощает обнаружение недостаточного или чрезмерного использования ресурсов и принятие мер по исправлению. Результаты профилирования могут быть визуализированы в студии SageMaker, а также доступны через API отладчика SageMaker.

SageMaker Clarify Новая функция, которая позволяет обнаруживать предвзятость и объяснять поведение модели. Отчеты доступны непосредственно из студии SageMaker, или вы можете получить их из корзины S3, где они хранятся.

Почему это важно? Смещение в наборе данных и моделях приведет к ухудшению прогнозов. С помощью Clarify вы можете обнаружить как предтренировочные смещения, то есть смещения, уже являющиеся частью вашего набора данных, так и смещения, которые являются частью вашей обученной модели. Помимо предвзятости, пояснение также объясняет, почему модель принимала решения. Clarify использует SHAP для объяснения вклада каждой входной функции в окончательное решение.

Распределенное обучение SageMaker Хотя распределенное обучение всегда существовало в SageMaker; новые выпуски обеспечивают параллелизм данных и параллелизм моделей с помощью нескольких строк кода. Почему это важно? Новое распределенное обучение в Amazon SageMaker позволяет обучать большие сложные модели глубокого обучения до двух раз быстрее, чем существующие подходы. Распределенное обучение с помощью механизма параллелизма моделей Amazon SageMaker может эффективно разделять большие сложные модели с миллиардами параметров на несколько графических процессоров за счет автоматического профилирования и определения наилучшего способа разделения моделей.

SageMaker Edge Manager позволяет разработчикам оптимизировать, защищать, отслеживать и поддерживать модели машинного обучения, развернутые на парках периферийных устройств. Почему это важно? Позволяет управлять моделями в парке периферийных устройств и непрерывно следить за парком моделей для выявления износа. Он применяет определенные оптимизации, которые повышают производительность до 30% по сравнению с ручной настройкой моделей.

SageMaker Jumpstart предоставляет набор решений для наиболее распространенных случаев использования, таких как обнаружение мошенничества, профилактическое обслуживание и прогнозирование спроса, которые можно легко развернуть всего несколькими щелчками мыши.

Почему это важно? Разработчикам, которые плохо знакомы с машинным обучением, трудно начать. Даже опытные практики иногда сбивают с толку масштабирование для удовлетворения производственных потребностей. С JumpStart вы можете быстро найти нужную информацию, относящуюся к вашим вариантам использования машинного обучения.

Машинное обучение для баз данных? Помимо новых выпусков в стеке машинного обучения AWS, re: Invent 2020 также расширил возможности машинного обучения для других сервисов AWS, таких как Redshift ML и Neptune ML. Это позволяет разработчикам баз данных и аналитикам с ограниченными навыками машинного обучения и опытным практикам создавать, обучать и запускать модели машинного обучения непосредственно с использованием кода SQL. Почему это важно? Разработчики могут напрямую добавлять результаты вывода из своих данных в RedShift в свои отчеты бизнес-аналитики. С Neptune ML это дает возможность распространенных вариантов использования, таких как построение графов знаний и систем рекомендаций.

Amazon Q для QuickSight. Функция машинного обучения использует обработку естественного языка для ответа на ваши бизнес-вопросы. Почему это важно? Создавайте возможности запросов на естественном языке на панелях мониторинга QuickSight с помощью пары щелчков мышью. Проще говоря, задавайте вопросы простым языком и мгновенно получайте ответы.

Amazon Lookout for Metrics Служба искусственного интеллекта, использующая машинное обучение для автоматического обнаружения и диагностики аномалий в деловых и операционных данных временных рядов. Вы можете подключаться к нескольким источникам, таким как S3, RDS, и сторонним поставщикам SAAS, таким как Salesforce. Почему это важно? Позволяет обнаруживать аномалии практически в любых данных временных рядов. Помимо обнаружения, он также помогает определить основную причину аномалии. Вы можете использовать это через консоль в несколько щелчков мышью или программно интегрировать его с другими приложениями через API.

Машинному обучению для промышленных услуг в этом году было уделено особое внимание в выпусках re: Invent.

Amazon Monitron Решение машинного обучения для выявления ненормального поведения и профилактического обслуживания промышленного оборудования. Monitron состоит из двух основных компонентов: датчиков Monitron, которые прикрепляются к машинам для измерения вибрации и температуры. Шлюз Monitron получает входные данные от датчиков и отправляет их в облако AWS для обработки и применения машинного обучения. Последний компонент - мобильное приложение, которое может получать предупреждения при обнаружении аномального поведения. Почему это важно? Комплексное решение для обнаружения аномалий в промышленном оборудовании, включая все оборудование, программное обеспечение и инфраструктуру. Это позволяет легко развернуть готовое решение за считанные дни.

Lookout for Equipment Работает аналогично Monitron, но вы можете использовать свои собственные датчики и оборудование.

Lookout for Vision Расширяет возможности обнаружения аномалий для обнаружения аномалий в наборе изображений с помощью встроенных средств обработки изменений освещения под углом камеры.

Panorama Appliance. Если у вас есть интеллектуальные камеры, вы можете использовать Panorama Appliance для обработки каналов напрямую и отправки их в облако AWS для дальнейшего анализа. Устройство поставляется со встроенными в него моделями, оптимизированными для различных отраслевых областей.

Насколько это важно? Используйте ваши инвестиции в промышленное оборудование и быстро расширьте их с помощью возможностей машинного обучения.

DevOps Guru Еще одна служба искусственного интеллекта, которая позволяет выявлять поведение, отклоняющееся от нормального рабочего режима, чтобы вы могли выявлять рабочие проблемы задолго до того, как они повлияют на ваших клиентов. Почему это важно? Разверните решение на основе машинного обучения, которое автоматически предвидит проблемы DevOps до того, как они появятся, без необходимости ручной настройки или опыта машинного обучения.

Amazon HealthLake Служба, позволяющая преобразовывать данные с помощью специализированных моделей машинного обучения для выявления тенденций и составления прогнозов. Почему это важно? Служба, отвечающая требованиям HIPPA, которая систематизирует данные в хронологическом порядке, может использоваться для построения моделей машинного обучения в SageMaker. Услуги также позволяют обмениваться данными с другими поставщиками, используя стандартные форматы файлов.

Было много выпусков машинного обучения и искусственного интеллекта. AWS re: Invent все еще находится в стадии разработки, и вы можете зарегистрироваться бесплатно и посмотреть любой из этих или любых других технических сеансов глубокого погружения. AWS также предлагает щедрый уровень бесплатного пользования на год. Если у вас еще нет учетной записи AWS, я настоятельно рекомендую зарегистрироваться на уровне бесплатного пользования и опробовать эти сервисы.

Счастливого строительства!