Машинное обучение с TensorFlow на Google Cloud Platform: примеры кода

За последние несколько месяцев моя команда работала над созданием двух специализаций из 5 курсов на Coursera под названием Машинное обучение на Google Cloud Platform и Расширенное машинное обучение на GCP. Полный курс из 10 курсов проведет вас от стратегического обзора того, почему машинное обучение так важно, вплоть до создания пользовательских моделей последовательностей и механизмов рекомендаций.

Эти курсы предоставляют интерактивный, практичный и прагматичный способ быстро и эффективно начать заниматься машинным обучением. Несмотря на то, что существует множество теоретических курсов машинного обучения, моя цель в этой специализации - обеспечить практическое обучение, чтобы вы могли сразу же приступить к работе. Для того, чтобы вы получили такой скачок, в курсах есть множество примеров приложений TensorFlow с открытым исходным кодом, которые вы можете сразу освоить и обучить / развернуть.

Первый курс из серии "Машинное обучение в GCP". Как Google делает ML теперь доступен на Coursera. Пожалуйста, пройдите курс и пройдите оставшиеся курсы по мере их появления раз в несколько недель.

Но даже пока вы ждете, что классная команда докладчиков проведет курсы, исходный код лабораторных работ по специализации уже доступен. В этом сообщении блога я перечислю, что доступно в каждой папке репозитория GitHub:

01. Как Google занимается машинным обучением

Data_analysis.ipynb показывает, как проводить анализ данных на огромных наборах данных:

Mlapis.ipynb показывает, как вызывать предварительно обученные модели машинного обучения:

02. Запуск в ML

Repeatable_splitting.ipynb иллюстрирует важность повторяемого разделения данных.

Create_datasets.ipynb показывает, как исследовать и создавать наборы данных с помощью Pandas и BigQuery.

03. Введение в TensorFlow

A_tfstart.ipynb показывает, как использовать TensorFlow в качестве числового программного пакета.

B_estimator.ipynb показывает, как писать простые модели машинного обучения в TensorFlow.

C_batched.ipynb показывает, как работать с большими наборами данных в TensorFlow.

D_traineval.ipynb показывает, как проводить распределенное обучение с помощью TensorFlow.

Debug_demo.ipynb показывает, как отлаживать программы TensorFlow.

E_cloudmle.ipynb показывает, как развертывать модели TensorFlow и прогнозировать с их помощью без сервера, с помощью Cloud ML Engine.

04. Разработка функций

A_features.ipynb иллюстрирует важность правильного представления функций.

Поток данных показывает, как использовать Apache Beam on Cloud Dataflow для предварительной обработки.

Taxifeateng показывает, как реализовать функциональную инженерию в моделях TensorFlow.

05. Искусство и наука машинного обучения

A_handtuning.ipynb показывает, как изменить различные параметры, связанные с моделями TensorFlow, для повышения точности.

B_hyperparam.ipynb показывает, как автоматически настраивать модели TensorFlow в Cloud ML Engine, чтобы вам не приходилось настраивать их вручную.

C_neuralnetwork.ipynb показывает, как легко обучать и прогнозировать с помощью моделей распределенных нейронных сетей в TensorFlow.

D_customestimator.ipynb показывает, как взять модель, которую вы найдете в документе, и реализовать таким образом, чтобы ее можно было распространять и масштабировать.

06. Сквозное машинное обучение структурированных данных.

Это набор записных книжек:

1_explore.ipynb показывает, как исследовать данные с помощью Pandas и BigQuery.

2_sample.ipynb показывает, как многократно разделять данные.

3_tensorflow.ipynb показывает, как построить модель оценщика на основе данных.

4_preproc.ipynb показывает, как предварительно обрабатывать данные в масштабе с помощью Dataflow.

4_preproc_tft.ipynb показывает, как предварительно обрабатывать данные в масштабе с помощью TF.Transform.

5_train.ipynb показывает, как обучить модель TensorFlow на Cloud ML Engine.

6_deploy.ipynb показывает, как развернуть обученную модель в Cloud ML Engine.

Обслуживание показывает, как получить доступ к прогнозам машинного обучения из веб-приложений и конвейеров данных.

Вместе указанные выше 7 лабораторных работ суммируют уроки предыдущих шести курсов по реальной проблеме, проводя вас от исследования данных до развертывания и прогнозирования.

07. Серийные модели ML.

Никаких лабораторных работ с этим - это касается дизайнерских и архитектурных соображений, связанных с моделями машинного обучения.

08. Модели классификации изображений.

Mnist_estimator.ipynb показывает, как создать классификатор изображений с помощью API-интерфейса оценщика.

Mnist_models.ipynb показывает, как создать собственный оценщик со всеми приемами (сверточные слои, увеличение, пакетная нормализация и т. Д.), Которые входят в хорошую модель классификации изображений.

Flowers_fromscratch.ipynb показывает, как применить модель изображения из предыдущей записной книжки к реальным изображениям.

Лабораторные работы по обучению переносам и AutoML отсутствуют на GitHub, поскольку они не требуют кодирования - просто наведите указатель мыши и щелкните!

09. Последовательные модели временных рядов и текста.

Sinewaves.ipynb покажет вам, как построить модель прогнозирования временных рядов в TensorFlow, используя различные методы, включая CNN и LSTM.

Temperature.ipynb показывает, насколько сложно правильно настроить LSTM.

Txtcls1.ipynb показывает, как построить модель классификации текста с нуля, используя различные методы, включая CNN и LSTM.

Txtcls2.ipynb показывает, как использовать предварительно обученные вложения слов в модели классификации текста.

Word2vec.ipynb показывает вам, как создать вложение слова из вашего собственного набора данных.

Posery.ipynb показывает вам, как использовать Tensor2Tensor для решения ваших собственных текстовых задач, будь то резюмирование текста или генерация текста.

10. Механизмы рекомендаций

Content.ipynb показывает пример системы рекомендаций на основе контента.

Wals.ipynb показывает, как создать систему рекомендаций для совместной фильтрации в TensorFlow.

Wals_tft.ipynb делает модель совместной фильтрации готовой к производству, добавляя конвейер tf.transform для автоматического сопоставления уникальных идентификаторов пользователей и элементов.

По мере развития ML, конечно же, будет больше лабораторий, и некоторые из вышеперечисленных лабораторий могут оказаться ненужными. Репозиторий GitHub - это живой репозиторий, и мы планируем поддерживать его в актуальном состоянии и отражать рекомендуемую практику TensorFlow. Итак, если вы создаете свои собственные модели машинного обучения, записные книжки (и соответствующие им каталоги моделей) являются отличной отправной точкой.

Удачного знакомства!