Это вторая сдача экзамена на инженера по машинному обучению. Было 60 вопросов, и у меня буквально 0 секунд осталось после выбора ответа на последний вопрос. Помню, 2 года назад мне нужно было отгадать последние 5 вопросов, и я думал, что провалил экзамен. Есть больше учебных пособий для подготовки к экзаменам. Я использовал следующее:

  1. Полное руководство по сертификации специалистов по машинному обучению Google
  2. Руководство по обучению ace Google Cloud Certification для профессиональных инженеров по машинному обучению

Уровень сложности экзамена не изменился. Стало легче с большим изучением и более глубоким пониманием. Мне все еще не удалось получить правильные ответы об обучении моделей CNN и RNN для прогнозирования изображений или доходов.

  1. Изучите таблицу CNN vs RNN, чтобы понять варианты использования. Который использует больше вычислительных ресурсов, таких как память и ЦП, в случае использования обработки изображений или видео.
  2. Предположим, что обучение модели классификации изображений занимает 4 часа. Цель состоит в том, чтобы избежать изменения или повторной компиляции кода модели. Каков наиболее эффективный метод сокращения времени обучения для имитации запуска конвейера Kubeflow? Уменьшение количества слоев модели или увеличение скорости обучения противоречат цели. Лучше тренироваться с уменьшенными изображениями.
  3. Важно понимать форму тензора в Tensorflow 2. Найдите значение специального значения -1 и более конкретный пример shape=(3,2): tf.Tensor([[ 4 9] [14 19] [24 29]], shape=( 3, 2), dtype=int32). 3 означает всего 3 элемента, и каждый элемент имеет 2 элемента, подобно матрице.
  4. Каков наилучший бессерверный способ хранения метаданных машинного обучения эксперимента Vertex AI kubeflow? Определенно не на вычислительном движке, кластерах GKE или облачном хранилище. Попрактикуйтесь в том, как Pipeline хранит метаданные Vertex AI ML.
  5. Ознакомьтесь с распределенным обучением модели Tensorflow Keras с использованием Зеркальной стратегии с tf.distribute.Strategy.experimental_distribute_dataset для распространения набора данных на основе стратегии. Без использования Experiment_distribute_dataset настройка гиперпараметра или настройка размера пакета мало чем поможет.
  6. Понимание некоторых основ машинного обучения вокруг вычислительного движка, таких как параметры графического процессора для экземпляра вычислительного движка (NVidia A100 x 8). Экземпляр вычислительного движка не может подключить TPU. Выберите между вычислительным движком n1-standard-2 с 8 NVidia A100 и n2d-standard-16 для обучения модели Tensorflow 2.3. Обсудите преимущества использования образа загрузочного диска виртуальной машины глубокого обучения на основе Debian 10 для TensorFlow Enterprise 2.3 M100 по сравнению с обычным Debian 10 и установите зависимости Tensorflow вручную.
  7. Каков наилучший метод запуска модульных тестов в облачном репозитории? Конвейер CI gitops выполняет этап проверки данных конвейера Kubeflow. Выберите один из [создайте оповещение на основе журнала для отслеживания отправки кода в ветку, создайте триггер сборки облака для выполнения шага сборки модульного теста, вручную запустите модульные тесты, когда кто-то отправляет коммиты]
  8. Выберите один из 2 типов SDK, создающих конвейеры Vertex AI. Для терабайтов данных отдайте предпочтение TFX, Tensorflow Extended и ML ops TFX sample. Для небольших наборов данных отдайте предпочтение Kubeflow SDK, например этот пример Vertex AI для control_flow. Kubeflow SDK имеет синтаксис @component или @dsl.pipeline и имеет существующие готовые компоненты конвейера. Я был удивлен, увидев вопрос о компоненте, связанном с Dataproc Spark как о лучшем методе запуска задания pySpark, перенесенного с локальных серверов.
  9. Выберите наилучший метод обучения модели машинного обучения с учетом ограниченного персонала в команде инфраструктуры и коротких сроков. Сравните варианты между [создание крупных экземпляров вычислительного движка и установка блокнота Jupyter, создание блокнотов, управляемых пользователями, в инструментальных средствах Vertex AI, запуск управления блокнотами Google и использование задачи Vertex AI SDK = aiplatform.CustomTrainingJob].
  10. Каков наилучший вариант для отслеживания происхождения модели, сравнения показателей модели между различными экспериментами эффективным и бессерверным методом? Выберите между [Хранить метрики выполнения конвейера Vertex AI в Экспериментах Vertex AI, хранить артефакты и метрики модели в облачном SQL, хранить их в облачном хранилище]
  11. Какое лучшее решение для обучения модели, которое не может заставить функцию потерь сходиться. Функция потерь колеблется позже в процессе обучения? Вы бы уменьшили или увеличили скорость обучения? как насчет увеличения или уменьшения размера партии?
  12. В случае игрового использования, что является действительным бизнес-показателем, чтобы решить, должны ли они финансировать разработку модели машинного обучения, чтобы сопоставлять игроков одного уровня друг с другом? Бизнес-показатели отличаются от технических показателей машинного обучения в том смысле, что они в большей степени ориентированы на доход, расходы, а не на ROC, площадь под ROC, точность и отзыв.
  13. Поймите значение повышающей дискретизации и когда их использовать. Если обучающие данные содержат 1% мошеннических транзакций по кредитным картам, сложнее обучить модель для точного прогнозирования мошеннических транзакций по сравнению с 10% мошеннических транзакций по кредитным картам.
  14. Обязательно изучите BigQuery ML. Было около 2 вопросов по поводу функции модели импорта Tensorflow 2. Учитывая плотный график и ограниченную группу по анализу данных, данные клиентов электронной коммерции хранятся в BigQuery. Модель Tensorflow 2 Keras была обучена, протестирована и сохранена как SavedModel, что является лучшим решением для запуска крупномасштабного пакетного прогнозирования в автономном режиме для создания персонализированных рекламных электронных писем для клиентов в Черную пятницу.
  15. Рекомендация AI была переименована в Retail API. Но экзаменационный вопрос по-прежнему имеет старое название продукта. Изучите цель оптимизации в моделях AI Рекомендации. Я выбрал Frequently bought together модель, у которой больше шансов увеличить доход, чем Others You May Like .
  16. Учебные модели для экспорта на заводе с прерывистым Wi-Fi и низкими ожиданиями в отношении точности модели. Какой тип краевой модели вы предпочитаете? Низкая задержка (mobile-low-latency-1) лучше, чем 2 других, поскольку размер модели меньше, чтобы избежать тайм-аута развертывания. Точность и полнота модели хуже, чем у двух других типов, но в данном случае это не проблема. «Задержка — это количество времени, которое требуется для выполнения одного вывода с данной моделью»
  17. Квантование встречается на экзамене хотя бы один раз. Как сократить время обучения, не слишком снижая производительность модели? Квантование после обучения от Float32 до Float16, безусловно, является способом. Как насчет int16?
  18. Какое решение может привести к ухудшению производительности модели Tensorflow Keras в производственной среде? Команда специалистов по обработке и анализу данных имеет доступ к обучающим входным образцам и входным образцам для прогнозирования. Выберите один из вариантов [переобучайте модель каждые 3 месяца, создайте задание мониторинга Vertex AI для обнаружения перекосов]. Вы должны знать разницу между контролем перекосов и дрейфом. Что предпочтительнее?
  19. Каков наилучший метод обучения данных PII пользователя в таблицах BigQuery, где столбцы PII являются важными функциями? Отбрасывать столбцы плохо. Запуск задания Cloud DLP для заполнения столбцов ### также плохо влияет на точность модели. Лучше использовать Шифрование с сохранением формата.
  20. Как вы извлекаете настроение, чтобы определить срочность записи обращений в службу поддержки без того, чтобы модель имела какое-либо предвзятое отношение к расе, религии, полу, кластеру пользователя? Я не загружаю записываемые аудиофайлы в модель напрямую, это хорошо. Лучше использовать API преобразования речи в текст для преобразования звука в текст и извлечения настроений из предложений. Были и другие варианты извлечения тональности слов или проведения синтаксического анализа, но я их не выбрал.
  21. Как использовать объяснимый ИИ для объяснения весов в результатах онлайн-прогнозирования модели? Как после развертывания модели получить объяснения от онлайн-прогноза? Онлайн-объяснения: синхронные запросы к Vertex AI API, аналогичные «онлайн-прогнозам, которые возвращают прогнозы с атрибуцией функций». Чтобы получить онлайн-объяснения, выполните те же действия, что и для получения онлайн-прогнозов. Однако вместо отправки «projects.locations.endpoints.predict запроса к Vertex AI API отправьте projects.locations.endpoints.explain запрос.»; ответ должен иметь атрибуцию функции с результатом прогноза.
  22. Как использовать оценку модели в реестре модели Vertex AI для сравнения важности функций и показателей между различными версиями модели. Это лучший инструмент для оценки моделей в целом без конкретных входных данных прогнозирования.
  23. Ознакомьтесь с конвейерами Vertex. Вокруг этого больше 3-х вопросов. Вы можете практиковаться с лабораторией.