В этой статье мы узнаем, как клонировать репозитории из GitHub с помощью git clone, что позволит нам запускать репозиторий на экземпляре ноутбука, созданном в AWS. Это будет очень полезно для инженеров по машинному обучению и специалистов по данным, которые хотят изучить записные книжки других авторов в производственной среде без необходимости устанавливать все пакеты и библиотеки на свои локальные записные книжки и преодолевать сложности, связанные с любыми зависимостями и ограничениями ресурсов.
Amazon Web Services предоставляет широкий спектр функций для машинного обучения, и Amazon SageMaker находится на переднем крае. Мы научились создавать экземпляры блокнота в нашей последней статье Создание экземпляра блокнота в Amazon SageMaker. Блокнот — это основной инструмент, с помощью которого осуществляется взаимодействие с экосистемой SageMaker. Существует множество других способов взаимодействия с функциями Amazon SageMaker, причем этот подход широко используется. Мы подробно обсуждали Amazon SageMaker в предыдущей статье Введение в AWS SageMaker. Из этой статьи мы сможем клонировать общедоступные репозитории из GitHub и легко исследовать их в экземпляре Notebook в Amazon SageMaker.
Шаг 1. Создайте экземпляр Notebook в Amazon SageMaker
Вы можете легко следовать инструкциям из предыдущей статьи Создание экземпляра записной книжки в Amazon SageMaker и запустить экземпляр записной книжки. У нас запущен экземпляр ноутбука ojash-deployment-notebook.
Шаг 2
Нажмите «Открыть Jupyter».
Шаг 3
Мы попадем на страницу Jupyter в разделе «Файлы».
Шаг 4
Нажмите «Новый» и «Выберите терминал», указанный в нижней части списка.
Шаг 5
Теперь вы перенаправлены на терминал с черным экраном и надписью sh-4.2$.
Шаг 6
Измените каталог на SageMaker с помощью команды
cd SageMaker
Шаг 7
Клонируйте репозиторий git с помощью команды git clone, за которой следует HTTPS-ссылка на репозиторий.
В данном случае я клонирую репозиторий с моего GitHub, который представляет собой приложение, запрограммированное на Python с использованием pandas, и сюжетно поможет визуализировать местоположение Международной космической станции в реальном времени.
git clone https://github.com/ojashshrestha1/international-space-station-realtime-location.git
Обратите внимание, что сложные приложения машинного обучения с многочисленными библиотеками, которые необходимо установить, которые используют огромные библиотеки, предоставляемые самой службой SageMaker, могут быть легко клонированы в Amazon SageMaker с помощью этой процедуры. После этого вы можете обучать модели и тестировать их на самой платформе, не беспокоясь о сложностях установки библиотеки.
Шаг 8
Пакет будет распакован и подтверждение успеха будет показано следующим образом.
Шаг 9
Когда вы закончите клонирование, вы можете закрыть терминал с помощью команды exit.
Шаг 10
Обновление [ЗАКРЫТО] заверило, что терминал закрыт.
Шаг 11
Теперь вы можете закрыть вкладку и перейти на домашнюю страницу Jupyter Notebook. Теперь можно просматривать и исследовать новый каталог «Международная космическая станция в реальном времени».
Как видите, файлы репозитория GitHub были правильно клонированы.
Полный текст статьи читайте в C# Corner: