В этой статье мы узнаем, как клонировать репозитории из GitHub с помощью git clone, что позволит нам запускать репозиторий на экземпляре ноутбука, созданном в AWS. Это будет очень полезно для инженеров по машинному обучению и специалистов по данным, которые хотят изучить записные книжки других авторов в производственной среде без необходимости устанавливать все пакеты и библиотеки на свои локальные записные книжки и преодолевать сложности, связанные с любыми зависимостями и ограничениями ресурсов.

Amazon Web Services предоставляет широкий спектр функций для машинного обучения, и Amazon SageMaker находится на переднем крае. Мы научились создавать экземпляры блокнота в нашей последней статье Создание экземпляра блокнота в Amazon SageMaker. Блокнот — это основной инструмент, с помощью которого осуществляется взаимодействие с экосистемой SageMaker. Существует множество других способов взаимодействия с функциями Amazon SageMaker, причем этот подход широко используется. Мы подробно обсуждали Amazon SageMaker в предыдущей статье Введение в AWS SageMaker. Из этой статьи мы сможем клонировать общедоступные репозитории из GitHub и легко исследовать их в экземпляре Notebook в Amazon SageMaker.

Шаг 1. Создайте экземпляр Notebook в Amazon SageMaker

Вы можете легко следовать инструкциям из предыдущей статьи Создание экземпляра записной книжки в Amazon SageMaker и запустить экземпляр записной книжки. У нас запущен экземпляр ноутбука ojash-deployment-notebook.

Шаг 2

Нажмите «Открыть Jupyter».

Шаг 3

Мы попадем на страницу Jupyter в разделе «Файлы».

Шаг 4

Нажмите «Новый» и «Выберите терминал», указанный в нижней части списка.

Шаг 5

Теперь вы перенаправлены на терминал с черным экраном и надписью sh-4.2$.

Шаг 6

Измените каталог на SageMaker с помощью команды

cd SageMaker

Шаг 7

Клонируйте репозиторий git с помощью команды git clone, за которой следует HTTPS-ссылка на репозиторий.

В данном случае я клонирую репозиторий с моего GitHub, который представляет собой приложение, запрограммированное на Python с использованием pandas, и сюжетно поможет визуализировать местоположение Международной космической станции в реальном времени.

git clone https://github.com/ojashshrestha1/international-space-station-realtime-location.git

Обратите внимание, что сложные приложения машинного обучения с многочисленными библиотеками, которые необходимо установить, которые используют огромные библиотеки, предоставляемые самой службой SageMaker, могут быть легко клонированы в Amazon SageMaker с помощью этой процедуры. После этого вы можете обучать модели и тестировать их на самой платформе, не беспокоясь о сложностях установки библиотеки.

Шаг 8

Пакет будет распакован и подтверждение успеха будет показано следующим образом.

Шаг 9

Когда вы закончите клонирование, вы можете закрыть терминал с помощью команды exit.

Шаг 10

Обновление [ЗАКРЫТО] заверило, что терминал закрыт.

Шаг 11

Теперь вы можете закрыть вкладку и перейти на домашнюю страницу Jupyter Notebook. Теперь можно просматривать и исследовать новый каталог «Международная космическая станция в реальном времени».

Как видите, файлы репозитория GitHub были правильно клонированы.

Полный текст статьи читайте в C# Corner: