Простые шаги по загрузке наборов данных Kaggle в Google Colab
В этом руководстве я покажу вам простые шаги по импорту наборов данных Kaggle в Google Colab. Kaggle - один из ведущих поставщиков больших наборов данных. Google Colab - это онлайн-платформа, подходящая для бесплатного обучения моделей машинного обучения и глубоких нейронных сетей без какой-либо установки. Google Colab меняет правила игры для людей, у которых нет ноутбуков с графическим процессором. Импортировать наборы данных Kaggle в Google Colab непросто. Я хотел бы показать вам несколько простых шагов через API.
Сначала создайте учетную запись Kaggle, если у вас ее еще нет. Нажмите на изображение своего профиля и снова нажмите на мою учетную запись.
Теперь прокрутите вниз и нажмите на создать новый токен API, затем он загрузит файл kaggle.json и запишет путь к загруженному файлу.
Теперь перейдите в Google Colab, откройте новый блокнот Python 3 и установите зависимости, используя следующую команду.
!pip install kaggle
В следующей ячейке загрузите ранее скачанный файл в блокнот. Чтобы загрузить файл, выполните следующие команды.
from google.colab import files files.upload()
Откроется диалоговое окно браузера, как показано ниже, выберите файл kaggle.json и загрузите его.
Вы можете увидеть, успешно он загружен или нет, в разделе файлов.
Если вы нашли файл kaggle.json в каталоге файлов, то файл успешно загружен и выполните следующие команды.
! mkdir ~/.kaggle !cp kaggle.json ~/.kaggle/
Теперь измените разрешение
! chmod 600 ~/.kaggle/kaggle.json
Теперь перейдите на сайт Kaggle и найдите требуемый набор данных. Давайте возьмем пример обзоров хорошей еды Amazon.
Откройте обзоры изысканной еды Amazon и нажмите на 3 точки в правой части страницы. В нем вы можете найти команду копирования API и щелкнуть по ней.
Теперь вернитесь в Colab, в следующую ячейку вставьте команду API и добавьте восклицательный знак при запуске команды для ее выполнения. Он загрузит zip-файл в каталог файлов.
Моя скопированная команда API показана ниже
!kaggle datasets download -d snap/amazon-fine-food-reviews
Чтобы распаковать загруженный набор данных, выполните следующие команды
from zipfile import ZipFile file_name = '<data set name>.zip' with ZipFile(file_name,'r') as zip: zip.extractall() print('Done')
Теперь вы можете увидеть извлеченные файлы в каталоге файлов.
Чтобы прочитать файл CSV, выполните следующие команды
import pandas as pd Data = pd.read_csv('csv file name.csv') print(Data.head()
Обновлять
Я нашел другой, более простой, чем предыдущий. просто следуйте инструкциям.
!pip install kaggle api_token ={"username":"UserName","key":"API_key"} import json import os !mkdir /root/.kaggle !echo '{"username":"UserName","key":"API_key"}'> /root/.kaggle/kaggle.json with open ('/root/.kaggle/kaggle.json','w') as file: json.dump(api_token,file) !kaggle datasets download -d snap/amazon-fine-food-reviews
Если вы нашли это полезным, просто дайте мне хлопки. Это вселяет в меня уверенность, что я пишу больше статей.