Простые шаги по загрузке наборов данных Kaggle в Google Colab

В этом руководстве я покажу вам простые шаги по импорту наборов данных Kaggle в Google Colab. Kaggle - один из ведущих поставщиков больших наборов данных. Google Colab - это онлайн-платформа, подходящая для бесплатного обучения моделей машинного обучения и глубоких нейронных сетей без какой-либо установки. Google Colab меняет правила игры для людей, у которых нет ноутбуков с графическим процессором. Импортировать наборы данных Kaggle в Google Colab непросто. Я хотел бы показать вам несколько простых шагов через API.

Сначала создайте учетную запись Kaggle, если у вас ее еще нет. Нажмите на изображение своего профиля и снова нажмите на мою учетную запись.

Теперь прокрутите вниз и нажмите на создать новый токен API, затем он загрузит файл kaggle.json и запишет путь к загруженному файлу.

Теперь перейдите в Google Colab, откройте новый блокнот Python 3 и установите зависимости, используя следующую команду.

!pip install kaggle

В следующей ячейке загрузите ранее скачанный файл в блокнот. Чтобы загрузить файл, выполните следующие команды.

from google.colab import files
files.upload()

Откроется диалоговое окно браузера, как показано ниже, выберите файл kaggle.json и загрузите его.

Вы можете увидеть, успешно он загружен или нет, в разделе файлов.

Если вы нашли файл kaggle.json в каталоге файлов, то файл успешно загружен и выполните следующие команды.

! mkdir  ~/.kaggle
!cp kaggle.json ~/.kaggle/

Теперь измените разрешение

! chmod 600 ~/.kaggle/kaggle.json

Теперь перейдите на сайт Kaggle и найдите требуемый набор данных. Давайте возьмем пример обзоров хорошей еды Amazon.

Откройте обзоры изысканной еды Amazon и нажмите на 3 точки в правой части страницы. В нем вы можете найти команду копирования API и щелкнуть по ней.

Теперь вернитесь в Colab, в следующую ячейку вставьте команду API и добавьте восклицательный знак при запуске команды для ее выполнения. Он загрузит zip-файл в каталог файлов.

Моя скопированная команда API показана ниже

!kaggle datasets download -d snap/amazon-fine-food-reviews

Чтобы распаковать загруженный набор данных, выполните следующие команды

from zipfile import ZipFile
file_name = '<data set name>.zip'
with ZipFile(file_name,'r') as zip:
   zip.extractall()
print('Done')

Теперь вы можете увидеть извлеченные файлы в каталоге файлов.

Чтобы прочитать файл CSV, выполните следующие команды

import pandas as pd
Data = pd.read_csv('csv file name.csv')
print(Data.head()

Обновлять

Я нашел другой, более простой, чем предыдущий. просто следуйте инструкциям.

!pip install kaggle
api_token ={"username":"UserName","key":"API_key"}
import json
import os
!mkdir /root/.kaggle
!echo '{"username":"UserName","key":"API_key"}'> /root/.kaggle/kaggle.json
with open ('/root/.kaggle/kaggle.json','w') as file:
    json.dump(api_token,file)
!kaggle datasets download -d snap/amazon-fine-food-reviews

Если вы нашли это полезным, просто дайте мне хлопки. Это вселяет в меня уверенность, что я пишу больше статей.