Простой подход к чтению онлайн-файлов CSV с помощью блокнота Google Collab.

Обучая пару студентов основам машинного обучения, я попросил их загрузить наборы данных CSV и запустить Jupyter локально, что стало невыносимо грязным после пары сеансов. Затем я нашел менее запутанный способ — чтение онлайн-файлов CSV напрямую с помощью Google Collab.

Преимущества чтения онлайн-файлов CSV напрямую с помощью Google Collab:

  • Нет необходимости загружать файлы CSV
  • Нет необходимости отслеживать, где хранятся файлы блокнота Jupyter на вашем компьютере.
  • Нет необходимости устанавливать какие-либо библиотеки Python

Загрузка набора данных онлайн на Github

Просто создайте общедоступный репозиторий Github и загрузите туда свои файлы. На Github перейдите к нужному файлу и нажмите кнопку "Raw", обведенную красным.

Это приведет вас к URL-адресу, начинающемуся с raw.githubusercontent.com/link/to/your/file, и вы сможете увидеть свой файл в Интернете. Это онлайн-файл CSV (или любой другой формат), из которого считывается ваша записная книжка Google Collab. Скопируйте этот URL.

Чтение в блокноте Google Collab

Когда вы запускаете блокнот Google Collab, обычные библиотеки Python для обработки данных, например. NumPy, pandas, sklearn и т. д. предварительно установлены для вас. Просто напишите следующий код, чтобы прочитать онлайн-файл CSV в свой блокнот Google Collab.

import ssl
ssl._create_default_https_context = ssl._create_unverified_context
import pandas as pd
url = "https://raw.githubusercontent.com/link/to/your/file"
data = pd.read_csv(url)

ВАЖНО. Не забудьте включить фрагмент кода, иначе вы получите сообщение об ошибке при чтении онлайн-файла CSV.

import ssl
ssl._create_default_https_context = ssl._create_unverified_context

После этого шага, если вы можете распечатать свой фрейм данных, все готово.

Несколько заключительных слов

Очень короткое и простое решение, но оно избавило меня от головной боли при работе с CSV-файлами и блокнотами Google Collab. Настоятельно рекомендую. Дайте мне знать, если у вас есть какие-либо решения, которые еще меньше головной боли!

Заключение

Я пишу статьи по программированию (раз в 1–2 дня), которые, вероятно, помогли бы мне в более молодом возрасте ускорить процесс обучения. Присоединяйтесь к моему списку адресов электронной почты, чтобы получать уведомления о каждой публикации.



Если эта статья была полезной и вы хотите поддержать меня, подумайте о том, чтобы подписаться на членство в Medium — это стоит 5 долларов в месяц, и вы получаете неограниченный доступ к статьям на Medium. Если вы зарегистрируетесь по моей ссылке ниже, я получу небольшую комиссию без каких-либо дополнительных затрат для вас.

Зарегистрируйтесь, используя мою ссылку здесь, чтобы читать неограниченное количество статей на Medium.

Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Присоединяйтесь к нашему сообществу Discord.