Простой подход к чтению онлайн-файлов CSV с помощью блокнота Google Collab.
Обучая пару студентов основам машинного обучения, я попросил их загрузить наборы данных CSV и запустить Jupyter локально, что стало невыносимо грязным после пары сеансов. Затем я нашел менее запутанный способ — чтение онлайн-файлов CSV напрямую с помощью Google Collab.
Преимущества чтения онлайн-файлов CSV напрямую с помощью Google Collab:
- Нет необходимости загружать файлы CSV
- Нет необходимости отслеживать, где хранятся файлы блокнота Jupyter на вашем компьютере.
- Нет необходимости устанавливать какие-либо библиотеки Python
Загрузка набора данных онлайн на Github
Просто создайте общедоступный репозиторий Github и загрузите туда свои файлы. На Github перейдите к нужному файлу и нажмите кнопку "Raw", обведенную красным.
Это приведет вас к URL-адресу, начинающемуся с raw.githubusercontent.com/link/to/your/file, и вы сможете увидеть свой файл в Интернете. Это онлайн-файл CSV (или любой другой формат), из которого считывается ваша записная книжка Google Collab. Скопируйте этот URL.
Чтение в блокноте Google Collab
Когда вы запускаете блокнот Google Collab, обычные библиотеки Python для обработки данных, например. NumPy, pandas, sklearn и т. д. предварительно установлены для вас. Просто напишите следующий код, чтобы прочитать онлайн-файл CSV в свой блокнот Google Collab.
import ssl ssl._create_default_https_context = ssl._create_unverified_context import pandas as pd url = "https://raw.githubusercontent.com/link/to/your/file" data = pd.read_csv(url)
ВАЖНО. Не забудьте включить фрагмент кода, иначе вы получите сообщение об ошибке при чтении онлайн-файла CSV.
import ssl ssl._create_default_https_context = ssl._create_unverified_context
После этого шага, если вы можете распечатать свой фрейм данных, все готово.
Несколько заключительных слов
Очень короткое и простое решение, но оно избавило меня от головной боли при работе с CSV-файлами и блокнотами Google Collab. Настоятельно рекомендую. Дайте мне знать, если у вас есть какие-либо решения, которые еще меньше головной боли!
Заключение
Я пишу статьи по программированию (раз в 1–2 дня), которые, вероятно, помогли бы мне в более молодом возрасте ускорить процесс обучения. Присоединяйтесь к моему списку адресов электронной почты, чтобы получать уведомления о каждой публикации.
Если эта статья была полезной и вы хотите поддержать меня, подумайте о том, чтобы подписаться на членство в Medium — это стоит 5 долларов в месяц, и вы получаете неограниченный доступ к статьям на Medium. Если вы зарегистрируетесь по моей ссылке ниже, я получу небольшую комиссию без каких-либо дополнительных затрат для вас.
Дополнительные материалы на PlainEnglish.io. Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter и LinkedIn. Присоединяйтесь к нашему сообществу Discord.