Узнайте, как управлять файлами CSV с помощью Pandas и библиотеки CSV.
CSV-файл — это обычный текстовый файл, содержащий строки и столбцы. Строки в CSV-файле разделяются новой строкой, а столбцы — запятыми.
CSV обеспечивают простой способ хранения данных и обычно используются для экспорта табличных данных на многих веб-сайтах.
Простой CSV-файл
Давайте напишем CSV-файл, содержащий данные учащихся, как показано ниже.
student, calculus,statistics,math Harrison,pass,pass,pass Leakey, fail, pass,pass matt, pass, pass,fail cathy, pass,pass,pass
CSV-библиотека Python
Python предоставляет несколько способов чтения и записи файлов CSV. В этом руководстве мы будем использовать модуль CSV и библиотеку pandas для чтения и записи данных в файлы CSV.
Чтение CSV-файла
Начнем с создания 2 файлов, а именно
- студенты.txt
- студенты.py
Далее введите следующие данные в файл student.txt
student, calculus,statistics,math Harrison,pass,pass,pass Leakey, fail, pass,pass matt, pass, pass,fail cathy, pass,pass,pass
Теперь откройте файлы student.py и начните с импорта модуля CSV.
import csv with open('students.txt') as my_file: reader = csv.reader(my_file, delimiter =',') for row in reader: print(row)
Файловая функция open() используется для открытия файла Python и поддерживает 3 режима работы с файлами.
- Режим чтения -r
- Режим записи -w
- Режим добавления -a
csv.reader считывает содержимое файла, перебирая каждую строку в CSV-файле. Затем мы получаем каждую строку и печатаем содержимое. разделитель указывает, какой символ используется для разделения полей, и в нашем случае это запятая
Результатом будет;
['student', ' calculus', 'statistics', 'math'] ['Harrison', 'pass', 'pass', 'pass'] ['Leakey', ' fail', ' pass', 'pass'] ['matt', ' pass', ' pass', 'fail'] ['cathy', ' pass', 'pass', 'pass']
Запись файлов CSV с помощью CSV
Мы научились читать CSV-файл, но предположим, что хотим записать в CSV-файл; как бы мы это сделали?.
Синтаксис записи в файл останется прежним, но вместо этого мы будем использовать режим записи
with open('filename","w") as myfile: pass
Давайте запишем копию данных наших студентов в другой файл
При записи в CSV мы используем функцию записи и режим записи. writerow запишет строку данных в новую строку. Вот наши новые данные.
Чтение CSV-файла с помощью Pandas
Pandas — это модуль, который позволяет работать с табличными данными, такими как Excel и CSV. Чтобы использовать модуль pandas, нам сначала нужно установить его с помощью pip.
pip install pandas
Когда у вас есть данные в CSV, вы можете прочитать их с помощью модуля Pandas, используя .read_csv(): pandas предоставляет функцию read_csv() для чтения данных, хранящихся в виде CSV-файла.
import pandas as pd data = pd.read_csv('students.csv') print(data)
В приведенном выше коде вы используете метод .read_csv() и передаете файл в качестве аргумента. Результат будет:
students Calculus Statstics Math 0 Leakey fail pass pass 1 Harrison pass pass pass 2 matt pass pass fail 3 cathy pass pass pass
Как видите, использование pandas обеспечивает простой способ чтения CSV-файлов.
Запись в файл CSV с помощью Pandas
Чтобы записать данные в CSV с помощью pandas, мы используем Dataframes. Dataframe — это объект, который хранит данные в виде строк и столбцов.
Заключение
В этом руководстве рассмотрены концепции, необходимые для начала работы с табличными данными. Библиотека pandas — это мощный инструмент, используемый в науке о данных. Он также прост в использовании, что позволяет экономить время и ресурсы.
Наслаждайтесь чтением на носителе, Создайте учетную запись для полного доступа. Если вам понравилось читать это, вы можете наслаждаться?