Узнайте, как управлять файлами CSV с помощью Pandas и библиотеки CSV.

CSV-файл — это обычный текстовый файл, содержащий строки и столбцы. Строки в CSV-файле разделяются новой строкой, а столбцы — запятыми.

CSV обеспечивают простой способ хранения данных и обычно используются для экспорта табличных данных на многих веб-сайтах.

Простой CSV-файл

Давайте напишем CSV-файл, содержащий данные учащихся, как показано ниже.

student, calculus,statistics,math
Harrison,pass,pass,pass
Leakey, fail, pass,pass
matt, pass, pass,fail
cathy, pass,pass,pass

CSV-библиотека Python

Python предоставляет несколько способов чтения и записи файлов CSV. В этом руководстве мы будем использовать модуль CSV и библиотеку pandas для чтения и записи данных в файлы CSV.

Чтение CSV-файла

Начнем с создания 2 файлов, а именно

  • студенты.txt
  • студенты.py

Далее введите следующие данные в файл student.txt

student, calculus,statistics,math
Harrison,pass,pass,pass
Leakey, fail, pass,pass
matt, pass, pass,fail
cathy, pass,pass,pass

Теперь откройте файлы student.py и начните с импорта модуля CSV.

import csv
with open('students.txt') as my_file:
    reader = csv.reader(my_file, delimiter =',')
        for row in reader:
            print(row)

Файловая функция open() используется для открытия файла Python и поддерживает 3 режима работы с файлами.

  • Режим чтения -r
  • Режим записи -w
  • Режим добавления -a

csv.reader считывает содержимое файла, перебирая каждую строку в CSV-файле. Затем мы получаем каждую строку и печатаем содержимое. разделитель указывает, какой символ используется для разделения полей, и в нашем случае это запятая
Результатом будет;

['student', ' calculus', 'statistics', 'math']
['Harrison', 'pass', 'pass', 'pass']
['Leakey', ' fail', ' pass', 'pass']
['matt', ' pass', ' pass', 'fail']
['cathy', ' pass', 'pass', 'pass']

Запись файлов CSV с помощью CSV

Мы научились читать CSV-файл, но предположим, что хотим записать в CSV-файл; как бы мы это сделали?.
Синтаксис записи в файл останется прежним, но вместо этого мы будем использовать режим записи

with open('filename","w") as myfile:
    pass

Давайте запишем копию данных наших студентов в другой файл

При записи в CSV мы используем функцию записи и режим записи. writerow запишет строку данных в новую строку. Вот наши новые данные.

Чтение CSV-файла с помощью Pandas

Pandas — это модуль, который позволяет работать с табличными данными, такими как Excel и CSV. Чтобы использовать модуль pandas, нам сначала нужно установить его с помощью pip.

pip install pandas

Когда у вас есть данные в CSV, вы можете прочитать их с помощью модуля Pandas, используя .read_csv(): pandas предоставляет функцию read_csv() для чтения данных, хранящихся в виде CSV-файла.

import pandas as pd
data = pd.read_csv('students.csv')
print(data)

В приведенном выше коде вы используете метод .read_csv() и передаете файл в качестве аргумента. Результат будет:

students Calculus Statstics  Math
0    Leakey     fail      pass  pass
1  Harrison     pass      pass  pass
2      matt     pass      pass  fail
3     cathy     pass      pass  pass

Как видите, использование pandas обеспечивает простой способ чтения CSV-файлов.

Запись в файл CSV с помощью Pandas

Чтобы записать данные в CSV с помощью pandas, мы используем Dataframes. Dataframe — это объект, который хранит данные в виде строк и столбцов.

Заключение

В этом руководстве рассмотрены концепции, необходимые для начала работы с табличными данными. Библиотека pandas — это мощный инструмент, используемый в науке о данных. Он также прост в использовании, что позволяет экономить время и ресурсы.

Наслаждайтесь чтением на носителе, Создайте учетную запись для полного доступа. Если вам понравилось читать это, вы можете наслаждаться?