Я не могу импортировать csv (разделенный точкой с запятой) в R. Проблема в том, что некоторые столбцы содержат текст со специальным символом (например, точкой с запятой), что приводит к неравному количеству столбцов в некоторых строках.
Специальные символы окружены квотами, например ";". Файл весит 2,3 Гб. Я могу правильно открыть этот файл в Excel (по крайней мере, его часть).
Я попробовал readr, data.table, базовый R и потерпел неудачу.
read_csv2("C:/PE_Omnibus_plik_płaski/omnibus_clean.csv")
Я мог бы сделать это в Notepad++, но предпочел бы R.
read.csv("data.csv", encoding="UTF-8", stringsAsFactors=FALSE)
, и вы можете попробоватьfileEncoding="latin1"
- person amrrs   schedule 18.08.2016readr
- person Seweryn Grodny   schedule 18.08.2016fread
изdata.table
должен помочь вам улучшить скорость - person amrrs   schedule 18.08.2016read.csv("data.csv", encoding="UTF-8", stringsAsFactors=FALSE)
работает нормально, а такжеread.csv("data.csv")
. Но ниread_csv2
, ни fread этого не делают. Странная ситуация :) - person Seweryn Grodny   schedule 18.08.2016