У меня есть файл csv
размером 5 ГБ, импорт которого в stata занимает больше часа.
Причина, помимо прочего, в том, что он имеет европейский формат, то есть это файл, разделенный ;
, а числовые столбцы имеют ,
в качестве десятичного разделителя. Например:
V1 V2 V3
A 2,4 10,1
B 30 1,4
Проблема в том, что stata
предполагает, что числовые столбцы являются строковыми переменными, поэтому пытается импортировать их действительно неэффективным способом (попытка объявить столбцы числовыми просто дает мне пропущенные значения).
Есть ли команда/опция, в которой я ввожу другой разделитель десятичной точки, чтобы процесс импорта проходил быстрее?
Stata
, но просить о чем-либо очень бюрократический процесс. Мой вывод пока таков, что для существующих версий это невозможно сделать без изменения исходного кода для импорта файлов excel. - person Felipe Alvarenga   schedule 01.06.2018