Поскольку я не могу предоставить файл .txt, который я использую, я могу только описать ситуацию...
Текстовый файл не имеет пропущенных значений и представляет собой текстовый файл, разделенный табуляцией, или, по крайней мере, так кажется. Когда я использую разделитель, разделенный табуляцией, кажется, что все в порядке. Заголовки столбцов снабжены именами, содержащими пробелы (например, Возраст родителя).
Когда я загружаю данные, используя следующую строку кода, все выглядит правильно. Однако я получаю кучу повторяющихся столбцов.
Например, «Возраст родителя» будет переименован в Age.of.Parent, поскольку в именах столбцов не может быть пробелов, но есть будет второй столбец, который идентичен значениям, но имеет имя - Age.of.Parent1
Вопрос. Что мне нужно сделать, чтобы убедиться, что ни один из этих столбцов "Повторяющихся" не создается? Столбца Age.of.Parent1 явно нет в наборе данных, но из, может быть, 20 столбцов я получаю в общей сложности 30 (10 новых дубликатов с этой «1» в конце).
read.table('mydata.txt', header=TRUE, stringsAsFactors= FALSE, sep='\t')
check.names = FALSE
вread.table
, но что касается проблемы с повторяющимся столбцом, без воспроизводимого примера неясно. - person akrun   schedule 29.12.2016read.table
. Вероятно, вам придется внимательно изучить исходный файл, по крайней мере, те строки, где дополнительные столбцы содержат данные. Возможными ловушками могут быть дублированные вкладки\t\t
или удаленный конец строки. Однако без показа данных хотя бы верхних строк) это все спекулятивно. - person Uwe   schedule 30.12.2016