У меня есть простой файл tsv
со следующей структурой:
0 - headerline
1 - empty line
2 - PIG schema
3 - empty line
4 - 1-st line of DATA
5 - 2-nd line of DATA
Я хотел бы прочитать это, возможно, используя readr::read_tsv
, но вот проблема.
Как видите, первая строка содержит заголовки. Затем у меня есть три строки, которые я НЕ хочу читать (они содержат очень странные данные, поступающие от Apache PIG), и в строке 4 начинаются данные. В Pandas
я бы сделал что-то вроде
df = pd.read_csv('/localpath/data.tsv', sep='\t', skiprows=[1,2,3])
что позволяет мне читать заголовки И и пропускать первую, вторую, третью строки.
Я не вижу подобного варианта в readr::read_tsv
. То есть :
df = read_tsv('/localpath/data.tsv', col_names = TRUE, skip = 4)
который не анализирует заголовки...
Любые идеи?
read.table
? - person rawr   schedule 17.11.2016skip
- person rawr   schedule 17.11.2016skip
не разрешает список или строки?skip integer: the number of lines of the data file to skip before beginning to read data.
- person ℕʘʘḆḽḘ   schedule 17.11.2016