У меня возникли проблемы с получением правильного индекса времени для моего кадра данных pandas.
import pandas as pd
from datetime import strptime
import numpy as np
stockdata = pd.read_csv("/home/stff/symbol_2012-02.csv", parse_dates =[[0,1,2]])
stockdata.columns = ['date_time','ticker','exch','salcond','vol','price','stopstockind','corrind','seqnum','source','trf','symroot','symsuffix']
Я думаю, проблема в том, что время появляется в первых трех столбцах: год/месяц/дата, час/минута/секунда, миллисекунда. Кроме того, столбец час/минута/секунда отбрасывает первый ноль, если до полудня.
print(stockdata['date_time'][0])
20120201 41206 300
print(stockdata['date_time'][50000])
20120201 151117 770
В идеале я хотел бы определить свою собственную функцию, которую можно было бы вызывать с помощью аргумента преобразователя в функции read_csv.