Я делаю некоторую обработку текста в системе unix. У меня есть доступ к командной строке на этой машине, и на ней установлены Python, Perl и программы обработки текста по умолчанию, awk и т. д.
У меня есть текстовый файл, который выглядит следующим образом:
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
2895635937120524206
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009
В основном это 3 строки: ID ID Дата
Я хочу удалить все строки, в которых нет двух идентификаторов и даты. Таким образом, итоговые результаты будут такими:
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009
Ребята, как бы вы предложили это сделать? Всего текстовый файл содержит около 30 000 строк.
Ваше здоровье
Эф