Мой регистратор GPS иногда оставляет «незавершенные» строки в конце файлов журнала. Я думаю, что они только в конце, но я хочу проверить все строки на всякий случай.
Образец полного предложения выглядит так:
$GPRMC,005727.000,A,3751.9418,S,14502.2569,E,0.00,339.17,210808,,,A*76
Строка должна начинаться со знака $
и заканчиваться знаком *
и двухсимвольной шестнадцатеричной контрольной суммой. Меня не волнует, верна ли контрольная сумма, просто она присутствует. Он также должен игнорировать предложения «ADVER», которые не имеют контрольной суммы и находятся в начале каждого файла.
Следующий код Python может работать:
import re
from path import path
nmea = re.compile("^\$.+\*[0-9A-F]{2}$")
for log in path("gpslogs").files("*.log"):
for line in log.lines():
if not nmea.match(line) and not "ADVER" in line:
print "%s\n\t%s\n" % (log, line)
Есть ли способ сделать это с помощью grep
или awk
или чего-то простого? Я так и не понял, как заставить grep
делать то, что я хочу.
Обновление: спасибо @Motti и @Paul, я смог заставить следующее сделать почти то, что хотел, но мне пришлось использовать одинарные кавычки и удалить конечный $
, прежде чем это заработает:
grep -nvE '^\$.*\*[0-9A-F]{2}' *.log | grep -v ADVER | grep -v ADPMB
Возникают еще два вопроса: как заставить его игнорировать пустые строки? И можно ли объединить два последних grep
?