У меня есть файл pcap с 8 миллионами пакетов, который я сократил до файла txt всего с тремя полями: время (в секундах), IP-адрес источника, тип (трафика).
Мне нужно извлечь из этого файла из 8 миллионов строк только те IP-адреса, которые имеют 100 или более пакетов, исключив те адреса, которые не соответствуют критериям в 100 или более пакетов, уменьшив размер файла.
Но мне нужно сохранить все 3 поля и все пакеты в потоке остальных адресов (более 100 пакетов) в сокращенном текстовом файле, потому что мне нужно рассчитать продолжительность потока пакетов для каждого исходного IP-адреса (время окончания потока - время начала потока) и оставить только те IP-адреса источника, продолжительность потока которых составляет 60 секунд и более, тем самым еще больше уменьшив мой файл.
Когда я использовал инструменты командной строки для выполнения первого критерия (100 пакетов и более), я устранял весь поток пакетов для этих адресов. Как я могу достичь этих двух условий с помощью инструментов командной строки, чтобы иметь возможность автоматизировать процесс с помощью сценария bash? Ниже приведен пример моего файла, к которому мне нужно применить два критерия. Большое спасибо за Вашу помощь!
1385957611.118522 99.61.34.145 TCP 1385957859.425248 99.61.34.145 TCP 1385958784.632631 99.61.34.145 TCP 1385959038.972602 99.61.34.145 TCP 1385959481.571627 99.61.34.145 TCP 1385860339.225421 37.139.6.111 TCP 1385860339.238402 37.139.6.111 TCP 1385860339.286538 37.139.6.111 TCP 1385860339.379029 37.139.6.111 TCP 1385860339.380669 37.139.6.111 TCP 1385860339.425247 37.139.6.111 TCP 1385860339.556737 37.139.6.111 TCP 1385860339.583913 37.139.6.111 TCP 1385860339.623861 37.139.6.111 TCP 1385857840.419300 103.248.63.253 TCP 1385857841.739372 103.248.63.253 TCP 1385857848.593171 103.248.63.253 TCP 1385857850.411457 103.248.63.253 TCP