У меня есть тысячи белковых последовательностей в FASTA и их инвентарные номера. Я хочу вернуться к базе данных дробовика всего генома и найти все последовательности ДНК, которые кодируют белок, идентичный одному из моих исходных последовательностей.
Я пытался запустить tBlastn с ‹10 результатами для каждой последовательности, 1 на запрос и e-значением ниже 1e-100 или с e-значением, равным нулю, и я не получаю никаких результатов. Я хотел бы автоматизировать весь этот процесс.
Можно ли это сделать, запустив blast из командной строки и пакетного сценария?