Прочитать фаста-файл белка и разделить прочитанную строку на аргинин (R), а затем взорвать пептиды, чтобы получить совпадения?

У меня есть следующий файл fasta:

'>gi|277456704|dbj|ID_P|Gene name LLL
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKV
YRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFG
EVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLEL
MAGGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKI
GDFGMARDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEV
LEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEE

'>gi|27704|dbj|ID_Y|Gene name JJJ
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG
SELRGGYGDPGRLPVGSGLCSASRARLPGHVAADHPPAVYRRKHQELQAMQMELQSPEYKLSKLRTSTIM
TDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQ
DELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLHV
ARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGCAMLPVKWMPPE

'>gi|2097704|dbj|ID_X|Gene name X
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG
QPSPRAVIPMSCITNGSGANRKPSHTSAVSIAGKETLSSAAKSGTEKKKEKPQGQREKKEESHSNDQSPQ
IRASPSPQPSSQPLQIHRQTPESKNATPTKSIKRPSPAEKSHNSWENSDDSRNKLSKIPSTPKLIPKVTK
TADKHKDVIINQEGEYIKMFMRGRPITMFIPSDVDNYDDIRTELPPEKLKLEWAYGYRGKDCRANVYLLP
TGEIVYFIASVVVLFNYEERTQRHYLGHTDCVKCLAIHPDKIRIATGQIAGVDKDGRPLQPHVRVWDSVT
LSTLQIIGLGTFERGVGCLDFSKADSGVHLCVIDDSNEHMLTVWDWQRKAKGAEIKTTNEVVLAVEFHPT

Я хотел бы пройти через FASTA, разделить последовательность белка на все 'R', с которыми он сталкивается, это будет генерировать пептиды, а затем взрывать пептиды. Получите результаты от blastp и сохраните результаты blastp в отдельном файле для каждого идентификатора белка в файле fasta. Я не придаю особого значения тому, какой язык используется. Я хочу узнать, как это можно сделать, чтобы я мог создать больше функциональности поверх этого. Спасибо!


person RnD    schedule 07.06.2013    source источник
comment
вы также можете спросить biostars.org   -  person Pierre    schedule 08.06.2013
comment
@Pierre: Спасибо за рекомендацию biostars, но мне неудобно размещать сообщения на этом сайте, так как модераторы слишком грубы и либо отрицают вопрос, либо закрывают его.   -  person RnD    schedule 08.06.2013
comment
ваш комментарий обсуждался здесь: biostars.org/p/73956   -  person Pierre    schedule 10.06.2013
comment
@Pierre Это здорово! Спасибо вам за это. Просто посмотрите на простой ответ, который был дан мне ниже, который направил меня к поиску решения. Не совсем тот тип ответа, где первым вопросом является то, что вы сделали!   -  person RnD    schedule 11.06.2013


Ответы (1)