Вопросы по теме 'fasta'

Эффективные методы буферизации и сканирования больших файлов в python
Описание проблемы, с которой я столкнулся, немного сложное, и я ошибусь в сторону предоставления более полной информации. Для нетерпеливых, вот самый краткий способ, которым я могу обобщить это: Каков самый быстрый (с наименьшим временем...
7676 просмотров
schedule 22.12.2023

Использование realloc для расширения буфера при чтении из файла дает сбой
Я пишу код, который должен читать файлы fasta , поэтому часть моего кода (приведена ниже) это парсер фаста. Поскольку одна последовательность может охватывать несколько строк в формате fasta, мне нужно объединить несколько последовательных строк,...
1428 просмотров
schedule 21.05.2022

разбить файл fasta и переименовать на основе первой строки
У меня есть огромный файл со следующим содержимым: имя файла: input.txt >chr1 jdlfnhl dh,ndh dnh. dhjl >chr2 dhfl dhl dh;l >chr3 shgl sgl >chr2_random dgld Мне нужно разделить этот файл таким образом, чтобы получить четыре...
9332 просмотров
schedule 15.06.2023

Как удалить первую строку из файла формата FASTA во время ввода?
Я хочу удалить первую строку во время ввода из файла FASTA, чтобы моя программа принимала в качестве входных данных только аминокислотную последовательность. Первая строка файла FASTA начинается с > и содержит «инвентарный номер»...
1472 просмотров
schedule 27.11.2022

Как найти перевернутый повторяющийся шаблон в последовательности FASTA?
Предположим, моя длинная последовательность выглядит так: 5’-AGGGTTTCCC**TGACCT**TCACTGC**AGGTCA**TGCA-3 Две подпоследовательности, выделенные курсивом (здесь внутри двух звездочек) в этой длинной последовательности вместе называются...
2197 просмотров
schedule 29.01.2023

Как извлечь последовательности fasta в файле, строка заголовка которого совпадает со списком в другом файле?
Я новичок в Perl. Я пытаюсь извлечь последовательности fasta из одного файла, которые совпадают со строками в другом файле. Два примера файлов выглядят следующим образом: Файл1.fasta: >gene_44|105_nt|+|47540|47644...
2616 просмотров
schedule 30.01.2023

fasta: удалять последовательности после длины n
У меня есть несколько файлов fasta с тысячами последовательностей в каждом файле разной длины. Я хотел бы сохранить только первые 200 (n) оснований из каждой последовательности. Как я могу сделать это в Perl?
1641 просмотров
schedule 09.12.2023

Извлечение строк и подстрок из одного файла в зависимости от информации из другого файла
У меня есть файл 1.blast с такой информацией о координатах 1 gnl|BL_ORD_ID|0 100.00 33 0 0 1 3 27620 gnl|BL_ORD_ID|0 95.65 46 2 0 1 46 35296 gnl|BL_ORD_ID|0 90.91 44 4 0...
370 просмотров
schedule 04.12.2022

Прочитать фаста-файл белка и разделить прочитанную строку на аргинин (R), а затем взорвать пептиды, чтобы получить совпадения?
У меня есть следующий файл fasta: '>gi|277456704|dbj|ID_P|Gene name LLL MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKV YRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFG...
392 просмотров

Соберите слово в одном файле и используйте это слово для сопоставления в файле FASTA, добавив последовательность FASTA в первый файл.
Я хочу найти несколько слов в файле1 и использовать каждое слово для поиска того, что следует после его совпадения в файле2.fasta. Затем я хочу добавить то, что следует за совпадением со словом, которое я использовал, в файл 03, чтобы файл 03...
302 просмотров
schedule 04.06.2023

Как удалить последовательности в формате fasta, содержащие Ns
У меня есть такой файл fasta ">ENS..._intronX acgtacgtacgtacgt ">ENS..._intronY acgtacgtNNNNa acgtacgtacgtacgt ">ENS..._intronZ acgtacgtacgtacgt acgtacgtacgtacgt Мне нужно удалить последовательности, содержащие как минимум 2 N...
1441 просмотров
schedule 10.04.2023

разделение нескольких файлов FASTA на отдельные файлы с сохранением их исходных имен
Я пытаюсь работать со сценарием AWK, который был опубликован ранее на этом форуме. Я пытаюсь разделить большой файл FASTA, содержащий несколько последовательностей ДНК, на отдельные файлы FASTA. Мне нужно разделить каждую последовательность на...
11652 просмотров
schedule 14.04.2023

Питон. Попытка отсортировать файл для 3 самых длинных последовательностей нуклеотидов гена из файла genbank в файл fasta с использованием BioPython.
Я относительно новичок в python, поэтому, пожалуйста, простите идиотизм, связанный с этим вопросом. У меня есть файл genbank, и я написал фрагмент кода, который возьмет 3 самых длинных гена и поместит их во вновь созданный файл fasta. from Bio...
610 просмотров
schedule 05.05.2023

Как перебирать файлы fasta и изменять идентификатор записи с помощью Biopython
Я не программист, и я новичок в Python, я пытаюсь научиться... Итак, у меня есть файл, содержащий 84 записи, которые выглядят так: 1 2 3 X Y MT GL000210.1 и я хотел бы изменить идентификатор записи всех последовательностей в файле fasta,...
2165 просмотров
schedule 11.11.2022

Скрипт AWK для поиска в файле fasta
У меня есть такой файл fasta: >gnl|SRA|SRR035294.8571.2 FIHSSUW01ASCWS.2 length=224 GAGATGAAATAGATCTTGGCATATATGTACATGCTTGATCTCAGTTTTGATTGGATTTTATCCATTTTAG CTATCTTAACTATTAATCTTGAAATGAAGCTTTAATTTATGTAGGAAGTTTATGAAATTTAGGAAAAAAA...
763 просмотров
schedule 28.03.2023

Получите заголовки последовательностей белков, которые начинаются с определенной аминокислоты в FASTA.
Привет, ребята, я пытался использовать PERL для печати только заголовков (вся строка> gi) белковых последовательностей, которые начинаются с «MAD» или «MAN» (первые 3 аа) из файла FASTA. Но я не мог понять, какая часть пошла не так. Заранее спасибо!...
383 просмотров
schedule 15.05.2023

Разбор GenBank в FASTA с доходностью в Python (x, y)
На данный момент я попытался определить и задокументировать свою собственную функцию для этого, но у меня возникают проблемы с тестированием кода, и я на самом деле понятия не имею, правильно ли это. Я нашел некоторые решения с помощью BioPython, re...
145 просмотров
schedule 20.11.2022

Получение последовательностей ДНК из базы данных белковых последовательностей?
У меня есть тысячи белковых последовательностей в FASTA и их инвентарные номера. Я хочу вернуться к базе данных дробовика всего генома и найти все последовательности ДНК, которые кодируют белок, идентичный одному из моих исходных последовательностей....
225 просмотров

Извлечение самой длинной последовательности из файла разделителя вкладок
У меня есть файл файла tab delim, который содержит следующую информацию >fasta >ss_23_122_0_1 MJSDHWTEZTZEWUIASUDUAISDUASADIASDIAUSIDAUSIDCASDAS >ss_23_167_0_1 WEIURIOWERWKLEJDSAJFASDGASZDTTQZWTEZQWTEZUQWEZQWTEZQTWEZTQW...
137 просмотров
schedule 25.07.2022

Как извлечь короткую последовательность на основе размера шага?
Приведенный ниже код извлекает короткую последовательность из каждой последовательности с размером окна 100. Окно сдвинется на один шаг и извлечет последовательность. Я хотел бы извлечь короткую последовательность с каждым размером шага 50....
69 просмотров