Вопросы по теме 'fasta'
Эффективные методы буферизации и сканирования больших файлов в python
Описание проблемы, с которой я столкнулся, немного сложное, и я ошибусь в сторону предоставления более полной информации. Для нетерпеливых, вот самый краткий способ, которым я могу обобщить это:
Каков самый быстрый (с наименьшим временем...
7676 просмотров
schedule
22.12.2023
Использование realloc для расширения буфера при чтении из файла дает сбой
Я пишу код, который должен читать файлы fasta , поэтому часть моего кода (приведена ниже) это парсер фаста. Поскольку одна последовательность может охватывать несколько строк в формате fasta, мне нужно объединить несколько последовательных строк,...
1428 просмотров
schedule
21.05.2022
разбить файл fasta и переименовать на основе первой строки
У меня есть огромный файл со следующим содержимым:
имя файла: input.txt
>chr1
jdlfnhl
dh,ndh
dnh.
dhjl
>chr2
dhfl
dhl
dh;l
>chr3
shgl
sgl
>chr2_random
dgld
Мне нужно разделить этот файл таким образом, чтобы получить четыре...
9332 просмотров
schedule
15.06.2023
Как удалить первую строку из файла формата FASTA во время ввода?
Я хочу удалить первую строку во время ввода из файла FASTA, чтобы моя программа принимала в качестве входных данных только аминокислотную последовательность.
Первая строка файла FASTA начинается с > и содержит «инвентарный номер»...
1472 просмотров
schedule
27.11.2022
Как найти перевернутый повторяющийся шаблон в последовательности FASTA?
Предположим, моя длинная последовательность выглядит так:
5’-AGGGTTTCCC**TGACCT**TCACTGC**AGGTCA**TGCA-3
Две подпоследовательности, выделенные курсивом (здесь внутри двух звездочек) в этой длинной последовательности вместе называются...
2197 просмотров
schedule
29.01.2023
Как извлечь последовательности fasta в файле, строка заголовка которого совпадает со списком в другом файле?
Я новичок в Perl. Я пытаюсь извлечь последовательности fasta из одного файла, которые совпадают со строками в другом файле. Два примера файлов выглядят следующим образом:
Файл1.fasta:
>gene_44|105_nt|+|47540|47644...
2616 просмотров
schedule
30.01.2023
fasta: удалять последовательности после длины n
У меня есть несколько файлов fasta с тысячами последовательностей в каждом файле разной длины. Я хотел бы сохранить только первые 200 (n) оснований из каждой последовательности. Как я могу сделать это в Perl?
1641 просмотров
schedule
09.12.2023
Извлечение строк и подстрок из одного файла в зависимости от информации из другого файла
У меня есть файл 1.blast с такой информацией о координатах
1 gnl|BL_ORD_ID|0 100.00 33 0 0 1 3
27620 gnl|BL_ORD_ID|0 95.65 46 2 0 1 46
35296 gnl|BL_ORD_ID|0 90.91 44 4 0...
370 просмотров
schedule
04.12.2022
Прочитать фаста-файл белка и разделить прочитанную строку на аргинин (R), а затем взорвать пептиды, чтобы получить совпадения?
У меня есть следующий файл fasta:
'>gi|277456704|dbj|ID_P|Gene name LLL
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKV
YRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFG...
392 просмотров
schedule
13.03.2023
Соберите слово в одном файле и используйте это слово для сопоставления в файле FASTA, добавив последовательность FASTA в первый файл.
Я хочу найти несколько слов в файле1 и использовать каждое слово для поиска того, что следует после его совпадения в файле2.fasta. Затем я хочу добавить то, что следует за совпадением со словом, которое я использовал, в файл 03, чтобы файл 03...
302 просмотров
schedule
04.06.2023
Как удалить последовательности в формате fasta, содержащие Ns
У меня есть такой файл fasta
">ENS..._intronX
acgtacgtacgtacgt
">ENS..._intronY
acgtacgtNNNNa
acgtacgtacgtacgt
">ENS..._intronZ
acgtacgtacgtacgt
acgtacgtacgtacgt
Мне нужно удалить последовательности, содержащие как минимум 2 N...
1441 просмотров
schedule
10.04.2023
разделение нескольких файлов FASTA на отдельные файлы с сохранением их исходных имен
Я пытаюсь работать со сценарием AWK, который был опубликован ранее на этом форуме. Я пытаюсь разделить большой файл FASTA, содержащий несколько последовательностей ДНК, на отдельные файлы FASTA. Мне нужно разделить каждую последовательность на...
11652 просмотров
schedule
14.04.2023
Питон. Попытка отсортировать файл для 3 самых длинных последовательностей нуклеотидов гена из файла genbank в файл fasta с использованием BioPython.
Я относительно новичок в python, поэтому, пожалуйста, простите идиотизм, связанный с этим вопросом. У меня есть файл genbank, и я написал фрагмент кода, который возьмет 3 самых длинных гена и поместит их во вновь созданный файл fasta.
from Bio...
610 просмотров
schedule
05.05.2023
Как перебирать файлы fasta и изменять идентификатор записи с помощью Biopython
Я не программист, и я новичок в Python, я пытаюсь научиться... Итак, у меня есть файл, содержащий 84 записи, которые выглядят так:
1
2
3
X
Y
MT
GL000210.1
и я хотел бы изменить идентификатор записи всех последовательностей в файле fasta,...
2165 просмотров
schedule
11.11.2022
Скрипт AWK для поиска в файле fasta
У меня есть такой файл fasta:
>gnl|SRA|SRR035294.8571.2 FIHSSUW01ASCWS.2 length=224
GAGATGAAATAGATCTTGGCATATATGTACATGCTTGATCTCAGTTTTGATTGGATTTTATCCATTTTAG
CTATCTTAACTATTAATCTTGAAATGAAGCTTTAATTTATGTAGGAAGTTTATGAAATTTAGGAAAAAAA...
763 просмотров
schedule
28.03.2023
Получите заголовки последовательностей белков, которые начинаются с определенной аминокислоты в FASTA.
Привет, ребята, я пытался использовать PERL для печати только заголовков (вся строка> gi) белковых последовательностей, которые начинаются с «MAD» или «MAN» (первые 3 аа) из файла FASTA. Но я не мог понять, какая часть пошла не так. Заранее спасибо!...
383 просмотров
schedule
15.05.2023
Разбор GenBank в FASTA с доходностью в Python (x, y)
На данный момент я попытался определить и задокументировать свою собственную функцию для этого, но у меня возникают проблемы с тестированием кода, и я на самом деле понятия не имею, правильно ли это. Я нашел некоторые решения с помощью BioPython, re...
145 просмотров
schedule
20.11.2022
Получение последовательностей ДНК из базы данных белковых последовательностей?
У меня есть тысячи белковых последовательностей в FASTA и их инвентарные номера. Я хочу вернуться к базе данных дробовика всего генома и найти все последовательности ДНК, которые кодируют белок, идентичный одному из моих исходных последовательностей....
225 просмотров
schedule
15.03.2024
Извлечение самой длинной последовательности из файла разделителя вкладок
У меня есть файл файла tab delim, который содержит следующую информацию
>fasta
>ss_23_122_0_1
MJSDHWTEZTZEWUIASUDUAISDUASADIASDIAUSIDAUSIDCASDAS
>ss_23_167_0_1
WEIURIOWERWKLEJDSAJFASDGASZDTTQZWTEZQWTEZUQWEZQWTEZQTWEZTQW...
137 просмотров
schedule
25.07.2022
Как извлечь короткую последовательность на основе размера шага?
Приведенный ниже код извлекает короткую последовательность из каждой последовательности с размером окна 100. Окно сдвинется на один шаг и извлечет последовательность. Я хотел бы извлечь короткую последовательность с каждым размером шага 50....
69 просмотров
schedule
03.02.2024