Come convertire un file TXT in FASTA

Passaggio 1

Aprire il file di testo con la sequenza di proteine ​​che si desidera modificare in un programma di modifica del testo come Blocco note.

Passaggio 2

Modifica o aggiungi la riga descrittiva per seguire il formato FASTA. Ad esempio, > gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) è una riga di descrizione FASTA valida. Questa riga fornisce una descrizione univoca per la sequenza di dati che segue. Il formato FASTA richiede l'uso del simbolo maggiore di (>) in modo che il programma possa identificare le informazioni descrittive univoche ed evitare di elaborare la descrizione come una linea di dati di sequenza proteica.

Passaggio 3

Premere "Invio" per inserire un'interruzione di riga dopo aver modificato la riga descrittiva.

Passaggio 4

Modificare o aggiungere il formato della linea dati della sequenza proteica per conformarsi ai codici IUB / IUPAC standard. Lo standard IUB / IUPAC utilizza lettere dell'alfabeto per rappresentare codici accettabili o sequenze di interrogazione per amminoacidi o acidi nucleici nel formato FASTA. Ad esempio, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE rappresenta una riga di sequenza dati valida poiché inizia con la lettera "Q", che rappresenta la glutammina, e termina con la lettera "E", che rappresenta il glutammato.

Passaggio 5

Aggiungi più linee di sequenze di dati, modificando quelle esistenti o aggiungendo interruzioni di riga dopo 80 caratteri, se necessario. L'aggiunta di standard di linea e interruzioni di riga al flusso di dati FASTA garantisce che il programma segua le istruzioni relative alla glutammina, al glutammato e ad altri codici lettera. Le lettere nello standard IUB / IUPAC sono semplicemente istruzioni per il programma che elabora i dati in formato FASTA.

Passaggio 6

Fare clic su "File", selezionare e fare clic sul pulsante "Salva". Il tuo file TXT è già in formato FASTA.