gff_to_genbank.py

09/12/2014 15:16

Ce script écrit en python permet de créer un fichier en fomat GenBank à partir d'un fichier de séquences fasta et un fichier tabulé GFF.

Très utile si vous souhaitez soumettre vos séquences à GenBank.

 

"""Convert a GFF and associated FASTA file into GenBank format.

Usage:
gff_to_genbank.py
"""
import sys
import os

from Bio import SeqIO
from Bio.Alphabet import generic_dna
from BCBio import GFF

def main(gff_file, fasta_file):
    out_file = "%s.gb" % os.path.splitext(gff_file)[0]
    fasta_input = SeqIO.to_dict(SeqIO.parse(fasta_file, "fasta", generic_dna))
    gff_iter = GFF.parse(gff_file, fasta_input)
    SeqIO.write(gff_iter, out_file, "genbank")

if __name__ == "__main__":
    main(*sys.argv[1:])