Atelier Phylogénomique Prokka
From silico.biotoul.fr
m (→Visualisation des annotations) |
m (→Liens) |
||
Line 1: | Line 1: | ||
==Liens== | ==Liens== | ||
- | *[http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Prokka Atelier de Phylogénomique Prokka] | + | *retour à [http://silico.biotoul.fr/p/Atelier_Phylog%C3%A9nomique#Prokka Atelier de Phylogénomique Prokka] |
*[http://www.vicbioinformatics.com/software.prokka.shtml prokka] | *[http://www.vicbioinformatics.com/software.prokka.shtml prokka] | ||
Revision as of 09:43, 30 November 2022
Contents |
Liens
- retour à Atelier de Phylogénomique Prokka
- prokka
Introduction
Les réplicons des génomes sont annotés avec le logiciel prokka.
Question 1.1: Pourquoi pensez-vous qu'il soit nécessaire d'annoter les génomes téléchargés du NCBI? Quelles sont les annotations réalisées par Prokka? Quels sont les logiciels utilisés pour réaliser ces annotations ?
Exemple d'utilisation
Nous allons créer un répertoire pour les résultats de prokka et chercher la dernière version disponible de prokka sur le serveur.
mkdir -p ~/work/Prochlorococcus/prokka search_module prokka
srun --pty bash module load bioinfo/prokka-1.14.5 prokka /home/formation/public_html/M2_Phylogenomique/data/Prochlorococcus/DNA/Aaaa.fas --outdir ~/work/Prochlorococcus/prokka/Aaaa --compliant --addgenes --prefix Aaaa --locustag Aaaa.g --genus Prochlorococcus --species 'Prochlorococcus marinus subsp. marinus' --strain CCMP1375 --kingdom Bacteria --cpus 2
Le programme génère plusieurs fichiers pour chaque réplicon (~/work/Prochlorococcus/prokka/Aaaa), dont:
- annotation en format GenBank AaaaA01.gbk
- annotation en format gff AaaaA01.gff
- annotation en format tabulé AaaaA01.tbl
- les peptides AaaaA01.faa
- les séquences des CDS AaaaA01.ffn
Automatisation des annotations prokka sur l'ensemble des génomes
Les informations sur les génomes sont disponibles dans le fichier : species_strain_names.txt. Ce fichier est lu par le script Perl prokka_loop.pl pour compléter les paramètres de prokka pour chaque génome (--prefix, --locustag, --genus, --species, --strain and --kingdom).
Le script prokka_loop.pl doit être lancé sur le serveur genologin. Il distribue prokka sur les noeuds avec sbatch.
cd ~/work/Prochlorococcus ~/work/scripts/prokka_loop.pl --sample Prochlorococcus squeue -l -u $USER
Une fois les jobs terminés, vérifiez que les fichiers de sortie de prokka existent et ne sont pas vides.
ls -l ~/work/Prochlorococcus/prokka/Aaa*/*.faa
Les fichiers avec le suffixe .err renferment la sortie standard de prokka. Si tout s'est bien passé, vous pouvez supprimer les fichiers .err et .sh.
Question 1.2: Comparez le nombre de gènes obtenus avec ceux reportés dans la publication (Table 1) et commentez les différences observées. Comment faire pour comparer les annotations de prokka avec celles des fichiers GenBank? Pensez-vous que prokka soit la meilleure méthode d'annotation? Comment pourriez-vous faire pour évaluer les performances des différentes méthodes d'annotation des génomes?
Visualisation des annotations
Nous pouvons utiliser le logiciel art (Artemis) pour visualiser les annotations des génomes:
Il est fortement recommandé d'utiliser ce logiciel en local sur votre poste de travail.