Maison  >  Article  >  Tutoriel système  >  Puis-je installer le logiciel HMMER sur les systèmes Windows ?

Puis-je installer le logiciel HMMER sur les systèmes Windows ?

PHPz
PHPzavant
2024-01-23 08:57:181531parcourir

Puis-je installer le logiciel HMMER sur les systèmes Windows ?

Le logiciel hmmer peut-il être installé sur le système Windows

hmmer téléchargement et installation

Pour les systèmes Mac OS/X, Linux, UNIX, compilez et installez à partir du code source :

% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % fais vérifier

Pour le système Windows, téléchargez directement le package binaire compressé, décompressez-le et utilisez-le.

Hmmer programmes inclus

phmmer : similaire à Blastp, utilise une séquence protéique pour rechercher une bibliothèque de séquences protéiques

 ;

>tutoriel phmmer/HBB HUMAN uniprot sprot.fa

jackhmmer : Semblable à psiBlast, les séquences protéiques recherchent de manière itérative les bibliothèques de séquences protéiques

 ;

>tutoriel jackhmmer/HBB HUMAN uniprot sprot.fa

hmmbuild : créez un modèle HMM en utilisant plusieurs séquences alignées

 ;

hmmsearch : utilisez le modèle HMM pour rechercher la bibliothèque de séquences ;

hmmscan : recherchez la bibliothèque HMM à l'aide de séquences ;

hmmalign : utilisez HMM comme indice pour construire plusieurs séquences d'alignement

 ;

>tutoriel hmmalign globins4.hmm/globins45.fa

hmmconvert : Convertir le format HMM

hmmemit : Obtenez une séquence de motifs à partir du modèle HMM

 ;

hmmfetch : récupérez un modèle HMM de la bibliothèque HMM par nom ou numéro d'acceptation

 ;

hmmpress : formatez la base de données HMM pour faciliter la recherche hmmscan ;

hmmstat : Afficher les informations statistiques de la base de données HMM ;

Rechercher des bases de données de séquences à l'aide de modèles HMM

Utilisez hmmbuild pour construire le modèle HMM, saisissez un fichier de séquence d'alignement multiple au format Stockholm ou FASTA (tel que : tutoriel/globins4.sto), la commande est la suivante :

>hmmbuild globins4.hmm tutoriel/globins4.sto

globins4.hmm est le modèle HMM de sortie

Utilisez hmmsearch pour rechercher la base de données de séquences protéiques. La base de données de séquences protéiques est au format FASTA. La commande est la suivante :

>hmmsearch globins4.hmm uniprot sprot.fasta >globins4.out

globins4.out est le fichier de résultat de sortie, comme suit :

*Les exemples utilisent des exemples du tutoriel officiel

Recherchez dans la base de données HMM à l'aide de séquences protéiques

Créez une base de données HMM. La base de données HMM est un fichier contenant plusieurs modèles HMM. Elle peut être téléchargée depuis Pfam, SMART et TIGRFams, ou elle peut être créée par vous-même à partir de plusieurs séquences d'alignement, telles que :

>hmmbuild globins4.hmm tutoriel/globins4.sto

>hmmbuild fn3.hmm tutoriel/fn3.sto

>Tutoriel hmmbuild Pkinase.hmm/Pkinase.sto

>cat globins4.hmm fn3.hmm Pkinase.hmm >minifam

Utilisez hmmpress pour formater la base de données, y compris la compression et la création d'index. La commande est la suivante :

>hmmpress minifam

Cette étape peut être complétée rapidement et le contenu de sortie est le suivant :

Travail… terminé.

Pressé et indexé 3 HMM (3 noms et 2 accessions).

Modèles compressés dans un fichier binaire : minifam.h3m

Index SSI pour le fichier de modèle binaire : minifam.h3i

Profils (partie MSV) insérés dans : minifam.h3f

Profils (reste) insérés dans : minifam.h3p

Utilisez hmmscan pour rechercher dans la base de données HMM, la commande est la suivante :

>Tutoriel hmmscan minifam/7LESS_DROME

Comment convertir des fichiers au format fasta au format sto à l'aide du logiciel hmmer

J'ai également rencontré ce problème. J'ai cherché en ligne pendant longtemps et je n'ai pas trouvé de solution appropriée, j'en ai donc écrit une moi-même. Le code est le suivant

.

import glob # sont tous des éléments de la bibliothèque standard

importer os

# Mettez le fichier fasta que vous souhaitez construire hmm (celui comparé) et ce programme dans le même dossier, puis exécutez ce programme pour exécuter directement hmmbuild

os.chdir(os.path.dirname(__file__))

fs = glob.glob('*.fasta') # Obtenez chaque fichier fasta Si votre fichier fasta a un suffixe autre que .fasta, vous pouvez le modifier ici, ou le changer directement en '*.fa*'

pour f dans fs :

hmm = os.path.splitext(f)[0] + '.hmm'

stockholm = os.path.splitext(f)[0] + '.sto'

avec open(f, 'r') comme fhandle : # Ceci est utilisé pour lire les fichiers fasta et enregistrer tous les fichiers fasta dans la liste

fastas = ['>' + tmp.replace('n', 'r', 1).replace('n', '').replace('r', 'n') pour tmp dans tuple(filter( Aucun, (fhandle.read().split('>'))))]

pour moi à portée(len(fastas)):

fastas[i] = fastas[i].split('n')

fastas[i][0] = fastas[i][0].split()[0][1:10]

tmp = []

for j in range(len(fastas[i][1]) // 80 + 1):

tmp.append(fastas[i][1][80 * j : 80 * j + 80])

fastas[i][1] = tmp

avec open(stockholm, 'w') comme out : # Le fichier sto est en cours d'écriture ici

out.write('#STOCKHOLM 1.0nn')

for j in range(len(fastas[0][1]) - 1):

pour moi à portée(len(fastas)):

out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][j]))

out.write('n')

pour moi à portée(len(fastas)):

out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][-1]))

out.write('//')

os.system('hmmbuild --amino %s %s' % (hmm, stockholm)) # hmmbuild est en cours d'exécution ici, vous pouvez modifier les paramètres à l'intérieur par vous-même

Comment apprendre la bioinformatique

1. Commencez avec les outils bioinformatiques existants. Familiarisez-vous avec la façon d'utiliser les logiciels, les serveurs de réseau, les bases de données, etc. existants pour servir la recherche biologique. Ne répétez pas le travail si vous pouvez utiliser des outils prêts à l'emploi. .

2. Familier avec les systèmes d'exploitation en ligne de commande, DOS, Linux, et peut écrire des shells simples, puis être capable d'installer des programmes au niveau de la ligne de commande et d'exécuter certains processus réguliers. Apprendre à trouver et installer des logiciels est la compétence la plus importante et la plus fondamentale. En fait, de nombreux problèmes peuvent être facilement résolus si vous trouvez le bon logiciel.

3. Familiarisez-vous avec un langage de script simple. Je recommande personnellement d'utiliser Python. Pour des raisons spécifiques, veuillez consulter mon article. Les petits scripts sont très utiles lorsqu'il n'existe pas d'outils prêts à l'emploi ou lorsqu'une conversion de format de données est requise. Les applications générales n'ont pas besoin d'écrire trop de code par elles-mêmes. Il faut croire que d'autres experts ont peut-être rencontré les problèmes que nous rencontrons habituellement, il existe donc un grand nombre de boîtes à outils sur Internet. Quant aux autres langages de programmation, on peut tout maîtriser, R, Perl, etc. sont tous similaires.

4. Familiarisez-vous avec des algorithmes et des structures de données simples, afin de pouvoir comprendre les mécanismes internes de nombreux programmes, puis connaître leurs avantages et leurs inconvénients, ce qui vous sera également utile pour écrire vos propres programmes. Si vous en avez l'énergie, étudiez les statistiques, l'apprentissage automatique, etc. .

5. Développez, recherchez, analysez et développez dans votre propre domaine biologique.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer