Heim  >  Artikel  >  System-Tutorial  >  Kann ich die HMMER-Software auf Windows-Systemen installieren?

Kann ich die HMMER-Software auf Windows-Systemen installieren?

PHPz
PHPznach vorne
2024-01-23 08:57:181618Durchsuche

Kann ich die HMMER-Software auf Windows-Systemen installieren?

Kann Hmmer-Software auf einem Windows-System installiert werden

Hmmer-Download und Installation

Für Mac OS/X-, Linux- und UNIX-Systeme kompilieren und installieren Sie aus dem Quellcode:

% wget ftp://selab.janelia.org/pub/software/hmmer3/3.0/hmmer-3.0.tar.gz % tar zxf hmmer-3.0.tar.gz % cd hmmer-3.0 % ./configure % make % Machen Sie einen Scheck

Laden Sie für Windows-Systeme das komprimierte Binärpaket direkt herunter, dekomprimieren Sie es und verwenden Sie es.

Hmmer enthaltene Programme

phmmer: Verwendet ähnlich wie Blastp eine Proteinsequenz, um eine Proteinsequenzbibliothek zu durchsuchen

>phmmer-Tutorial/HBB HUMAN uniprot sprot.fa

jackhmmer: Ähnlich wie bei psiBlast durchsuchen Proteinsequenzen iterativ Proteinsequenzbibliotheken

>Jackhmmer-Tutorial/HBB HUMAN uniprot sprot.fa

hmmbuild: Erstellen Sie ein HMM-Modell mit mehreren ausgerichteten Sequenzen

hmmsearch: Verwenden Sie das HMM-Modell, um die Sequenzbibliothek zu durchsuchen

hmmscan: HMM-Bibliothek anhand von Sequenzen durchsuchen;

hmmalign: Verwenden Sie HMM als Anhaltspunkt, um mehrere Ausrichtungssequenzen zu erstellen

>hmmalign globins4.hmm Tutorial/globins45.fa

hmmconvert: HMM-Format konvertieren

hmmemit: Erhalten Sie eine Mustersequenz aus dem HMM-Modell

hmmfetch: Rufen Sie ein HMM-Modell anhand des Namens oder der Akzeptanznummer aus der HMM-Bibliothek ab

hmmpress: Formatieren Sie die HMM-Datenbank, um die hmmscan-Suche zu erleichtern

hmmstat: Statistische Informationen der HMM-Datenbank anzeigen;

Durchsuchen Sie Sequenzdatenbanken mithilfe von HMM-Modellen

Verwenden Sie hmmbuild, um das HMM-Modell zu erstellen. Die Eingabe ist eine Multiple-Alignment-Sequenzdatei im Stockholm-Format oder FASTA-Format (z. B. Tutorial/globins4.sto). Der Befehl lautet wie folgt:

>hmmbuild globins4.hmm Tutorial/globins4.sto

globins4.hmm ist das Ausgabe-HMM-Modell

Verwenden Sie hmmsearch, um die Proteinsequenzdatenbank zu durchsuchen. Der Befehl lautet wie folgt:

>hmmsearch globins4.hmm uniprot sprot.fasta >globins4.out

globins4.out ist die Ausgabeergebnisdatei wie folgt:

*Beispiele verwenden Beispiele aus dem offiziellen Tutorial

Durchsuchen Sie die HMM-Datenbank anhand von Proteinsequenzen

Erstellen Sie eine HMM-Datenbank. Die HMM-Datenbank ist eine Datei, die mehrere HMM-Modelle enthält. Sie kann von Pfam, SMART und TIGRFams heruntergeladen oder selbst aus mehreren Ausrichtungssequenzen erstellt werden, wie zum Beispiel:

>hmmbuild globins4.hmm Tutorial/globins4.sto

>hmmbuild fn3.hmm Tutorial/fn3.sto

>hmmbuild Pkinase.hmm Tutorial/Pkinase.sto

>cat globins4.hmm fn3.hmm Pkinase.hmm >minifam

Verwenden Sie hmmpress, um die Datenbank zu formatieren, einschließlich Komprimierung und Indexerstellung. Der Befehl lautet wie folgt:

>hmmpress minifam

Dieser Schritt kann schnell abgeschlossen werden und der Ausgabeinhalt lautet wie folgt:

Arbeiten… fertig.

Gepresste und indexierte 3 HMMs (3 Namen und 2 Akzessionen).

Modelle in Binärdatei gepresst: minifam.h3m

SSI-Index für binäre Modelldatei: minifam.h3i

Profile (MSV-Teil) eingepresst in: minifam.h3f

Profile (Rest) eingedrückt in: minifam.h3p

Verwenden Sie hmmscan, um die HMM-Datenbank zu durchsuchen. Der Befehl lautet wie folgt:

>hmmscan minifam-Tutorial/7LESS_DROME

So konvertieren Sie Dateien im Fasta-Format mit der Hmmer-Software in das Sto-Format.

Ich bin auch lange auf dieses Problem gestoßen und konnte keine passende Lösung finden, also habe ich selbst eine geschrieben

import glob # sind alle Dinge aus der Standardbibliothek

Betriebssystem importieren

# Legen Sie die Fasta-Datei, die Sie erstellen möchten, hmm (im Vergleich) im selben Ordner wie dieses Programm ab und führen Sie dann dieses Programm aus, um hmmbuild direkt auszuführen

os.chdir(os.path.dirname(__file__))

fs = glob.glob('*.fasta') # Jede Fasta-Datei abrufen Wenn Ihre Fasta-Datei ein anderes Suffix als .fasta hat, können Sie es hier ändern oder direkt in „*.fa*“ ändern

für f in fs:

hmm = os.path.splitext(f)[0] + '.hmm'

stockholm = os.path.splitext(f)[0] + '.sto'

mit open(f, 'r') als fhandle: # Dies wird verwendet, um Fasta-Dateien zu lesen und alle Fasta-Dateien in der Liste zu speichern

fastas = ['>' + tmp.replace('n', 'r', 1).replace('n', '').replace('r', 'n') für tmp in tuple(filter( Keine, (fhandle.read().split('>'))))]

für mich in Reichweite(len(fastas)):

fastas[i] = fastas[i].split('n')

fastas[i][0] = fastas[i][0].split()[0][1:10]

tmp = []

für j in range(len(fastas[i][1]) // 80 + 1):

tmp.append(fastas[i][1][80 * j : 80 * j + 80])

fastas[i][1] = tmp

with open(stockholm, 'w') as out: # Die Sto-Datei wird hier geschrieben

out.write('# STOCKHOLM 1.0nn')

für j im Bereich(len(fastas[0][1]) - 1):

für mich in Reichweite(len(fastas)):

out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][j]))

out.write('n')

für mich in Reichweite(len(fastas)):

out.write('% -12s%sn' % (fastas[i][0], fastas[i][1][-1]))

out.write('//')

os.system('hmmbuild --amino %s %s' % (hmm, stockholm)) # hmmbuild läuft hier, Sie können die Parameter darin selbst ändern

Wie man sich selbst Bioinformatik beibringt

1. Beginnen Sie mit der Verwendung vorhandener Bioinformatik-Tools, Netzwerkservern usw. Wiederholen Sie Ihre Arbeit nicht, wenn Sie bereits fertige Tools verwenden können .

2. Sie sind mit Befehlszeilen-Betriebssystemen, DOS und Linux vertraut und können einfache Shells schreiben und dann in der Lage sein, Programme auf Befehlszeilenebene zu installieren und einige reguläre Prozesse auszuführen. Zu lernen, wie man Software findet und installiert, ist die wichtigste und grundlegendste Fähigkeit. Tatsächlich lassen sich viele Probleme leicht lösen, wenn Sie das richtige Softwarepaket finden.

3. Seien Sie mit einer einfachen Skriptsprache vertraut. Ich persönlich empfehle Python. Weitere Informationen finden Sie in meinem Beitrag. Kleine Skripte sind sehr nützlich, wenn keine fertigen Tools vorhanden sind oder eine Datenformatkonvertierung erforderlich ist. Allgemeine Anwendungen müssen nicht zu viel Code selbst schreiben. Wir müssen davon ausgehen, dass andere Experten möglicherweise auf die Probleme gestoßen sind, auf die wir normalerweise stoßen. Daher gibt es im Internet eine große Anzahl von Toolkits. Was weitere Programmiersprachen betrifft, kann man alles beherrschen, R, Perl usw. sind alle ähnlich.

4. Machen Sie sich mit einfachen Algorithmen und Datenstrukturen vertraut, damit Sie die internen Mechanismen vieler Programme verstehen und deren Vor- und Nachteile kennen, was auch beim Schreiben Ihrer eigenen Programme hilfreich ist. Wenn Sie die Energie haben, dann studieren Sie Statistik, maschinelles Lernen usw. .

5. Erweitern, erforschen, analysieren und entwickeln Sie Ihr eigenes biologisches Feld.

Das obige ist der detaillierte Inhalt vonKann ich die HMMER-Software auf Windows-Systemen installieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:docexcel.net. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen