Meine Merkliste
my.bionity.com  
Login  

Clustal



Clustal
Entwickler: Gibson T. (EMBL), Thompson J. (CNRS), Higgins D. (UCD)
Aktuelle Version: 1.83
Betriebssystem: UNIX, Linux, Mac, MS-Windows
Kategorie: Bioinformatik-Tool
Lizenz: Für akademische Benutzer kostenlos
Website: =ClustalW

Clustal ist ein weitverbreitetes Computer-Programm für Multiples Sequenzalignment. Die aktuelle Version ist 1.83. Es gibt zwei Varianten des Programms:

  • ClustalW: ein Kommandozeilenprogramm
  • ClustalX: mit grafischer Benutzeroberfläche. Das Programm ist für Windows, Mac OS und Unix/Linux verfügbar.

Man kann es vom European Bioinformatics Institute FTP-Server herunterladen.


Inhaltsverzeichnis

Eingabe / Ausgabe

Das Programm kann eine große Auswahl Eingabeformate verarbeiten, darunter NBRF/PIR, FASTA, EMBL/Swisspro, Clustal, GCC/MSF, GCG9 RSF und GDE.

Die Ausgabe kann in folgenden Formaten erfolgen: Clustal, NBRF/PIR, GCG/MSF, PHYLIP, GDE, NEXUS.

Multiples Sequenzalignment

Clustal führt drei Hauptschritte durch:

  1. Paarweises Alignment,
  2. einen Phylogenetischen Baum erstellen (oder einen benutzerdefinierten verwenden),
  3. den phylogenetischen Baum für das multiple Alignment verwenden.

Diese Schritte werden automatisch durchgeführt, wenn man Do Complete Alignment (Komplettes Alignment durchführen) auswählt. Als weitere Optionen stehen Do Alignment from guide tree (Führe Alignment anhand eines "Guide tree") und Produce guide tree only (Nur den Guide Tree erstellen).

Profil Alignments

Paarweise Alignments werden für alle und gegen alle Sequenzen berechnet; Übereinstimmungen werden in einer Matrix gespeichert. Diese wird anschließend in eine Distanzmatrix (distance matrix) konvertiert, wo der Distanzwert den evolutionären Abstand zwischen jedem Sequenzpaar widerspiegelt.

Aus dieser Distanzmatrix wird anhand eines Neighbor-Joining-Algorithmus zur Clusterbildung (Neigbor-joining clustering algorithm) ein Guide Tree oder ein phylogenetischer Baum konstruiert, der die Reihenfolge vorgibt, in der Sequenzpaare aliniiert (angeordnet) und mit vorangegangenen Alignments kombiniert werden sollen. Sequenzen werden an jedem Zweigpunkt progressiv aliniiert, wobei mit demjenigen Sequenzpaar begonnen wird, dass den geringsten Abstand aufweist.

Einstellungen

Benutzer können unter Verwendung der Standardeinstellung Sequenzen aliniieren, aber von Fall zu Fall ist es sinnvoll, eigene Parameter zu verwenden.

Die Hauptparameter sind gap opening penalty und die gap extension penalty (siehe Sequenzalignment).

Beschleunigte Version

Eine FPGA basierte Version des ClustalW Algorithmus wird von Progeniq angeboten und verzeichnet eine 20fach höhere Verarbeitungsgeschwindigkeit gegenüber der Software-Implementierung.

Quellen

  • Thompson, J.D. et al. (1997): The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. In: Nucleic Acids Research. Bd. 25, S. 4876-4882. PMID 9396791
  • Chenna, R. et al. (2003): Multiple sequence alignment with the Clustal series of programs. In: Nucleic Acid Research. Bd. 31, S. 3497-3500. PMID 12824352

Siehe auch

  • Sequenzalignment-Software
  • Align-m
  • DIALIGN-T
  • JAligner
  • MAFFT
  • MAVID
  • MUSCLE
  • ProbCons
  • T-Coffee
 
Dieser Artikel basiert auf dem Artikel Clustal aus der freien Enzyklopädie Wikipedia und steht unter der GNU-Lizenz für freie Dokumentation. In der Wikipedia ist eine Liste der Autoren verfügbar.
Ihr Bowser ist nicht aktuell. Microsoft Internet Explorer 6.0 unterstützt einige Funktionen auf ie.DE nicht.