Auf Schatzsuche im Datenchaos

Erstmals auch öffentlich zugängliche Proteom-Daten automatisch analysieren

13.01.2015 - Deutschland

Gemeinsam mit Kollegen aus Belgien und Norwegen haben Wissenschaftler des Leibniz-Instituts für Analytische Wissenschaften (ISAS) in Dortmund womöglich ein großes Problem der modernen Lebenswissenschaften gelöst: die automatisierte Analyse großer Mengen von Proteom-Rohdaten, die oft ungenutzt in öffentlichen Datenbanken schlummern. Solche Daten genauer zu untersuchen, war bislang extrem kompliziert: zu viele Dateiformate, zu große Datenmengen. Eine neue Software, die die Wissenschaftler in der aktuellen Ausgabe des Journals "Nature Biotechnology" vorstellen, kann die Daten automatisch in ein einheitliches Format umwandeln und auch gleich auswerten. Sie soll Forschern helfen, ungeahnte Schätze in den Datenbanken zu heben.

Gerade die so genannten Omics-Forschungsfelder produzieren mittels Hochdurchsatz-Techniken riesige Datenberge. Eine der wichtigsten Analysemethoden, vor allem im Bereich Proteomics, ist die Massenspektrometrie (MS): Sie wird genutzt, um aus großen Ansammlungen von Biomolekülen, etwa Zellen oder Geweben, die einzelnen Komponenten sowie deren Menge und Veränderungen zu ermitteln. Mittels Massenspektrometrie lassen sich die unterschiedlichen Bestandteile eines Gemisches nach ihrer Masse trennen, und das erlaubt wiederum eine Aussage über deren Konzentration und Zusammensetzung.

Dabei kommt es allerdings zu der paradoxen Situation, dass Wissenschaftler zwar unzählige Proben gleichzeitig analysieren, die entstehenden Daten aber oft nicht vollständig auswerten können. Um anderen Kollegen die Möglichkeit zu erneuten und weitergehenden Analysen (so genannten Re-Analysen) zu geben, werden die experimentellen Ergebnisse solcher Studien in der Regel auf Datenbanken wie "PRIDE" (PRoteomics IDEntifications database) hochgeladen. Diese öffentlich zugänglichen "Repositories" machen die Forschung transparent und vereinfachen den wissenschaftlichen Selbstregelungsprozess, bei dem Forschungsergebnisse und Studien von außenstehenden Wissenschaftlern geprüft und beurteilt werden – zumindest theoretisch. In der Praxis bleiben die Daten oft ungenutzt, und ihr Potenzial wird nicht erkannt.

Marc Vaudel, der am ISAS und am VIB Gent promoviert hat, glaubt, diese Lücke nun schließen zu können. Gemeinsam mit seinen Kollegen vom ISAS, dem VIB sowie der Universitäten in Gent und Bergen hat er das Programm "PeptideShaker" entwickelt. Ursprünglich sollte die Software nur dazu dienen, die eigenen riesigen Datenmengen in den Griff zu bekommen, erklärt Dr. René Zahedi, der am ISAS die Arbeitsgruppe Systemanalyse leitet: "Als wir etwa im Jahr 2009 angefangen haben, "Peptide Shaker" zu entwickeln, gab es nämlich noch keine andere Software zur qualitativ hochwertigen Analyse unserer vergleichsweise großen Datenmengen." Bald jedoch wurde den Wissenschaftlern bewusst, dass sie mit "Peptide Shaker" eine Möglichkeit geschaffen hatten, auch Daten aus den öffentlichen Proteom-Datenbanken automatisch zu verwerten. Damit wird erstmals der gesamte Datenzyklus der Proteomanalyse abgedeckt.

Die Software nutzt nicht wie andere Programme nur einen Algorithmus, sondern gleich mehrere, so dass die von ihr erstellten Interpretationen und grafischen Auswertungen genauer und zuverlässiger werden. Im Gegensatz zu vielen anderen frei verfügbaren Programmen in diesem Bereich, so Zahedi, sei "PeptideShaker" außerdem "wesentlich nutzerfreundlicher und leichter zu bedienen."

Originalveröffentlichung

Weitere News aus dem Ressort Wissenschaft

Meistgelesene News

Weitere News von unseren anderen Portalen

Kampf gegen Krebs: Neueste Entwicklungen und Fortschritte