Klarheit in der genetischen Buchstabensuppe

Neue Algorithmen finden funktionale Nahtstellen in Genen besonders verlässlich. Sie entstanden in einer mit dem Hugo-Geiger-Preis ausgezeichneten Diplomarbeit.

24.10.2003

... AGTTAGCTCATCT... Haben Sie etwas Sinnvolles entdeckt? Wer jetzt nur TAG sagt, hat die englische Katze CAT übersehen. Natürlich suchen Genetiker und Bioinformatiker im Erbgut nicht nach bekannten Begriffen. Doch verraten sich interessante Stellen im ACGT-Alphabet des Lebens durch bestimmte Abfolgen der Buchstaben, die für die vier im DNA-Strang vorkommenden Basen stehen. Besonders interessant sind Spleißstellen, denn sie markieren Anfänge und Enden von Genabschnitten - genauer: die Grenze zwischen Exons und Introns. Exons sind kodierte Bauanleitungen für Proteine. Introns dagegen sind dies nicht und sie werden beim Übergang von Information in strukturierte Materie schließlich enzymatisch herausgeschnitten. Die Zahl der Gene wird allein beim Menschen auf 20 000 bis 180 000 geschätzt, wovon jedes meist 100 bis 4 000 kodierende "Buchstaben" enthält. Eine derart umfangreiche Buchstabensuppe ohne Computerhilfe mit möglichst wenigen Fehlern durchforsten und verstehen zu wollen, wäre ein Unding.

Mathematische Methoden, mit deren Hilfe Spleißstellen aufgefunden werden können, hat Sören Sonnenburg in seiner mit dem 1. Hugo-Geiger-Preis ausgezeichneten Diplomarbeit untersucht. Bedeutender jedoch ist, dass er besonders verlässliche neue entwickelt hat. "Genauigkeit ist in diesem Bereich entscheidender als Rechenzeit", weiß der gelernte Informatiker. "Dennoch ist die computergestützte Erkennung bedeutend schneller als traditionelle Verfahren. Die Fehlerrate der Algorithmen ist wesentlich, weil die Berechnungen als Grundlage für genetische Laborexperimente dienen. Erst hier entsteht der Löwenanteil der Kosten." Für den Laien mögen vier bis sechs Prozent Fehler der von Sonnenburg erarbeiteten vier Methoden hoch erscheinen. Doch ist dies gering gegenüber den heute weltweit sonst eingesetzten Verfahren. Sie finden Spleißstellen in standardisierten Datensätzen des Menschen oder des Fadenwurms Caenorhabditis elegans nur mit deutlich höheren Fehlern zwischen zehn und dreißig Prozent.

"Sören Sonnenburg hat damit einen wichtigen wissenschaftlichen Beitrag in den überaus aktiven Gebieten statistische Lerntheorie und Bioinformatik geleistet", betont Professor Klaus-Robert Müller, Leiter des Bereichs Intelligente Datenanalyse IDA am Fraunhofer-Institut für Rechnerarchitektur und Softwaretechnik FIRST in Berlin. "Seine selbstlernenden Programme sind ein zentraler Baustein im laufenden Projekt IDA.GEN, dessen Ziel ein Software-Paket zum Auffinden von Genen ist."

Hugo-Geiger-Preis - Wissenschaftlichen Nachwuchs fördern

Das 50-jährige Jubiläum der Fraunhofer-Gesellschaft veranlasste die Bayerische Staatsregierung vor vier Jahren, diesen Preis zu stiften. Namensgeber ist Staatssekretär Hugo Geiger, der Schirmherr der Gründungsversammlung der Fraunhofer-Gesellschaft am 26. März 1949. Mit diesem Preis werden hervorragende und anwendungsorientierte Diplomarbeiten oder Dissertationen auf dem Gebiet der Biowissenschaften (Life Sciences) ausgezeichnet. Kriterien der Beurteilung sind: wissenschaftliche Qualität, wirtschaftliche Relevanz, Neuartigkeit und Interdisziplinarität der Ansätze. Die Arbeiten müssen in unmittelbarer Beziehung zu einem Fraunhofer-Institut stehen oder dort entstanden sein. In diesem Jahr erhält der erste Preisträger einen Betrag von 3 000 Euro.

Weitere News aus dem Ressort Wissenschaft

Meistgelesene News

Weitere News von unseren anderen Portalen

Kampf gegen Krebs: Neueste Entwicklungen und Fortschritte