14.06.2022 - Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch

KI identifiziert Krebszellen

„Wir können mit ikarus Gene identifizieren, die potenzielle Treiber der Krebserkrankung sind“

Wie unterscheiden sich krebskranke von gesunden Zellen? Ein neuer Machine-Learning-Algorithmus namens „ikarus“ kennt die Antwort, berichtet ein Team um den Bioinformatiker Altuna Akalin vom MDC nun im Fachjournal „Genome Biology“. Das Programm hat eine charakteristische Gensignatur gefunden.

Wenn es darum geht, in Datenbergen Muster zu identifizieren, ist ein Mensch einer künstlichen Intelligenz (KI) chancenlos unterlegen. Besonders das maschinelle Lernen, ein Teilbereich der KI, wird oft eingesetzt, um Gesetzmäßigkeiten in Datensätzen zu finden – sei es zur Aktienmarktanalyse, Bild- und Spracherkennung oder der Klassifizierung von Zellen. Um Krebszellen zuverlässig von gesunden Zellen zu unterscheiden, hat ein Team um Dr. Altuna Akalin, Leiter der Technologieplattform „Bioinformatik und Omics-Datenwissenschaft“ am Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC), nun ein Machine-Learning-Programm namens „ikarus“ entwickelt. In den Tumorzellen fand das Programm ein krebsübergreifendes Muster, bestehend aus einer charakteristischen Kombination an Genen. Der Algorithmus entdeckte in dem Muster außerdem Arten von Genen, die man bislang nicht eindeutig mit Krebs in Verbindung gebracht hatte, schreibt die Forschungsgruppe im Fachjournal „Genome Biology“.

Maschinelles Lernen bedeutet im Grunde, dass ein Algorithmus anhand von Trainingsdaten selbstständig lernt, bestimmte Fragestellungen zu beantworten. Seine Strategie ist dabei, nach Mustern in den Daten zu suchen, die ihm bei der Problemlösung helfen. Nach der Trainingsphase kann das System das Gelernte verallgemeinern und somit unbekannte Daten beurteilen. „Eine große Herausforderung war, geeignete Lerndatensätze zu bekommen, bei denen Fachleute bereits eine präzise Einteilung der Zellen in ‚gesund’ und ‚krebskrank’ vorgenommen hatten“, erzählt Jan Dohmen, der Erstautor der Studie.

Eine überraschend gute Trefferquote

Obendrein sind Datensätze aus Einzelzell-Sequenzierungen häufig verrauscht. Das bedeutet: Die Informationen über die molekularen Eigenschaften der einzelnen Zellen sind nicht ganz genau – weil zum Beispiel in jeder Zelle eine unterschiedliche Anzahl Gene erkannt wird oder die Proben nicht immer gleich verarbeitet werden. Sie hätten unzählige Publikationen durchforstet und etliche Forschungsgruppen kontaktiert, um ausreichend gute Datensätze zu bekommen, berichten Dohmen und sein Kollege Dr. Vedran Franke, der Ko-Leiter der Studie. Mit Daten von Lungen- und Darmkrebszellen trainierten das Team den Algorithmus schließlich, bevor sie ihn auf Datensätze von weiteren Tumorarten anwendeten.

In der Trainingsphase musste ikarus eine Liste charakteristischer Gene finden, anhand derer das Programm die Zellen einteilen konnte: „Wir haben verschiedene Ansätze ausprobiert und verfeinert“, sagt Dohmen. Eine zeitintensive Arbeit, wie sich alle drei Forscher erzählen. „Ausschlaggebend war, dass ikarus letztlich zwei Listen nutzte: eine für Krebsgene und eine für Gene anderer Zellen“, erklärt Franke. Nach der Lernperiode konnte der Algorithmus auch bei anderen Krebsarten zuverlässig zwischen gesunden und krebskranken Zellen unterscheiden, etwa in Gewebeproben von Leberkrebs oder Neuroblastomen. Seine Trefferquote lag meist nur wenige Prozent daneben. Das hat auch die Forschungsgruppe überrascht: „Wir haben nicht erwartet, dass eine gemeinsame Signatur existiert, die Tumorzellen von verschiedenen Krebsarten so genau definiert“, sagt Akalin. „Noch können wir allerdings nicht sagen, dass die Methode für alle Krebsarten funktioniert“, fügt Dohmen hinzu. Damit ikarus zuverlässig bei der Krebsdiagnose helfen kann, wollen die Forschenden ihn noch an weiteren Tumorarten testen.

KI als vollautomatische Diagnose-Hilfe

Die Klassifizierung „gesund“ versus „krebskrank“ ist dabei längst nicht das Ende des Projekts. In ersten Tests konnte ikarus bereits zeigen, dass sich die Methode auch andere Zelltypen oder bestimmte Subtypen von Tumorzellen unterscheiden kann. „Wir wollen den Ansatz verallgemeinern“, sagt Akalin, „also ihn derart weiterentwickeln, dass er alle möglichen Zelltypen in einer Biopsie unterscheiden kann“.

In der Klinik schauen sich Pathologen Gewebeproben von Tumoren meist nur unter dem Mikroskop an und identifizieren so die unterschiedlichen Zelltypen. Da ist mühsam und kostet viel Zeit. Mit ikarus könnte dieser Schritt irgendwann vollautomatisch ablaufen. Außerdem könne man aus den Daten zusätzlich etwas über die unmittelbare Umgebung des Tumors ableiten, sagt Akalin. Das wiederum könnte den Ärztinnen und Ärzten helfen, eine optimale Therapie auszuwählen. Denn oftmals deute die Zusammensetzung des Krebsgewebes und der Mikroumgebung darauf hin, ob eine bestimmte Behandlung oder ein Medikament anschlagen wird oder nicht. Darüber hinaus hilft die KI möglicherweise, neue Medikament zu entwickeln: „Wir können mit ikarus Gene identifizieren, die potenzielle Treiber der Krebserkrankung sind“, sagt Akalin. Neuartige Wirkstoffe könnten dann an diesen molekularen Zielstrukturen ansetzen.

Zusammenarbeit im Home-Office

Bemerkenswert an der Publikation sei, dass die notwendigen Arbeiten vollständig während der Coronapandemie durchgeführt wurden. Alle Beteiligten waren zu der Zeit nicht an ihren normalen Arbeitsplätzen im Berliner Institut für Medizinische Systembiologie (BIMSB), das zum MDC gehört. Sie hielten im Home-Office nur über digitale Kanäle Kontakt. „Das Projekt beweist, dass man eine digitale Struktur schaffen kann, die wissenschaftliche Arbeiten unter diesen Bedingungen ermöglicht“, findet Franke daher.

Fakten, Hintergründe, Dossiers
  • Machine Learning
  • künstliche Intelligenz
  • Krebs
Mehr über MDC
  • News

    Feinschliff für die Genschere

    Mit dem molekularen Werkzeug CRISPR-Cas9 lassen sich erbliche Blutleiden behandeln. Dabei kann es zu ungewollten Veränderungen im Erbgut kommen. Ein Team um die MDC-Forscher Klaus Rajewsky und Van Trung Chu stellt jetzt in „Science Advances“ eine Methode vor, die solche Folgen minimiert. Di ... mehr

    Pop-up-Fabriken hinter der Zellmembran

    Wie eine Zelle hunderte Signale gleichzeitig verarbeiten kann, zeigen MDC-Forschende im Fachblatt „Cell“. Andreas Bock und seine Kolleg*innen gehen davon aus, dass sich mit den Ergebnissen ein komplett neues Forschungsfeld in der Zellbiologie öffnen wird. Eine lebende Zelle ist vielfältigen ... mehr

    Mit mRNA zu neuer Muskelkraft

    Mutationen, die zu Muskelschwund führen, lassen sich mit der Genschere CRISPR/Cas9 reparieren. Ein Team um die ECRC-Forscherin Helena Escobar hat das Werkzeug jetzt erstmals mit mRNA in menschliche Muskelstammzellen eingeschleust. Damit ist eine Methode gefunden, die sich therapeutisch nutz ... mehr

  • Videos

    Wie beeinflusst die Genomstruktur die Entstehung von Krankheiten?

    Am Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) sind rund 1600 Menschen aus mehr als 50 Nationen beschäftigt, davon mehr als 350 Studierende. Forscher arbeiten in mehr als 60 unabhängigen Forschungsgruppen und einem Dutzend Technologieplattformen. Diese Se ... mehr

    Das MDC im Profil - Max Delbrück Center for Molecular Medicine

    Das Max-Delbrück-Centrum für Molekulare Medizin (MDC) in Berlin-Buch ist eines der größten und wichtigsten Zentren für Biomedizin in Deutschland. Es ist Mitglied der Helmholtz-Gemeinschaft - der größten Wissenschaftsorganisation Deutschlands mit 18 Forschungszentren, die ein breites Spektru ... mehr

    DNA 60 | Epigenetik -- Wie Erfahrungen vererbt werden

    Vortrag auf dem "60 Jahre DNA" - Kongress für Lehrkräfte, Studierende, Schüler/innen und InteressierteDas Gen ist 100 geworden, und kaum einer hat es gemerkt. Über Jahrzehnte hat dieser Begriff wie kaum ein anderer das Bild der biologischen Wissenschaften in der Öffentlichkeit geprägt, nich ... mehr

  • Forschungsinstitute

    Max-Delbrück-Centrum für Molekulare Medizin (MDC) Berlin-Buch

    Das Max-Delbrück-Centrum für molekulare Medizin (MDC) ist eines der wichtigsten Zentren für biomedizinische Forschung. Das MDC wurde 1992 gegründet, um Ergebnisse der molekularen Forschung in Anwendungen bei der Prävention, Diagnose und Therapie von Krankheiten zu überführen. Der Standort i ... mehr