KI-Technologie generiert Originalproteine von Grund auf

Natürliches Sprachmodell bringt Proteindesign mit der Schaffung aktiver Enzyme in Fahrt

23.02.2023 - USA

Wissenschaftler haben ein KI-System entwickelt, das in der Lage ist, künstliche Enzyme von Grund auf zu erzeugen. In Labortests funktionierten einige dieser Enzyme genauso gut wie die in der Natur vorkommenden, selbst wenn ihre künstlich erzeugten Aminosäuresequenzen erheblich von allen bekannten natürlichen Proteinen abwichen.

Computer-generated image

Symbolbild

Das Experiment zeigt, dass die natürliche Sprachverarbeitung, obwohl sie zum Lesen und Schreiben von Texten entwickelt wurde, zumindest einige der zugrunde liegenden Prinzipien der Biologie erlernen kann. Das von Salesforce Research entwickelte KI-Programm mit dem Namen ProGen setzt Aminosäuresequenzen mithilfe von Next-Token-Vorhersagen zu künstlichen Proteinen zusammen.

Laut Wissenschaftlern könnte die neue Technologie leistungsfähiger sein als die gerichtete Evolution, die mit dem Nobelpreis ausgezeichnete Technologie für das Design von Proteinen, und sie wird dem 50 Jahre alten Bereich des Protein-Engineerings neue Impulse verleihen, indem sie die Entwicklung neuer Proteine beschleunigt, die für fast alles eingesetzt werden können, von Therapeutika bis zum Abbau von Plastik.

"Die künstlichen Designs funktionieren viel besser als Designs, die durch den Evolutionsprozess inspiriert wurden", sagte Dr. James Fraser, Professor für Bioengineering und therapeutische Wissenschaften an der UCSF School of Pharmacy und einer der Autoren der Arbeit, die am 26. Januar in Nature Biotechnology veröffentlicht wurde. Eine frühere Version der Arbeit war seit Juli 2021 auf dem Preprint-Server BiorXiv verfügbar, wo sie mehrere Dutzend Zitate erhielt, bevor sie in einer von Fachleuten begutachteten Zeitschrift veröffentlicht wurde.

"Das Sprachmodell lernt Aspekte der Evolution, aber es ist anders als der normale Evolutionsprozess", sagte Fraser. "Wir haben jetzt die Möglichkeit, die Erzeugung dieser Eigenschaften auf bestimmte Effekte abzustimmen. Zum Beispiel ein Enzym, das unglaublich thermostabil ist oder saure Umgebungen mag oder nicht mit anderen Proteinen interagiert."

Um das Modell zu erstellen, gaben die Wissenschaftler einfach die Aminosäuresequenzen von 280 Millionen verschiedenen Proteinen aller Art in das maschinelle Lernmodell ein und ließen es die Informationen ein paar Wochen lang verarbeiten. Dann nahmen sie eine Feinabstimmung des Modells vor, indem sie ihm 56.000 Sequenzen aus fünf Lysozym-Familien zusammen mit einigen Kontextinformationen über diese Proteine vorlegten.

Das Modell generierte schnell eine Million Sequenzen, von denen das Forscherteam 100 zum Testen auswählte, je nachdem, wie sehr sie den Sequenzen natürlicher Proteine ähnelten und wie naturalistisch die den KI-Proteinen zugrunde liegende Aminosäure-"Grammatik" und "Semantik" waren.

Aus dieser ersten Charge von 100 Proteinen, die von Tierra Biosciences in vitro getestet wurden, stellte das Team fünf künstliche Proteine her, um sie in Zellen zu testen, und verglich ihre Aktivität mit der eines Enzyms, das im Eiweiß von Hühnereiern vorkommt und als Hühnereiweiß-Lysozym (HEWL) bekannt ist. Ähnliche Lysozyme finden sich in menschlichen Tränen, Speichel und Milch, wo sie Bakterien und Pilze abwehren.

Zwei der künstlichen Enzyme waren in der Lage, die Zellwände von Bakterien mit einer mit HEWL vergleichbaren Aktivität aufzuspalten, ihre Sequenzen waren jedoch nur zu etwa 18 % identisch. Die beiden Sequenzen waren zu 90 % bzw. 70 % mit einem bekannten Protein identisch.

Eine einzige Mutation in einem natürlichen Protein kann dazu führen, dass es nicht mehr funktioniert, aber in einer anderen Screening-Runde stellte das Team fest, dass die von der KI erzeugten Enzyme selbst dann aktiv waren, wenn nur 31,4 % ihrer Sequenz mit einem bekannten natürlichen Protein übereinstimmten.

Die KI war sogar in der Lage zu lernen, wie die Enzyme geformt sein sollten, indem sie einfach die Rohsequenzdaten studierte. Mit Hilfe der Röntgenkristallographie gemessen, sahen die atomaren Strukturen der künstlichen Proteine genau so aus, wie sie sein sollten, obwohl die Sequenzen mit nichts zuvor Gesehenem vergleichbar waren.

Salesforce Research entwickelte ProGen im Jahr 2020 auf der Grundlage einer Art natürlichsprachlicher Programmierung, die die Forscher ursprünglich für die Generierung englischsprachiger Texte entwickelt hatten.

Aus ihrer früheren Arbeit wussten sie, dass das KI-System sich selbst Grammatik und die Bedeutung von Wörtern beibringen konnte, zusammen mit anderen zugrunde liegenden Regeln, die für eine gut komponierte Schrift sorgen.

"Wenn man sequenzbasierte Modelle mit vielen Daten trainiert, sind sie sehr leistungsfähig beim Erlernen von Strukturen und Regeln", so Dr. Nikhil Naik, Direktor der KI-Forschung bei Salesforce Research und Hauptautor der Studie. "Sie lernen, welche Wörter zusammen vorkommen können, und auch die Kompositionalität."

Bei Proteinen waren die Gestaltungsmöglichkeiten fast grenzenlos. Lysozyme sind mit bis zu 300 Aminosäuren im Vergleich zu anderen Proteinen klein. Aber mit 20 möglichen Aminosäuren gibt es eine enorme Anzahl (20300) von möglichen Kombinationen. Das ist mehr als alle Menschen, die im Laufe der Zeit gelebt haben, multipliziert mit der Anzahl der Sandkörner auf der Erde, multipliziert mit der Anzahl der Atome im Universum.

Angesichts dieser unbegrenzten Möglichkeiten ist es bemerkenswert, dass das Modell so einfach funktionierende Enzyme erzeugen kann.

"Die Fähigkeit, funktionale Proteine von Grund auf neu zu generieren, zeigt, dass wir in eine neue Ära des Proteindesigns eintreten", so Dr. Ali Madani, Gründer von Profluent Bio, ehemaliger Forscher bei Salesforce Research und Erstautor der Studie. "Dies ist ein vielseitiges neues Werkzeug, das den Proteiningenieuren zur Verfügung steht, und wir freuen uns darauf, die therapeutischen Anwendungen zu sehen.

Hinweis: Dieser Artikel wurde mit einem Computersystem ohne menschlichen Eingriff übersetzt. LUMITOS bietet diese automatischen Übersetzungen an, um eine größere Bandbreite an aktuellen Nachrichten zu präsentieren. Da dieser Artikel mit automatischer Übersetzung übersetzt wurde, ist es möglich, dass er Fehler im Vokabular, in der Syntax oder in der Grammatik enthält. Den ursprünglichen Artikel in Englisch finden Sie hier.

Originalveröffentlichung

Weitere News aus dem Ressort Wissenschaft

Diese Produkte könnten Sie interessieren

Antibody Stabilizer

Antibody Stabilizer von CANDOR Bioscience

Protein- und Antikörperstabilisierung leicht gemacht

Langzeitlagerung ohne Einfrieren – Einfache Anwendung, zuverlässiger Schutz

Stabilisierungslösungen
DynaPro NanoStar II

DynaPro NanoStar II von Wyatt Technology

NanoStar II: DLS und SLS mit Touch-Bedienung

Größe, Partikelkonzentration und mehr für Proteine, Viren und andere Biomoleküle

Loading...

Meistgelesene News

Weitere News von unseren anderen Portalen

So nah, da werden
selbst Moleküle rot...