Schnellere und zuverlässigere Vorhersage der Kristallstruktur von organischen Molekülen
Anzeigen
Die Vorhersage von Kristallstrukturen organischer Moleküle ist in vielen Industriezweigen von entscheidender Bedeutung, insbesondere in der Pharmazie und bei der Entwicklung von Funktionsmaterialien. In der Pharmazie hat die Kristallstruktur einen direkten Einfluss auf die Löslichkeit und Stabilität eines Arzneimittels. Bei funktionellen Materialien wie organischen Halbleitern ist die Kontrolle der Kristallstrukturen entscheidend für das Erreichen der gewünschten elektronischen Eigenschaften. Die Vorhersage der Kristallstruktur (CSP) ist jedoch aufgrund der schwachen und vielfältigen intra- und intermolekularen Wechselwirkungen, die nur bei organischen Kristallen auftreten, von Natur aus eine schwierige Aufgabe. Selbst geringfügige Abweichungen können zu völlig unterschiedlichen Packungsanordnungen führen.
Die CSP wird in der Regel in zwei Phasen durchgeführt: Strukturexploration und Strukturrelaxation. In der ersten Phase wird eine große Anzahl potenzieller Strukturen generiert, oft nach dem Zufallsprinzip, für die verschiedene Suchalgorithmen entwickelt worden sind. Während der Strukturrelaxation werden diese Strukturen verfeinert, um die stabilsten Konfigurationen durch Energieminimierung zu ermitteln. Die zufällige Generierung von Strukturen führt jedoch häufig zu mehreren instabilen Strukturen mit geringer Dichte, während herkömmliche, auf der Dichtefunktionaltheorie (DFT) basierende Methoden zur Strukturrelaxation rechenintensiv und zeitaufwändig sind.
Um diese Herausforderungen zu bewältigen, haben Associate Professor Takuya Taniguchi vom Center for Data Science und Ryo Fukasawa von der Graduate School of Advanced Science and Engineering an der Waseda University, Japan, einen bahnbrechenden, auf maschinellem Lernen (ML) basierenden CSP-Arbeitsablauf namens SPaDe-CSP entwickelt, der Raumgruppen- (SP) und Packungsdichte- (PD) Vorhersagen nutzt. "Unser Arbeitsablauf verwendet eine einzigartige Strategie, bei der maschinelle Lernmodelle zunächst die wahrscheinlichsten Raumgruppen und Kristalldichten vorhersagen und instabile Kandidaten mit geringer Dichte herausfiltern, bevor rechenintensive Relaxationsschritte durchgeführt werden", erklärt Taniguchi. "Zusammen mit einem effizienten neuronalen Netzwerk für die Strukturrelaxation ermöglicht diese Methode einen direkteren und zuverlässigeren Weg zur Identifizierung experimentell beobachteter Kristallanordnungen. "Ihre Studie wurde am 13. Oktober 2025 in der Zeitschrift Digital Discovery veröffentlicht.
SPaDe-CSP engt den Suchraum für organische Kristalle ein, indem es zunächst wahrscheinliche Raumgruppenkandidaten und Kristalldichten mithilfe von ML-Modellen vorhersagt. Zum Trainieren und Testen extrahierten die Forscher einen Datensatz aus der Cambridge Structural Database (CSD), der aus 32 Raumgruppenkandidaten mit 169.656 Dateneinträgen besteht. Beide Vorhersagemodelle verwendeten MACCSKeys als molekularen Fingerabdruck und LightGBM als Vorhersagefunktion. Die Forscher interpretierten die trainierten Modelle auch mit Hilfe der Shapley-Additiv-Erklärungs-Analyse (SHAP), um die wichtigsten Strukturmerkmale für effektive Vorhersagen zu identifizieren.
Nach der Gitterabtastung werden die erzeugten nicht entspannten Strukturen dann einer Strukturrelaxation unter Verwendung eines effizienten neuronalen Netzwerkpotenzials (NNP) unterzogen, das auf DFT-Daten vortrainiert wurde, und schließlich das Energiedichtediagramm des Zielmoleküls erstellt. Zwei Hyperparameter steuern den SPaDe-CSP-Prozess: die Wahrscheinlichkeitsschwelle für die Filterung von Raumgruppen und das Toleranzfenster für die Kristalldichte.
Die Forscher testeten den Arbeitsablauf zunächst an einem Modellmolekül aus dem CSD-Datensatz, um die Abhängigkeit der Erfolgsrate von den Hyperparametern zu untersuchen, und dann an 20 verschiedenen organischen Molekülen, einschließlich des Modellmoleküls, um die Verallgemeinerbarkeit zu testen. Die Ergebnisse wurden erfolgreich anhand der bekannten experimentellen Kristallstrukturen der Moleküle validiert und auch mit den Ergebnissen verglichen, die mit dem herkömmlichen Zufalls-CSP erzielt wurden.
Die Ergebnisse zeigten, dass die Erfolgswahrscheinlichkeit mit einem höheren Raumgruppenschwellenwert und einem kleineren Toleranzfenster für die Dichte zunimmt. Für 80 % der getesteten Verbindungen konnte SPaDe-CSP die experimentellen Kristallstrukturen erfolgreich vorhersagen und erreichte damit eine doppelt so hohe Erfolgsquote wie random-CSP. Bemerkenswert ist, dass die Forscher auch einen wichtigen strukturellen Deskriptor identifiziert haben, der linear mit der Erfolgsrate korreliert, was auf strukturelle Einflüsse sowohl auf Kristall- als auch auf Molekülebene hinweist.
"Unsere Strategie kann die Entwicklung und Entdeckung neuer Moleküle in der pharmazeutischen und materialwissenschaftlichen Industrie erheblich beschleunigen", sagt Taniguchi. "Dies wird eine schnellere und zuverlässigere Identifizierung der stabilsten, effektivsten physikalischen Form eines neuen Medikaments ermöglichen, die für die Aufrechterhaltung der Löslichkeit, Haltbarkeit und Gesamtwirksamkeit wichtig ist, und ein rechnerisches Screening neuartiger funktioneller Materialien mit optimalen elektronischen Eigenschaften ermöglichen."
Indem CSP schneller und zuverlässiger wird, markiert diese Forschung einen wichtigen Schritt zur Beschleunigung der Entdeckung lebensrettender Medikamente und Technologien der nächsten Generation.
Hinweis: Dieser Artikel wurde mit einem Computersystem ohne menschlichen Eingriff übersetzt. LUMITOS bietet diese automatischen Übersetzungen an, um eine größere Bandbreite an aktuellen Nachrichten zu präsentieren. Da dieser Artikel mit automatischer Übersetzung übersetzt wurde, ist es möglich, dass er Fehler im Vokabular, in der Syntax oder in der Grammatik enthält. Den ursprünglichen Artikel in Englisch finden Sie hier.