banner
Heim / Nachricht / Verwendung generativer KI zum Design neuartiger Proteine
Nachricht

Verwendung generativer KI zum Design neuartiger Proteine

Apr 12, 2023Apr 12, 2023

Forscher der University of Toronto haben ein künstliches Intelligenzsystem entwickelt, das mithilfe generativer Diffusion Proteine ​​erzeugen kann, die in der Natur nicht vorkommen – dieselbe Technologie, die hinter beliebten KI-Bilderzeugungsplattformen wie Midjourney und DALL-E von OpenAI steckt.

Das System wird dazu beitragen, das Gebiet der generativen Biologie voranzutreiben, das eine Beschleunigung der Arzneimittelentwicklung verspricht, indem es das Design und Testen völlig neuer therapeutischer Proteine ​​effizienter und flexibler macht.

„Unser Modell lernt aus Bilddarstellungen, um mit sehr hoher Geschwindigkeit völlig neue Proteine ​​zu erzeugen“, sagt Philip M. Kim, PhD, Professor am Donnelly Center for Cellular and Biomolecular Research an der Temerty Faculty of Medicine der U of T. „Alle unsere Proteine ​​scheinen biophysikalisch real zu sein, das heißt, sie falten sich in Konfigurationen, die es ihnen ermöglichen, bestimmte Funktionen innerhalb von Zellen auszuführen.“

Die Ergebnisse wurden in der Fachzeitschrift Nature Computational Science veröffentlicht und sind die ersten ihrer Art in einer Fachzeitschrift mit Peer-Review. Kims Labor veröffentlichte letzten Sommer auch einen Vorabdruck des Modells über den Open-Access-Server bioRxiv vor zwei ähnlichen Vorabdrucken vom letzten Dezember – RF Diffusion von der University of Washington und Chroma von Generate Biomedicines.

Proteine ​​bestehen aus Aminosäureketten, die sich zu dreidimensionalen Formen falten, die wiederum die Proteinfunktion bestimmen. Diese Formen haben sich über Milliarden von Jahren entwickelt und sind vielfältig, komplex und in ihrer Anzahl begrenzt.

Mit einem besseren Verständnis darüber, wie sich bestehende Proteine ​​falten, haben Forscher nun damit begonnen, Faltmuster zu entwerfen, die in der Natur nicht vorkommen.

Eine große Herausforderung, sagt Kim, bestand darin, sich Falten vorzustellen, die sowohl möglich als auch funktionell sind.

„Es war sehr schwer vorherzusagen, welche Falten real sind und in einer Proteinstruktur funktionieren“, sagt Kim, die auch Professorin in den Abteilungen Molekulargenetik an der Temerty Faculty of Medicine und Informatik an der Faculty of Arts & Science ist . „Durch die Kombination biophysikalischer Darstellungen der Proteinstruktur mit Diffusionsmethoden aus dem Bilderzeugungsbereich können wir beginnen, dieses Problem anzugehen.“

Das neue System, das die Forscher ProteinSGM nennen, basiert auf einer großen Menge bildähnlicher Darstellungen vorhandener Proteine, die deren Struktur genau kodieren. Die Forscher speisen diese Bilder in ein generatives Diffusionsmodell ein, das nach und nach Rauschen hinzufügt, bis jedes Bild nur noch Rauschen ist. Das Modell verfolgt, wie die Bilder verrauschter werden, und führt den Prozess dann in umgekehrter Reihenfolge aus. Dabei lernt es, zufällige Pixel in klare Bilder umzuwandeln, die völlig neuartigen Proteinen entsprechen.

Jin Sub (Michael) Lee, Doktorand im Kim-Labor und Erstautor der Arbeit, sagt, dass die Optimierung der frühen Phase dieses Bilderzeugungsprozesses eine der größten Herausforderungen bei der Entwicklung von ProteinSGM war.

„Eine Schlüsselidee war die richtige bildähnliche Darstellung der Proteinstruktur, sodass das Diffusionsmodell lernen kann, wie man neue Proteine ​​präzise erzeugt“, sagt Lee, der aus Vancouver stammt, aber sein Grundstudium in Südkorea und sein Masterstudium in der Schweiz absolvierte bevor er die U of T für seine Promotion wählte.

Schwierig war auch die Validierung der von ProteinSGM produzierten Proteine. Das System erzeugt viele Strukturen – oft anders als alles, was man in der Natur findet. Nach Standardmaßstäben sehen fast alle von ihnen echt aus, sagt Lee, aber die Forscher brauchten weitere Beweise.

Um ihre neuen Proteine ​​zu testen, wandten sich Lee und seine Kollegen zunächst an OmegaFold, eine verbesserte Version von DeepMinds Software AlphaFold 2. Beide Plattformen nutzen KI, um die Struktur von Proteinen anhand von Aminosäuresequenzen vorherzusagen.

Mit OmegaFold bestätigte das Team, dass sich fast alle ihrer neuartigen Sequenzen in die gewünschten Proteinstrukturen falten. Anschließend wählten sie eine kleinere Anzahl aus, um sie physikalisch in Reagenzgläsern zu erzeugen, um zu bestätigen, dass es sich bei den Strukturen um Proteine ​​und nicht nur um vereinzelte Ketten chemischer Verbindungen handelte.

„Mit Übereinstimmungen in OmegaFold und experimentellen Tests im Labor konnten wir sicher sein, dass es sich um ordnungsgemäß gefaltete Proteine ​​handelte. Es war erstaunlich, die Validierung dieser völlig neuen Proteinfaltungen zu sehen, die nirgendwo in der Natur vorkommen“, sagt Lee.

Zu den nächsten auf dieser Arbeit basierenden Schritten gehört die Weiterentwicklung von ProteinSGM für Antikörper und andere Proteine ​​mit dem größten therapeutischen Potenzial, sagt Kim. „Dies wird ein sehr spannender Bereich für Forschung und Unternehmertum sein.“

Lee sagt, er würde sich wünschen, dass sich die generative Biologie in Richtung gemeinsamer Gestaltung von Proteinsequenzen und -strukturen, einschließlich Proteinseitenkettenkonformationen, bewegt. Bisher konzentrierte sich die meiste Forschung auf die Bildung von Rückgraten, den primären chemischen Strukturen, die Proteine ​​zusammenhalten.

„Seitenkettenkonfigurationen bestimmen letztendlich die Proteinfunktion, und obwohl ihre Gestaltung einen exponentiellen Anstieg der Komplexität bedeutet, könnte dies mit der richtigen Technik möglich sein“, sagt Lee. „Wir hoffen, es herauszufinden.“

Diese Forschung wurde von den Canadian Institutes of Health Research finanziert.

-Diese Veröffentlichung wurde ursprünglich auf der Website der University of Toronto veröffentlicht und aus Stilgründen bearbeitet.