Lesezeit ca. 10 Min.
arrow_back

ARZNEIMITTELENTWICKLUNG NEUE MEDIK AMENTE DANK SUPERCOMPUTERN


Logo von Spektrum der Wissenschaft
Spektrum der Wissenschaft - epaper ⋅ Ausgabe 11/2021 vom 16.10.2021

Artikelbild für den Artikel "ARZNEIMITTELENTWICKLUNG NEUE MEDIK AMENTE DANK SUPERCOMPUTERN" aus der Ausgabe 11/2021 von Spektrum der Wissenschaft. Dieses epaper sofort kaufen oder online lesen mit der Zeitschriften-Flatrate United Kiosk NEWS.

Bildquelle: Spektrum der Wissenschaft, Ausgabe 11/2021

Die aktuelle Pandemie verdeutlicht, wie wichtig es ist, rasch geeignete Arzneimittel zu finden. In Computersimulationen gelingt das erheblich schneller als im Labor. Gegen das Coronavirus ließen sich auf diese Weise bereits Wirkstoffkandidaten identifizieren.

Der Mathematiker Konstantin Fackeldey (links) lehrt als Privatdozent an der TU Berlin und arbeitet am Zuse-Institut Berlin (ZIB) an der Entwicklung mathematischer Methoden zur Simulation von Biomolekülen. Christoph Gorgulla (Mitte) ist Experte für computergestützte und quantenchemische Methoden zur Wirkstoffentwicklung. Er forscht an der Harvard Medical School und am Institut für Physik der Harvard University, Cambridge, USA. Marcus Weber leitet die Arbeitsgruppe »Computational Molecular Design« am Zuse-Institut Berlin. Er untersucht die Optimierung und das Design mathematischer Methoden für den Wirkstoffentwurf. Die Autoren bedanken ...

Weiterlesen
epaper-Einzelheft 5,99€
NEWS Jetzt gratis testen
Bereits gekauft?Anmelden & Lesen
Leseprobe: Abdruck mit freundlicher Genehmigung von Spektrum der Wissenschaft. Alle Rechte vorbehalten.
Lesen Sie jetzt diesen Artikel und viele weitere spannende Reportagen, Interviews, Hintergrundberichte, Kommentare und mehr aus über 1050 Magazinen und Zeitungen. Mit der Zeitschriften-Flatrate NEWS von United Kiosk können Sie nicht nur in den aktuellen Ausgaben, sondern auch in Sonderheften und im umfassenden Archiv der Titel stöbern und nach Ihren Themen und Interessensgebieten suchen. Neben der großen Auswahl und dem einfachen Zugriff auf das aktuelle Wissen der Welt profitieren Sie unter anderem von diesen fünf Vorteilen:

  • Schwerpunkt auf deutschsprachige Magazine
  • Papier sparen & Umwelt schonen
  • Nur bei uns: Leselisten (wie Playlists)
  • Zertifizierte Sicherheit
  • Freundlicher Service
Erfahren Sie hier mehr über United Kiosk NEWS.

Mehr aus dieser Ausgabe

Titelbild der Ausgabe 11/2021 von NATÜRLICHE VERBÜNDETE. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
NATÜRLICHE VERBÜNDETE
Titelbild der Ausgabe 11/2021 von SAGENHAFTER GOLDSCHATZ. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
SAGENHAFTER GOLDSCHATZ
Titelbild der Ausgabe 11/2021 von LASERFUSION FEIERT BEINAHE-DURCHBRUCH. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
LASERFUSION FEIERT BEINAHE-DURCHBRUCH
Titelbild der Ausgabe 11/2021 von KLAPPERSCHLANGEN TÄUSCHEN MIT AKUSTISCHEM TRICK. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
KLAPPERSCHLANGEN TÄUSCHEN MIT AKUSTISCHEM TRICK
Mehr Lesetipps
Blättern im Magazin
DER MYSTERIÖSE DINGO
Vorheriger Artikel
DER MYSTERIÖSE DINGO
FREISTETTERS FORMELWELT UNVORSTELLBARE ZAHLEN
Nächster Artikel
FREISTETTERS FORMELWELT UNVORSTELLBARE ZAHLEN
Mehr Lesetipps

... sich bei der Biologin Brigitte Klein für die Überarbeitung des Artikels.

spektrum.de/artikel/1924930

SERIE

Von der Molekülstruktur zum Medikament

Teil 1: Oktober 2021 Das Geheimnis der Proteinfaltung Gunnar Schröder

Teil 2: November 2021 Neue Medikamente dank Supercomputern Konstantin Fackeldey, Christoph Gorgulla und Marcus Weber

Teil 3: Dezember 2021 Wirkstoffe der Zukunft Rowan Jacobsen

AUF EINEN BLICK

ALGORITHMEN SPÜREN WIRKSTOFFE AUF

1 Viele Medikamente enthalten Substanzen, die passgenau an Eiweißmoleküle eines Erregers andocken und so den Krankheitsverlauf abmildern oder sogar stoppen können.

2 Traditionell fahnden Forschende im Labor mit langwierigen Experimenten nach derartigen Wirkstoffen.Dieser Prozess kann sich über mehrere Jahre hinziehen.

3 Das von den Autoren entwickelte und eingesetzte Programm »VirtualFlow« verlagert die Suche ins Virtuelle. Hochleistungsrechnern gelingt es damit, mehrere Millionen Moleküle pro Stunde zu testen.

Binnen kurzer Zeit hat ein Virus die Welt aus den Angeln gehoben – und die Wissenschaft zu Höchstleistungen angespornt. Im Eiltempo gelang es Forschenden, mehrere effektive Impfstoffe gegen Covid-19 zu entwickeln. Was Medikamente anbelangt, waren sie allerdings weniger erfolgreich. Das liegt größtenteils daran, dass die Arzneimittelentwicklung ein sehr langwieriger Prozess ist.

Von der Idee bis zur Zulassung dauert es im Durchschnitt mehr als 13 Jahre. Um diesen Prozess zu beschleunigen, sind daher dringend neue Ansätze und Techniken gefragt.

Bei Infektionskrankheiten gilt es zunächst zu entschlüsseln, wie der Erreger aufgebaut ist und wie er sich im menschlichen Körper vermehrt. Beim Coronavirus ist das mittlerweile gelungen (siehe »Die Zelle kapern«). Ziel der Forscher ist es nun, Wirkstoffe zu finden, die das Virus entweder direkt eliminieren oder seine Vermehrungstaktik entscheidend stören. Funktionieren könnte das beispielsweise mit Molekülen, die an geeignete Angriffspunkte auf der Virusober fläche andocken. Bei Letzteren handelt es sich in der Regel um Proteine, also Eiweißmoleküle, die sowohl von Viren und Bakterien als auch von körpereigenen Zellen als Werkzeuge genutzt werden.

Etliche Medikamente basieren auf diesem Prinzip: Die darin enthaltenen Wirkstoffmoleküle binden an bestimmte Proteine, um sie entweder zu blockieren oder aber zu stimulieren – je nachdem, welcher Effekt erzielt werden soll. Das Coronavirus nutzt ein so genanntes Spike-Protein auf seiner Oberfläche, um damit an die Körperzellen anzudocken und in sie einzudringen. Ein passendes Molekül könnte diesen Mechanismus unterbinden, indem es sich an das Spike-Protein heftet und dieses dadurch seiner Funktion beraubt.

Die Suche nach derartigen Wirkstoffkandidaten zieht sich aber häufig ziemlich in die Länge. In aufwändigen Versuchen müssen unzählige Moleküle auf ihre Passgenauigkeit untersucht und die dadurch vermittelte Wirkung geprüft werden. In diesem Kontext sprechen Biologen vom »Schlüssel-Schloss-Prinzip«. Es geht zurück auf den deutschen Chemiker Emil Fischer, der es im Jahr 1894 erstmals formulierte (siehe »Schlüssel-Schloss-Prinzip«). Gemeint ist, dass ein Molekül präzise in eine molekulare Bindungstasche passt. Der Schlüssel heißt im Fachjargon Ligand, und die Tasche ist üblicherweise ein Protein oder Proteinkomplex. Findet eine Bindung statt, auch Docking genannt, entfaltet der Ligand seine Wirkung. Auf Grund des zeitintensiven Suchprozesses waren es zu Beginn der modernen Medizin in der Regel Zufälle, die zur Entdeckung passender Docking-Kombinationen führten – und schlussendlich zur Entwicklung neuer Arzneimittel.

In den 1970er Jahren begannen Chemiker und Mediziner dann, systematisch möglichst viele Stoffe auf ihre Passgenauigkeit zu bestimmten Proteinen zu testen. Beschleunigt wurde die Suche schließlich in den 1990er Jahren durch automatisierte Hochdurchsatz-Screening-Methoden. Dabei prüft ein Robotersystem eine Vielzahl an Liganden.

Indem man bereits vorab ungeeignete aussortiert, lässt sich zusätzlich Zeit sparen. Denn wie bei echten Schlüsseln –

Haustürschlüssel sind zum Beispiel anders geformt als Autoschlüssel – lassen sich auch molekulare Schlüssel bestimmten Kategorien zuordnen. Und je nach Art der Bindungstasche kommt dann nur eine ganz bestimmte Sorte in Frage. Doch selbst eine solche prozessoptimierte Fahndung führt oftmals nicht oder nur nach viel Arbeit zum Erfolg.

Deutlich rascher geht es dagegen mit Hilfe eines so genannten virtuellen Screenings, bei dem die Laborexperimente entfallen. Stattdessen durchforstet ein Programm digitale Moleküldatenbanken nach Wirkstoffkandidaten, die in ein zu untersuchendes Schloss passen. Die Simulationen werden nicht nur für unterschiedliche Orientierungen der Moleküle im Raum durchgeführt, sondern auch für verschieden geformte Zustände. Folgerichtig müssen für eine einzige Schlüssel-Schloss-Paarung sehr viele Kombinationen ausprobiert werden. Außerdem gilt: Je mehr Liganden man überprüft, desto größer ist die Wahrscheinlichkeit, einen passenden zu finden.

Schlüssel-Schloss-Prinzip

Der deutsche Chemiker Emil Fischer führte im Jahr 1894 das Schlüssel-Schloss-Prinzip ein, das auch heute noch benutzt wird, um die Kopplung eines Moleküls (Ligand) an eine Bindungstasche eines Proteins oder Proteinkomplexes zu beschreiben: »Um ein Bild zu gebrauchen, will ich sagen, dass Enzym und Glucosid wie Schloss und Schlüssel zueinander passen müssen, um eine chemische Wirkung aufeinander ausüben zu können.« 1954 stellte dann der amerikanische Biochemiker Daniel E. Koshland das so genannte »Induced-Fit«-Modell vor. Es besagt, dass sich die Bindungstasche des Proteins an den Liganden anpasst, weshalb man im Deutschen auch von einem Handschuh-Hand-Modell spricht. Nach dem »Conformational Selection«-Modell des französischen Molekularbiologen Jacques Monod von 1964 nimmt die Bindungstasche unterschiedliche Formen an, während der Ligand sich dann die beste Form aussucht. Wenn ein kleines Molekül an eine Bindungstasche des Proteins bin ­ det und es dadurch an einer anderen Stelle verformt, spricht man vom allosterischen Effekt. Inzwischen ist bekannt, dass sich teilweise auch die Schlüssel flexibel anpassen.

Die Zelle kapern

Jedes Virus verfolgt das Ziel, in das Innere einer Wirtszelle zu gelangen und sich dort zu vermehren. Dabei sind stets unterschiedliche Proteine involviert – das Coronavirus besitzt 29 Arten. Mit einem davon, dem Spike-Protein (rot), heftet es sich an den ACE2-Rezeptor (blau) auf der Oberfläche der Wirtszelle und gelangt so ins Zellinnere, wo es seinen Bauplan in Form von RNA entpackt. Die Zelle fängt infolgedessen an, Komponenten für neue Viren herzustellen. So genannte Nukleokapsid-Proteine helfen, die neuen Viren zusammenzufügen. Diese treten anschließend aus der Zelle aus, und der Ablauf beginnt von vorne. Um diese Vermehrungsstrategie zu stören, suchen Forscher nach passenden Molekülen, die an beteiligte Proteine – etwa das Spike-Protein – binden und sie dadurch ihrer Funktion berauben. Der so beschriebene Wirkmechanismus könnte die Grundlage für ein Medikament gegen Covid-19 sein.

Dieser Prozess ist sehr rechenintensiv, schon allein wegen der Anzahl der Moleküle, die als potenzielle Wirkstoffe in Frage kommen. Gesucht wird eine organische Verbindung, die hauptsächlich aus Kohlenstoff (C) und Wasserstoff (H) besteht.

Die Menge aller Kandidaten, auf die diese Kriterien zutreffen, beziffern Fachleute auf die unvorstellbar große Zahl von mehr als 10⁶⁰. Zum Vergleich: Unser Planet Erde enthält schätzungsweise rund 10⁵⁰ Atome. Es ist also unschwer zu erkennen, dass sich niemals alle potenziellen Liganden untersuchen, geschweige denn herstellen lassen. Die Zeit für die Berechnung einer typischen Docking-

Prozedur eines Moleküls an ein Protein hängt von etlichen Faktoren ab: darunter von Software, Hardware, Einstellungsparametern und dem Aufbau der individuellen Liganden. Die Zeit, die eine Rechnereinheit (englisch: central processing unit, kurz CPU) für die Aufgabe benötigt, variiert daher zwischen fünf Sekunden und fünf Minuten. Bei einem optimierten System mit einer durchschnittlichen Rechenzeit von zehn Sekunden für einen Passungstest wäre eine einzelne CPU in der Lage, pro Tag knapp 9000

Liganden zu überprüfen. Natürlich ist die virtuelle Suche nicht begrenzt auf eine einzige CPU. Allerdings fehlte bislang die richtige Software, die »ultragroße« Moleküldatenbanken mit mehr als 100 Millionen Liganden selbstständig und effizient durchforsten kann.

Vor ungefähr sechs Jahren begannen wir daher mit der Entwicklung einer vielseitigen Open-Source-Plattform namens VirtualFlow. 2020 stellten wir das fertige Werk in der Fachzeitschrift »Nature« vor. Im Grunde besteht unser Programm aus zwei Modulen: VirtualFlow for Ligand Preparation (VFLP) und VirtualFlow for Virtual Screening (VFVS) (siehe »Die Screening-Plattform VirtualFlow«). VFLP bereitet zunächst Milliarden von Molekülen für das Screening vor.

Das Modul unterstützt dabei ungefähr 100 verschiedene chemische Dateiformate, in denen die aufbereiteten Liganden gespeichert werden können. Ist eine Datenbank von VFLP einmal erstellt, kann VFVS damit beliebig viele Proteine testen. Identifiziert VirtualFlow passende Liganden, kann man das Schlüssel-Schloss-Paar durch Laborexperimente verifizieren. So erhält der Anwender am Ende ein oder mehrere potenzielle Wirkstoffmoleküle.

Das Programm lässt sich auf Supercomputern und anderen Hochleistungsrechnern wie der Google Cloud Platform ausführen. Solche Systeme stellen sehr viele CPUs zur Verfügung und können daher zahlreiche Aufgaben parallel bewältigen. Ein großer Vorteil von VirtualFlow ist, dass es linear mit der Anzahl der verwendeten CPUs skaliert. Das bedeutet: Verdoppelt man die Menge der verwendeten CPUs, lassen sich auch doppelt so viele Moleküle pro Stunde testen. In der Praxis ist solch eine Verfahrensweise aber meist nur schwer umzusetzen. Und zwar, weil man normalerweise die Prozesse, die parallel auf den unterschiedlichen CPUs ausgeführt werden, aufeinander abstimmen muss. Dazu sind Koordination und Kommunikation zwischen den Einheiten notwendig, was wiederum Ressourcen kostet und letztlich den Rechenprozess erheblich verlangsamt.

Bei VirtualFlow entfällt diese Abstimmung jedoch, stattdessen wird jedem Prozess – in der Regel einer pro CPU – zu Beginn eine feste Anzahl an zu testenden Liganden zugeordnet. Sobald eine Aufgabe beendet ist, startet eine neue. Die Prozesse sind also voneinander unabhängig, und verschiedene CPUs müssen nicht miteinander kommunizie­ ren. Experten sprechen von einem so genannten Aufgabenlisten-Ansatz. Dank diesem skaliert unser Programm vollkommen linear. In Zahlen bedeutet das: Beim Einsatz von 100 000 CPUs kann VirtualFlow eine Milliarde Liganden in rund 30 Stunden testen, wie wir in der »Nature«-Publikation gezeigt haben. In der Google Cloud lief unser Programm bereits erfolgreich mit bis zu 160 000 CPUs. Damit lassen sich in der gleichen Zeit zwei bis drei Größenordnungen mehr Moleküle testen als mit bisherigen Ansätzen.

Beim Coronavirus suchten wir mittels VirtualFlow nach Liganden für 40 verschiedene Bindungsstellen an 15 der 29 bekannten Sars-CoV-2-Proteine und an 2 menschlichen Proteinen, die das Virus verwendet. Die Hoffnung ist, dass darunter Kandidaten sind, die durch Kopplung eine Replikation des Virus unterbinden können. Der Suchmaschinenkonzern Google stellte uns dafür rund 100 Millionen CPU-Stunden in seiner Cloud zur Verfügung. So war es möglich, innerhalb weniger Wochen für alle 40 Bindungsstellen ein oder mehrere virtuelle Screenings durchzuführen und jeweils mehr als eine Milliarde Liganden zu testen. Für alle untersuchten Bindungsstellen fanden wir viel versprechende Moleküle.

Sie sind nun unter https://vf4covid19.hms.harvard.edu frei zugänglich. Dort kann sich jeder umfassende Ligandenlisten herunterladen und diejenigen 1000 Moleküle erforschen, die am besten passen. In einer interaktiven dreidimensionalen Ansicht lässt sich etwa nachvollziehen, wie das Molekül an das Protein bindet. Kolleginnen und Kollegen an der Harvard Medical School in Boston und an den National Emerging Infectious Diseases Laboratories (NEIDL), einer biowissenschaftlichen Einrichtung der Boston University, experimentieren bereits mit den von uns gefundenen Kandidaten. Wir hoffen sehr, dass inzwischen weitere Forschungsgruppen auf Basis unserer Ergebnisse eigene Tests und Versuche durchführen.

Parallel zur Entwicklung von VirtualFlow vermeldete das Unternehmen DeepMind von Google im Herbst 2020 einen wichtigen Fortschritt im Bereich der Molekularbiologie:

Wie kommen die Moleküle in den Rechner?

Um mit Wirkstoffmolekülen und Zielproteinen virtuell arbeiten zu können, benötigt man ein mathematisches Modell dieser Objekte, das sich als digitales Format abspeichern lässt. Ein häufig verwendetes Format ist dabei das so genannte »PDB-Format«, das bereits 1976 entwickelt wurde.

Proteine sind, wie auch die Wirkstoffmoleküle, aus einer Vielzahl von Atomen aufgebaut. Jedes einzelne Atom wird im PDB-Dateiformat über Buchstaben und Zahlen charakterisiert – zum Beispiel folgendermaßen:

»ATOM 2 CA PRO A 1 7.608 20.729 20.336 1.00 17.44 C«

Das »C« am Ende der Zeile steht für Kohlenstoffatom. Die Text­

Einträge beschreiben gewissermaßen die Rolle des C-Atoms innerhalb des Proteins. So kann man ablesen, dass es um das »2«-te Atom geht. »CA« besagt, dass es sich um einen so genannten Alpha-Kohlenstoff handelt, der bestimmte chemisch-physikalische Eigenschaften aufweist.

Das Kohlenstoffatom wiederum ist Teil der Aminosäure »PROlin«. Sie ist die erste Aminosäure (1) in der »A«-Kette des Proteins. Das gibt etwa Aufschluss darüber, wie stark dieses Kohlenstoffatom mit anderen interagiert. Die ersten drei der insgesamt fünf darauf folgenden Zahlen geben die x-, y- und z-Koordinate des Atoms im dreidimensionalen Raum wieder. (Der Punkt entspricht dem deutschen Komma, und die Koordinaten stehen für eine definierte

Ausrichtung des Moleküls.) Kennt man die Koordinaten aller beteiligten Atome – sowohl des Proteins als auch des Wirkstoffmoleküls –, dann lassen sich ihre Wechselwirkungen in Abhängigkeit des jeweiligen Abstands r berechnen (in der Zeichnung der Abstand zwischen den Atomen C und O).

Die beiden letzten Zahlen im Programmcode konkretisieren in diesem Zusammenhang die Berechnung.

Die Screening-Plattform VirtualFlow

Viele Medikamente basieren auf der Kopplung eines Ligandenmoleküls an ein Protein. Das Programm der Autoren kann virtuell prüfen, ob die beiden Strukturen zusammenpassen. Um eine große Anzahl an Liganden zu testen, müssen verschiedene Eigenschaften eingespeist werden – etwa ihre dreidimensionale Struktur. VirtualFlow hat zu diesem Zweck zwei Module:VirtualFlow for Ligand Preparation (VFLP) bereitet Milliarden von Molekülen für das anschließende Screening mit VirtualFlow for Virtual Screening (VFVS) vor. VFLP unterstützt dabei ungefähr 100 verschiedene chemische Dateiformate, in denen es die aufbereiteten Liganden speichern kann. Wurde eine Moleküldatenbank mit VFLP einmal erstellt, kann das VFVS damit beliebig viele Proteine testen. Die Struktur des zu prüfenden Proteins kann entweder aus einer Datenbank entnommen oder mit Hilfe einer künstlichen Intelligenz (KI, etwa AlphaFold 2) ermittelt werden. Sind passgenaue Liganden gefunden, lässt sich in Laborexperimenten deren Kopplung verifizieren. So erhält man schließlich potenzielle neue Wirkstoffmoleküle.

Seiner künstlichen Intelligenz namens AlphaFold 2 war es gelungen, Eiweißstrukturen in vielen Fällen präzise vorherzusagen. Im Juli 2021 machte das Team um den Chefentwickler Demis Hassabis dann den Quellcode des Programms öffentlich, so dass nun im Prinzip jeder mit genügend Fachkenntnis die Architektur von Proteinen berechnen kann. Zusätzlich sind seither die Ergebnisse der KI auf einer öffentlichen Datenbank im Internet zugänglich. Man findet dort die Strukturen fast aller knapp 24 000 Proteine des menschlichen Körpers sowie die etlicher anderer Organismen. Die Menge der gelisteten Proteinstrukturen wird ständig erweitert und soll bald über 100 Millionen betragen.

Bislang kamen zur Bestimmung des räumlichen Aufbaus in erster Linie experimentelle Methoden zum Einsatz. Das zog sich aber mitunter über mehrere Jahre oder gelang gar nicht. Für viele wichtige Proteine fehlte daher das Wissen über ihr dreidimensionales Aussehen. Seit Jahrzehnten versucht die Fachwelt deshalb, Proteinstrukturen mittels Computerprogrammen vorherzusagen. Lange mangelte es den Ergebnissen jedoch an Genauigkeit. Mit AlphaFold 2 hat sich das nun geändert. Die KI ist somit die ideale Ergänzung für VirtualFlow. Dank ihr lassen sich mit unserem Programm jetzt auch Wirkstoffkandidaten für zahlreiche Proteine aufspüren, deren Struktur bisher unbekannt war. Diese Fortschritte lassen hoffen, dass Medikamente mit Hilfe virtueller Suchen künftig deutlich schneller zu entwickeln sind. Denn wie die aktuelle Coronakrise zeigt, bleibt in einer Pandemie dafür nicht viel Zeit.

QUELLEN

Callaway, E.: »It will change everything«: DeepMind’s AI makes gigantic leap in solving protein structures. Nature 588, 2020

Gorgulla, C. et al.: An open-source drug discovery platform enables ultra-large virtual screens. Nature 580, 2020

Gorgulla, C. et al.: A multi-pronged approach targeting SARS-CoV-2 proteins using ultra-large virtual screening. iScience 24, 2021

Koshland, D. E.: Application of a theory of enzyme specificity to protein synthesis. PNAS 44, 1958

WEBLINK https://virtual-flow.org VirtualFlow im Internet