Weiterlesen mit NEWS. Jetzt testen.
Lesezeit ca. 18 Min.

DAS GEHEIMNIS DER PROTEINFALTUNG


Spektrum der Wissenschaft - epaper ⋅ Ausgabe 10/2021 vom 18.09.2021

Artikelbild für den Artikel "DAS GEHEIMNIS DER PROTEINFALTUNG" aus der Ausgabe 10/2021 von Spektrum der Wissenschaft. Dieses epaper sofort kaufen oder online lesen mit der Zeitschriften-Flatrate United Kiosk NEWS.

Bildquelle: Spektrum der Wissenschaft, Ausgabe 10/2021

MODELL VON INSULIN Insulin ist ein so genanntes Proteohormon ? also ein Hormon, das aus einer langen, gefalteten Kette aus Aminosäuren besteht. Im Körper ist es dafür verantwortlich, den Blutzuckerspiegel zu senken.

Gunnar Schröder ist Professor für Molekulare Biophysik an der Universität Düsseldorf und Leiter der Gruppe »Computational Structural Biology« am Forschungszentrum Jülich.

spektrum.de/artikel/1913893

Im Sommer 2020 versetzte eine Nachricht die biowissenschaftliche Gemeinschaft – mich eingeschlossen – in Aufregung: Einer künstlichen Intelligenz (KI) namens AlphaFold2 war es gelungen, die Struktur von etlichen Eiweißmolekülen mit bis dahin unerreichter Genauigkeit vorherzusagen. Seit 1994 messen sich Forschergruppen aus aller Welt auf einem alle zwei Jahre stattfindenden Wettbewerb namens Critical Assessment of Protein Structure Prediction, kurz CASP. Alle Teilnehmer bekommen Sequenzen aus Aminosäuren vorgelegt. Anhand dieser müssen sie dann die dreidimensionale Architektur des zugehörigen Proteins prognostizieren.

Aminosäuren bilden die Grundbausteine von Proteinen; sie formen lange Ketten, die sich ...

Weiterlesen
epaper-Einzelheft 5,99€
NEWS 30 Tage gratis testen
Bereits gekauft?Anmelden & Lesen
Leseprobe: Abdruck mit freundlicher Genehmigung von Spektrum der Wissenschaft. Alle Rechte vorbehalten.
Lesen Sie jetzt diesen Artikel und viele weitere spannende Reportagen, Interviews, Hintergrundberichte, Kommentare und mehr aus über 1000 Magazinen und Zeitungen. Mit der Zeitschriften-Flatrate NEWS von United Kiosk können Sie nicht nur in den aktuellen Ausgaben, sondern auch in Sonderheften und im umfassenden Archiv der Titel stöbern und nach Ihren Themen und Interessensgebieten suchen. Neben der großen Auswahl und dem einfachen Zugriff auf das aktuelle Wissen der Welt profitieren Sie unter anderem von diesen fünf Vorteilen:

  • Schwerpunkt auf deutschsprachige Magazine
  • Papier sparen & Umwelt schonen
  • Nur bei uns: Leselisten (wie Playlists)
  • Zertifizierte Sicherheit
  • Freundlicher Service
Erfahren Sie hier mehr über United Kiosk NEWS.

Mehr aus dieser Ausgabe

Titelbild der Ausgabe 10/2021 von DURCHBRUCH BEIM PROTEIN-ORIGAMI. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
DURCHBRUCH BEIM PROTEIN-ORIGAMI
Titelbild der Ausgabe 10/2021 von METALLISCHES WASSER IST GOLDEN. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
METALLISCHES WASSER IST GOLDEN
Titelbild der Ausgabe 10/2021 von EIN HAARDÜNNER LASERSCANNER. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
EIN HAARDÜNNER LASERSCANNER
Titelbild der Ausgabe 10/2021 von GAB ES TIERE SCHON VOR 890 MILLIONEN JAHREN?. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
GAB ES TIERE SCHON VOR 890 MILLIONEN JAHREN?
Titelbild der Ausgabe 10/2021 von ENTSTEHT HIER EIN EXOMOND?. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
ENTSTEHT HIER EIN EXOMOND?
Titelbild der Ausgabe 10/2021 von DIE KARTIERUNG DES ALLS. Zeitschriften als Abo oder epaper bei United Kiosk online kaufen.
DIE KARTIERUNG DES ALLS
Vorheriger Artikel
ABGESANG DER FRÖSCHE
aus dieser Ausgabe
Nächster Artikel WARUM WOLKEN SCHWEBEN
aus dieser Ausgabe

... zu äußerst komplexen Gebilden falten. Erst die einzigartige räumliche Struktur definiert die Funktion eines solchen Moleküls. Daher ist Kenntnis darüber in vielen Bereichen der Biologie und Medizin von hohem Interesse. Allerdings stellt die Vorhersage der Proteinfaltung lediglich anhand der Aminosäuresequenz Fachleute seit Jahrzehnten vor große Schwierigkeiten. Es war sogar lange nicht einmal klar, ob die Informa­ tion über die Abfolge der einzelnen Bestandteile überhaupt ausreicht, um die finale Gestalt eines Eiweißmoleküls exakt zu bestimmen.

SERIE

Von der Molekülstruktur zum Medikament

Teil 1: Oktober 2021 Das Geheimnis der Proteinfaltung Gunnar Schröder

Teil 2: November 2021 Neue Medikamente dank Supercomputern Konstantin Fackeldey, Christoph Gorgulla und Marcus Weber

Teil 3: Dezember 2021 Wirkstoffe der Zukunft Rowan Jacobsen

Im Jahr 2018 nahm dann erstmals die KI »AlphaFold« am CASP-Wettstreit teil. Programmiert wurde das System von der Firma DeepMind des Google-Konzerns Alphabet, die sich auf die Entwicklung von KIs spezialisiert hat. Bis dahin war DeepMinds Zugang aber eher »spielerischer«

Natur gewesen. Bekannt wurde etwa das System »AlphaGo Zero«, das in dem Strategiespiel Go den weltbesten Spieler förmlich vernichtet hatte. Mit AlphaFold begab man sich nun auf neues Terrain – und das mit durchschlagendem Erfolg: Bei 24 von 43 Aminosäureketten konnte die KI die dreidimensionale Architektur ziemlich genau vorhersagen, was ihr den Sieg einbrachte.

Völlig überraschend kam die beeindruckende Leistung des Nachfolgeprogramms im Jahr 2020 also nicht. Alpha­ Fold2 toppte allerdings das Ergebnis seines Vorgängers nochmals deutlich: Bei insgesamt 88 von 97 Proteinen konnte das System die dreidimensionale Struktur am präzisesten bestimmen. Für die Bewertung der vorhergesagten Strukturen wird vor allem der Global Distance Test (GDT) verwendet. Er gibt an, wie ähnlich sich zwei Faltungen sind, in diesem Fall die bereits bekannte und die vom Algorithmus berechnete für dasselbe Protein. Ein GDT von 0 bedeutet, dass die Formen keine Ähnlichkeit haben, und ein GDT von 100, dass sie identisch sind. AlphaFold2 erreichte für mehr als die Hälfte der Strukturen einen GDT von 92 und mehr. Eine höhere Genauigkeit erzielen auch die aufwändigen Labortechniken nicht (siehe »Experimentelle Methoden zur Proteinstrukturbestimmung«). Für fast 90 Prozent aller Testproteine lag der GDT über 80. Andere Computeransätze waren in den vorherigen Wettbewerben immer weit von der Präzision solcher praktischen Methoden entfernt gewesen. Und auch AlphaFold hatte noch 2018 diese Genauigkeit nur bei zwei Prognosen erreicht.

Im Juli 2021 machte die Forschergruppe um den Chefentwickler Demis Hassabis von DeepMind schließlich den Quellcode ihrer Software öffentlich. Somit kann nun jeder mit ausreichend Expertise die KI nutzen und weiterentwickeln. Zusätzlich präsentierte das Team umfangreiche Ergebnisse ihrer KI, nämlich so gut wie alle Strukturen der Proteine des menschlichen Körpers (siehe »Datenbank des Lebens«). Die neuen Einblicke und Ergebnisse könnten zu etlichen Durchbrüchen in der Medizin und Biotechnologie führen und veranlassten die Forschercommunity zu wahren Begeisterungsstürmen.

Die Euphorie wird verständlich, wenn man das wesentliche Ziel der Biologie betrachtet – das Leben in all seinen Facetten zu verstehen. Zu dem Zweck studieren Forschergruppen weltweit auf ganz verschiedene Art die kleinsten Bausteine des Lebens, die Zellen. Bereits seit mehr als 300 Jahren lassen sich diese mit Lichtmikroskopen beobachten. Das reicht allerdings nicht aus, um das Funktionsprinzip des Lebens zu entschlüsseln. Dazu muss man schon zu den Details dieser kleinsten lebenden Einheiten vordringen.

Richard Feynman, einer der berühmtesten Wissenschaftler des 20. Jahrhunderts, sagte einst: »[…] everything that living things do can be understood in terms of the jigglings and wigglings of atoms.« Das Verhalten von lebenden Dingen könne also durch die Bewegung, das Wackeln von Atomen verstanden werden. Wir Biophysiker und Strukturbiologen studieren dafür aus vielen Atomen zusammengesetzte Moleküle, darunter Erbgutstränge wie DNA und RNA, Proteine, Lipide, Zucker und Botenstoffe. All diese Biomoleküle sind für lebende Organismen von entscheidender Bedeutung.

Proteinstruktur

Ein Protein ist eine lange Kette aus Aminosäuren, die auf eine ganz bestimmte Weise räumlich gefaltet ist. Die Reihenfolge der verschiedenen Aminosäuren ist in einem entsprechenden Gen festgelegt, also einem Abschnitt der DNA.

Ein Gen ist somit im Wesentlichen ein Bauplan für ein Protein. Die Aminosäurekette faltet sich nun derart, dass jedes Atom dieses langen Biomoleküls seinen exakten Platz findet. Die dreidimensionale Architektur entspricht der energetisch günstigsten Anordnung der Atome des Proteins im Raum und ist bereits durch die Aminosäuresequenz festgelegt. Das Bild zeigt die visualisierte Form des Proteins Aktin. Es ist Teil eines Aktin-Filaments, das in der Zelle sowohl für die mechani­ sche Stabilität sorgt als auch an der Kontraktion von Muskelzellen zentral beteiligt ist. Das Modell wurde vom Team des Autors mit Hilfe von Bilddaten angefertigt, die mit einem Kryoelektronenmikroskop aufgenommen wurden.

Das Rückgrat des Proteins sind die breiteren Beta-Faltblatt-Strukturen und so genannten Alpha- Helizes (Spiralen). Die Farben von Blau (Anfang) über Grün, Gelb, Orange nach Rot (Ende) verlaufen entlang der Aminosäurekette. In der Mitte ist das gebundene ADPMolekül und daneben ein Magnesiumion als Kügelchen gezeigt. Einzelne Atome des Proteins sind in dieser Art der Darstellung der Übersichtlichkeit halber nicht abgebildet.

Die wohl zentralste Rolle spielen hier die Proteine. Der Anschaulichkeit wegen benutzen wir für sie gern die bildlichen Begriffe »Werkzeuge der Zelle« oder »zelluläre Maschinen«. Proteine treiben zum Beispiel unsere Muskeln an, transportieren Sauerstoff durch unser Blut, kämpfen als Antikörper gegen Krankheitserreger, verdauen als Enzyme Nahrung oder leiten Stromimpulse durch Nervenzellen. An den allermeisten Vorgängen in unserem Körper sind sie beteiligt. Wenn es also darum geht, das Leben zu erforschen, fällt der Blick zwangsläufig auf diese omnipräsenten Eiweißmoleküle.

Optimal wäre es, eine komplette menschliche Zelle mit einer Auflösung von einem zehntel Nanometer – das ist der zehnmillionste Teil eines Millimeters – abbilden zu können. So würde man die einzelnen Atome in den enthaltenen Biomolekülen erkennen können und damit auch deren dreidimensionale Struktur. Doch davon sind selbst die modernsten Mikroskopietechniken noch ein ganzes Stück entfernt.

Experimente zur Bestimmung der Struktur dauern oft sehr lange

Atomare Auflösung lässt sich allerdings erzielen, wenn die Proteine isoliert untersucht werden; dazu gibt es verschiedene experimentelle Methoden. Die Techniken sind aber in der Regel sehr aufwändig, und der Prozess kann sich über mehrere Monate, manchmal Jahre ziehen. Aus diesem Grund versuchen Fachleute seit Jahrzehnten, die dreidimensionale atomare Struktur von Proteinen allein aus deren Aminosäuresequenz theoretisch vorherzusagen. Dieses so genannte Proteinfaltungsproblem gilt als der heilige Gral der Molekularbiologie, da uns eine zuverlässige Lösungsstrategie schlagartig dem Traum vom hoch aufgelösten Bild einer ganzen Zelle deutlich näherbrächte. Aus diesem Grund hat das Ergebnis von AlphaFold2 so viele positive Reaktionen in der biowissenschaftlichen Gemeinschaft ausgelöst.

Die Vorhersage von Proteinstrukturen ist indessen nicht nur für die molekularbiologische Grundlagenforschung von großer Bedeutung, sondern auch für die Entwicklung neuer Medikamente. Die meisten Arzneimittel wirken, indem sie sich direkt an ein bestimmtes Eiweißmolekül binden und dadurch dessen Funktion beeinflussen. Das kann eine Blockade genauso wie eine Verstärkung der Proteinwirkung sein. Dazu braucht es ein Wirkstoffmolekül, das passgenau an das Eiweiß andocken kann. Voraussetzung für die Suche nach geeigneten Kandidaten ist daher die Kenntnis der molekularen Architektur des betreffenden Proteins.

Darüber hinaus wissen Ärzte mittlerweile, dass eine unkontrollierte Anhäufung von fehlerhaft gefalteten Eiweiß­ molekülen mit einer Reihe von Erkrankungen in Verbindung steht. Prominente Beispiele dafür sind vor allem neurodegenerative Krankheiten wie die Alzheimer- oder die Parkinsondemenz, aber auch Typ-2-Diabetes. In diesem Zusammenhang gilt es zu verstehen, wie es zu fehlerhaften Faltungen kommen kann und was sie bewirken.

Zusätzlich entwickelt sich im Moment das Gebiet des Protein-Designs. Hier stehen die Forschenden vor der umgekehrten Herausforderung; sie suchen diejenige Aminosäuresequenz, die sich in eine vorgegebene Struktur formt. Obwohl diese Technik noch ziemlich am Anfang steht, gibt es bereits eine Vielzahl von Anwendungen. Dazu zählt unter anderem die Entwicklung neuer Materialien mit fein justierbaren Eigenschaften, etwa nach dem Vorbild von Seide und Spinnweben, die aus Proteinen bestehen. Daneben konstruieren Biotechnologen bestimmte Enzyme, die zur industriellen Produktion von Chemikalien nützlich sind.

Oder Biowissenschaftler bauen aus den Molekülen winzige Nanomaschinen, die künftig im Verborgenen verschiedenste Arbeiten verrichten könnten. Unter Medizinforschern wird außerdem das Design von Antikörpern hoch gehandelt sowie das von Proteinkäfigen, die Wirkstoffe nur an einem ganz speziellen Ort im Körper abgeben. Vorstellbar wären auch komplexere Pharmaka, die sich beispielsweise situationsabhängig ein- beziehungsweise ausschalten lassen.

Für all diese Designansätze ist eine zuverlässige und effiziente Strukturvorhersage wie die von AlphaFold2 von großem Vorteil.

Doch wie schaffte es die KI, das Problem zu lösen? Die Antwort auf die Frage führt zunächst über den verwendeten Ansatz zur Vorhersage. Grob gesagt gibt es zwei Typen: Der erste basiert auf Wissen, der andere auf Physik. Beim wissensbasierten Vorgehen nutzt man alle bereits bekannten Informationen über Proteine, um daraus abzuleiten, wie bisher unbekannte Exemplare möglicherweise aussehen. Zum ersten großen Durchbruch kam es hier vor etwa zehn Jahren, als sich Methoden etablierten, mit denen man korrelierte Mutationen bestimmen konnte.

AUF EINEN BLICK KÜNSTLICHE INTELLIGENZ SAGT PROTEINSTRUKTUREN VORHER

1 Proteine sind fundamentale Bausteine des Lebens. Ihre komplexen dreidimensionalen Formen definieren ihre jeweilige Funktion.

2 Ist die Faltung dieser Eiweißketten fehlerhaft, kann das zu Krankheiten führen. Viele Medikamente nutzen außerdem Proteine als Angriffspunkte.

3 Bislang waren aufwändige Experimente notwendig, um die Architektur der Moleküle zu bestimmen – nun gelingt das auch im Virtuellen. Eine riesige Anzahl an Strukturen ist im Internet bereits frei verfügbar.

Im Allgemeinen bezeichnen Mutationen den zufälligen Wechsel einzelner Aminosäuren in der Molekülkette. Solche Änderungen können miteinander korreliert sein, wenn der Austausch einer Aminosäure auch weitere Änderungen in der Kette hervorruft. Zum Beispiel führt die Ersetzung einer kurzen Aminosäure durch eine längere dazu, dass im Protein der Platz knapp wird. In manchen Fällen wird daher im Gegenzug in der Nachbarschaft eine größere durch eine kleinere Aminosäure ersetzt. Andernfalls wäre das Protein womöglich nicht mehr stabil oder funktionsfähig.

Auf solche korrelierten Mutationen lässt sich durch den Vergleich mit ähnlich angeordneten Sequenzen in anderen Proteinen schließen. Da die Genomsequenzierung immer einfacher und schneller geht, sind mittlerweile bereits mehr als 2,4 Milliarden Sequenzen bekannt. Damit lassen sich für viele Proteine solche Nachbarschaftsbeziehungen bestimmen und daraus räumliche Informationen ableiten. Letztere liefern schließlich oftmals ausreichend Hinweise, um die dreidimensionale Struktur eines Proteins zumindest näherungsweise berechnen zu können. Dieses Vorgehen gab der Strukturprognose plötzlich viel Auftrieb und erhöhte die Qualität der Vorhersagen enorm.

Experimentelle Methoden zur Proteinstrukturbestimmung

1) Röntgenkristallografie:

Für die Anwendung der Technik müssen die Proteine zunächst in Form von regelmäßigen Kristallen vorliegen. Diese Kristalle werden dann einem Röntgenstrahl ausgesetzt, typischerweise in einem Synchrotron, also einem ringförmigen Teilchenbeschleuniger. Die entstehenden Beugungsmuster des Röntgenlichts geben Aufschluss über die Anordnung der Atome im Kristall. Es können Auflösungen von unter 0,1 Nanometer erreicht werden, das entspricht dem Abstand zwischen zwei Atomen. Die Schwierigkeit besteht vor allem darin, hochgeordnete Kristalle zu gewinnen. Das ist in der Regel unproblematisch bei kleinen, starren Proteinen, wohl aber eine Herausforderung bei großen Proteinen und Proteinkomplexen, die häufig auch flexibel sind. Insbesondere Membranproteine sind schwierig zu untersuchen, da sie typischerweise von einer ungeordneten Lipidschicht umgeben sind, die sich nicht einfach entfernen lässt, ohne dass das Protein verklumpt. Für die Erfindung der Methode erhielten Max Perutz und John Kendrew (MRC Laboratory of Molecular Biology) 1962 den Nobelpreis für Chemie. Etwa 90 Prozent aller bisher bekannten Proteinstrukturen wurden mit dieser Methode entschlüsselt.

2) Kernspinresonanz-Spektroskopie:

Die Kernspinresonanz-Spektroskopie (englisch: nuclear magnetic resonance, kurz NMR) registriert die magnetischen Momente der Atomkerne. Diese Größe hängt sehr empfindlich von den Atomen in der Nachbarschaft ab. Durch geschickte Pulsexperimente lassen sich die Magnetisierungen bestimmter Kerne auf weitere Kerne übertragen. So kann man auf Nachbarschaftsbeziehungen von Atomen schließen und daraus dann die atomare dreidimensionale Anordnung berechnen. Ein großer Vorteil dieser Methode gegenüber anderen Techniken ist, dass die Proteine hier bei Raumtemperatur frei in wässriger Umgebung vorliegen und somit auch die natürliche Dynamik der Proteine untersucht werden kann. Doch die Größe der zu untersuchenden Moleküle ist begrenzt, weil die Auswertung der komplexen Resonanzspektren für große Proteinkomplexe wegen vieler überlappender Resonanzpeaks nahezu unmöglich ist. Für die Entwicklung der magnetischen Kernspinresonanz erhielt der Chemiker Richard R.

Ernst von der ETH Zürich 1991 den Nobelpreis für Chemie. Der Biophysiker Kurt Wüthrich verwendete an der gleichen Hochschule die Methode zur Strukturaufklärung von Proteinen und wurde dafür 2002 ebenfalls mit dem Nobelpreis für Chemie ausgezeichnet.

3) Kryoelektronenmikroskopie:

Bei dieser relativ jungen Technik werden die Proteine in einer extrem dünnen Wasserschicht (maximal 200 Nanometer dick) derart schnell eingefroren, dass das Wasser nicht kristallisieren kann. Damit sind die Makromoleküle in nahezu natürlicher Umgebung eingefangen und behalten ihre Form auch in der Vakuumkammer, in der sie mit Elektronen bestrahlt werden. In der Regel werden mit dem Mikroskop viele Bilder von Proteinen gemacht, die zufällig orientiert in dieser Wasserschicht liegen. Allerdings zerstört ein Elektronenstrahl die Biomoleküle relativ schnell, weshalb nur eine sehr geringe Dosis verwendet werden kann.

Das führt zu einem sehr schlechten Signal-zu-Rausch­ Verhältnis. Aus den verrauschten Einzelbildern rekonstruiert anschließend eine Software die dreidimensionale Struktur. Ein entscheidender Vorteil ist, dass man mit der Methode sehr große Proteinkomplexe untersuchen kann. Zudem lassen sich verschiedene Strukturzustände voneinander getrennt bestimmen, da tatsächlich Bilder individueller Moleküle ausgewertet werden können. Im Gegensatz dazu muss man sowohl bei der Kristallografie als auch bei der NMR-Spektroskopie stets über alle Proteine in der Probe mitteln. Im Jahr 2017 wurden der Molekularbiologe Richard Henderson und die beiden Biophysiker Joachim Frank (Columbia University) und Jacques Dubochet (EPFL Lausanne) für die Entwicklung der Kryoelektronenmikroskopie mit dem Nobelpreis für Chemie ausgezeichnet.

Ausgehend davon hat DeepMind in den letzten Jahren mit Hochdruck an einem neuen Vorhersage-Algorithmus gearbeitet, der vorrangig auf einer Methode aus der künstlichen Intelligenzforschung beruht, dem so genannten Deep Learning, zu Deutsch mehrschichtiges oder tiefes Lernen.

Diese spezielle Art der Informationsverarbeitung beruht wiederum auf dem so genannten maschinellen Lernen, bei dem künstliche neuronale Netze sich selbstständig immer stärker strukturell vernetzen und so bestimmte Probleme zunehmend besser lösen können. Sie lernen also von sich aus dazu.

Während bisherige Methoden zur Vorhersage der Proteinfaltung KI nur für Teilschritte verwendet haben, um mit den so gewonnenen Informationen dann klassische Modellierungsverfahren zu füttern, setzt AlphaFold2 auf die End-to-end-Vorhersage. Das bedeutet, dass die KI alle Arbeitsschritte selbst erledigt: Sie liest die Aminosäuresequenzen ein und gibt am Ende alle Koordinaten der enthaltenen Atome aus. Dazu wurde AlphaFold2 mit rund 170 000 bekannten Proteinstrukturen unter Einbeziehung der evolutionären, physikalischen und geometrischen Einschränkungen bezüglich der molekularen Architektur trainiert. Auf diese Weise lernte das Programm sowohl allgemeine Prinzipien des Aufbaus von Eiweißmolekülen als auch den Zusammenhang zwischen Struktur und Sequenz.

Vorgehen der KI ähnelt unserem beim Puzzeln

Die erste Version von AlphaFold hatte noch die Tendenz, die Wechselwirkung zwischen bestimmten Abschnitten in der Sequenz zu stark zu gewichten. Das Nachfolgeprogramm enthält nun einen »Aufmerksamkeitsalgorithmus«, der relevante Daten zusammenbringen und irrelevante herausfiltern kann. Konkret geht es hier um die zahllosen Wechselwirkungen zwischen den Aminosäuren des Proteins. Die Vorgehensweise ähnelt dabei der Art, wie wir Puzzle zusammensetzen: Zunächst verbindet man Teile zu kleineren Stücken und sucht anschließend nach Möglichkeiten, diese zu einem größeren Ganzen zu verbinden. Gleichermaßen bildet das Programm Cluster von Aminosäuren, die signifikant miteinander wechselwirken, und setzt sie dann gewissermaßen zu einem vollständigen Protein zusammen.

Der zu Grunde liegende Programmcode ist seit Juli 2021 öffentlich, und daher kann jetzt im Prinzip jeder anhand von Aminosäuresequenzen die dreidimensionale Struktur von Eiweißmolekülen berechnen. Die Open-Source-Version ist laut einem Beteiligten des AlphaFold-Projekts etwa 16-mal schneller als noch im Jahr 2020. Binnen Minuten oder weniger Stunden spuckt sie die gesuchten Strukturen aus, je nach Größe des Proteins. Für manche Moleküle des CASP-Wettbewerbs rechnete das Programm mitunter noch mehrere Tage lang. Zusätzlich publizierten die Entwickler eindrucksvolle Ergebnisse der KI: Auf einer Internetseite sind frei zugänglich die Strukturen fast aller Proteine des menschlichen Körpers und 20 weiterer Organismen einsehbar (siehe »Datenbank des Lebens«).

Die nächste Herausforderung steht aber bereits vor der Tür: Proteine üben ihre Funktion selten allein aus, sondern sie binden sich ständig an weitere Partnerproteine. Die Zahl aller Protein-Protein-Interaktionen im menschlichen Organismus wird auf 650 000 geschätzt. Allerdings ist bisher nur ein kleiner Bruchteil davon bekannt. Die Struktur solcher Molekülkomplexe zuverlässig vorherzusagen, ist offensichtlich noch schwieriger und auch mit dem AlphaFold-Ansatz noch nicht möglich.

Eine weitere Schwäche der KI-Methode ist, dass damit der Prozess der Faltung nicht zwangsläufig klar wird. Dies würde aber zum Beispiel helfen, zu verstehen, weshalb der Prozess manchmal fehlerhaft abläuft und das bisweilen sogar Krankheiten auslöst. Hier kommt nun der zweite Ansatz zur Strukturvorhersage ins Spiel. Anhand der physikalischen Naturgesetze betrachtet man die im Molekül wirkenden Kräfte zwischen den Atomen. Damit lassen sich dann die Bewegungen der Atome in kleinen Zeitschritten simulieren. So kann man entweder ein Protein bei der Faltung beobachten oder ein bereits gefaltetes bei der Arbeit. Derartige Modellierungen der Molekulardynamik liefern also im Gegensatz zum wissensbasierten Ansatz nicht nur die Strukturen, sondern auch die einzelnen Zwischenschritte, die zum Ziel führen. Der dazu erforderliche Rechenaufwand ist jedoch gigantisch. Abhängig von der Größe des Proteins können selbst Supercomputer nur etwa eine Zeitdauer von 10 bis 100 Nanosekunden pro Tag simulieren. Gleichwohl gab es auf diesem Gebiet in den letzten zehn Jahren erhebliche Fortschritte. 2013 wurde die Entwicklung der Methode gar mit dem Nobelpreis für Chemie ausgezeichnet. Der Bioinformatiker David Shaw hat mit seiner Forschungsfirma DE Shaw Research in New York einen Computer speziell für Simulationen der Molekulardynamik entwickelt, der mehr als 100-mal schneller ist als selbst die besten Supercomputer. Shaw hatte lange Zeit Computerprogramme zum Wertpapierhandel entwickelt und einen der weltweit erfolgreichsten Hedgefonds (DE Shaw & Co) gegründet. Vor 20 Jahren wandte er sich dann wieder der Wissenschaft zu und hat seither viel privates Geld in die Entwicklung des Computers namens ANTON gesteckt (benannt nach dem niederländischen Naturforscher und bedeutendsten Mikroskopiker des 17. und beginnenden 18. Jahrhunderts Antoni van Leeuwenhoek).

Datenbank des Lebens

Im Juli 2021 veröffentlichten Forscherinnen und Forscher um den Chefentwickler Demis Hassabis umfangreiche Ergebnisse ihrer KI Alpha­ Fold2: eine Datenbank, die die Proteinstrukturen fast des gesamten menschlichen Proteoms beinhaltet – also aller im menschlichen Körper vorkommenden Eiweißmoleküle (knapp 24 000). In der wissenschaftlichen Gemeinschaft löste die Nachricht Begeisterung aus, da die Kenntnis über das menschliche Proteom gewissermaßen als Schlüssel zum Verständnis des Lebens gilt. Bisher waren durch jahrzehntelange experimentelle Methoden gerade einmal 17 Prozent davon genau bestimmt, AlphaFold2 erhöhte diesen Anteil nun auf 98,5 Prozent.

Insbesondere in der Medizin öffnen sich dadurch zahlreiche neue Möglichkeiten. So unterstützt DeepMind bereits ausgewählte Organisationen wie etwa die Genfer Initiative Drugs for Neglected Diseases, zu Deutsch Wirkstoffe für vernachlässigte Krankheiten, um für seltene Erkrankungen Behandlungen zu entwickeln. Die Proteinstrukturen helfen hier sowohl die Funktionsweise von Erregern zu verstehen als auch dabei, neue Wirkstoffe zu finden. Neben dem menschlichen sind in der Datenbank bereits 20 weitere Proteome von anderen wichtigen Organismen zu finden; insgesamt sind 365 000 Proteine gelistet. In den kommenden Monaten planen die Verantwortlichen, die Datenbank um einen großen Teil aller katalogisierten Proteine zu erweitern, das sind mehr als 100 Millionen. Die Datenbank wird in Zukunft am Europäischen Laboratorium für Molekularbiologie (EMBL) in Heidelberg betreut und ist hier frei für jeden zugänglich: https://alphafold.ebi.ac.uk

Tunyasuvunakool, K. et al.: Highly accurate protein structure prediction for the human proteome. Nature 596, 2021

ANTON kann die Faltung von mehreren kleinen Proteinen bis zu einer Kettenlänge von 80 Aminosäuren korrekt vorhersagen. Allerdings formen sich solche kleinen Proteine in weniger als 50 Mikrosekunden. Für die routinemäßige Strukturvorhersage von größeren und sich langsamer faltenden Proteinen ist der Rechenaufwand bisher schlichtweg noch zu groß.

Eine Verbindung zwischen Alzheimer und Diabetes?

Fachleute vermuten, dass falsch gefaltete Proteine eine ganze Reihe von Krankheiten auslösen können. In jungen Jahren werden die unbrauchbaren Biomoleküle in der Regel umgehend abgebaut, mit fortschreitendem Alter funktioniert dieser Mechanismus aber immer weniger gut. Mitunter lagern sich nun fehlerhafte Proteine geordnet zusammen und bilden so genannte Fibrillen. Dabei fungieren einige wenige Proteine als Aggregationskern und lösen die Polymerisation mit weiteren Exemplaren aus.

Gemeinsam mit meinen Kollegen vom Forschungszentrum Jülich und der Universität Düsseldorf sowie Wissenschaftlern der Universität Maastricht konnten wir 2017 mit der Kryoelektronenmikroskopie die Struktur von Beta-Amyloid-Fibrillen bestimmen. Diese treten im Gehirn von Alzheimerpatienten auf und hängen vermutlich mit dem geistigen Verfall zusammen. Zwei Jahre später, als wir die Struktur von IAPP-Fibrillen ermittelten, die bei Menschen mit Typ-2-Diabetes in der Bauchspeicheldrüse auftreten, erlebten wir dann eine Überraschung: Der Aufbau der Beta-Amyloid-Fibrillen (blau) und der IAPP­ Fibrillen (gelb) ähnelt sich sehr stark (siehe Abbildung). Und interessanterweise gibt es auch einen epidemiologischen Zusammenhang:

Patienten mit Typ-2-Diabetes haben eine etwa zweifach erhöhte Wahrscheinlichkeit, an Alzheimer zu erkranken. Bislang ist aber noch nicht geklärt, auf welche Weise die beiden Krankheiten zusammenhängen. Eine Antwort findet sich möglicherweise in der Fehlfaltung der beiden Proteine Beta-Amyloid und IAPP. Denn die IAPP-Fibrillen von Diabetespatienten könnten das Beta-Amyloid mittels so genannten »cross-seedings« dazu bringen, sich in Fibrillen zusammenzulagern. Der mutmaßliche Mechanismus würde auf einer direkten Interaktion zwischen unterschiedlichen fehlgefalteten Proteinen beziehungsweise deren Fibrillen beruhen, wenn diese eine gewisse Ähnlichkeit in der Struktur aufweisen. IAPP-Fibrillen würden demnach die Entstehung von Beta-Amyloid-Fibrillen begünstigen, weshalb sich die Wahrscheinlichkeit für eine Alzheimererkrankung erhöhte, wenn man unter Typ-2-Diabetes leidet.

Dennoch ist unser Bild von der Proteinfaltung hauptsächlich geprägt von solchen Moleküldynamik-Simulationen. Keine experimentelle Technik kann in auch nur annähernd vergleichbarer Präzision die einzelnen Schritte aufzeigen. Noch schwieriger ist es, die Faltung von Proteinen in ihrer natürlichen Umgebung innerhalb der Zelle zu untersuchen. Dementsprechend schlecht ist dieser Vorgang bislang verstanden. Sicher ist, dass die meisten Proteine zur Faltung in der Zelle Hilfe in Anspruch nehmen – von so genannten Chaperonen, englisch für Anstandsdame. Chaperone sind Proteinkomplexe, die eine Art Fass mit Deckel bilden. Fachleute gehen davon aus, dass sie dadurch im Inneren eine kontrollierte und geschützte Umgebung schaffen, in der sich die Eiweißmoleküle falten können, ohne mit anderen zu verklumpen. Das kann normalerweise leicht passieren, da das Innere von Zellen mit Proteinen und anderen Molekülen vollgepackt ist. Insbesondere die hydrophoben Abschnitte einer Aminosäurekette neigen in einer solchen Umgebung zum Zusammenkleben. Darüber hinaus gibt es Hinweise darauf, dass Chaperone zusätzlich die korrekte Faltung und Assoziation der Proteine beschleunigen, indem sie die Bewegung der Molekülkette beeinflussen. Von diesen Mechanismen sind aber nur wenige ausreichend gut studiert und dokumentiert.

Fehlfaltung kann sich zwischen Proteinen übertragen

Gleichermaßen lückenhaft ist unser Wissen, was die Fehlfaltung von Proteinen anbelangt. Überraschenderweise handelt es sich dabei in der Regel nicht einfach um eine zufällig falsch zusammengelagerte Struktur, sondern um einen sehr genau definierten so genannten Amyloidzustand. Tatsächlich lagern sich die fehlerhaften Eiweißmoleküle nämlich ordentlich in Schichten zusammen und formen lange, sehr stabile Fibrillen. Letztere können nun weitere Proteine dazu bringen, sich fehlerhaft zu falten und an die Fibrillen zu heften oder neue zu bilden. Dabei reicht offenbar eine gewisse Ähnlichkeit der Struktur aus, um auch Fibrillen eines anderen Proteins wachsen zu lassen.

Fachleute sprechen in dem Zusammenhang von »crossseeding« (siehe auch »Eine Verbindung zwischen Alzheimer und Diabetes?«).

Hier könnte das so genannte Prion-Prinzip ins Spiel kommen. Prionen sind fehlgefaltete Proteine, die gesunden Pendants ihre Konformation aufzwingen können. Sie sind dadurch sogar in der Lage, Krankheiten zu übertragen, ähnlich wie Viren oder Bakterien. Prion ist dementsprechend ein Kofferwort aus »protein« und »infection«. Dieses verblüffende Phänomen beschrieb erstmals Stanley Prusiner von der University of California in San Francisco 1982.

Er entdeckte das Prionprotein (PrP), das die Creutzfeldt­ Jakob-Krankheit sowie BSE auslösen und übertragen kann. Gemäß dem Prion-Prinzip würden womöglich sogar wenige fehlerhafte Proteine ausreichen, um eine unheilvolle Kaskade auszulösen, indem sie zu einer massiven Bildung von Fibrillen führen.

Im Gehirn von Alzheimerpatienten zum Beispiel finden sich massenhaft solche Aggregate, so genannte Plaques aus Beta-Amyloid-Proteinen. Diese Plaques sind laut einer weit verbreiteten Theorie der Endpunkt einer Aggregationskaskade, die für den geistigen Verfall bei den Erkrankten verantwortlich ist. Die Ursache für ihre Entstehung ist aber noch unklar. Ziemlich sicher ist jedoch, dass hier das Prion- Prinzip eine entscheidende Rolle spielt.

Auch Diabetespatienten weisen Ansammlungen falsch gefalteter Eiweißmoleküle auf. In den Betazellen der Bauchspeicheldrüse, die das blutzuckersenkende Hormon Insulin produzieren, lagert sich ein Protein namens IAPP zu Fibrillen zusammen. Das kann zu einem Absterben der Betazellen und zu einem krankhaften Anstieg des Blutzuckers führen.

Auf Grund der Ähnlichkeit der Fibrillenstruktur bei Alzheimer und Typ-2-Diabetes könnte es sogar einen direkten Zusammenhang zwischen den beiden Erkrankungen geben.

Zwar hat die Forschung in den letzten Jahren Fortschritte gemacht hat, was das Verständnis von amyloiden Strukturen anbelangt, doch bezüglich deren Ursachen und Auswirkungen ist das meiste noch unklar. Interessanterweise sind in jüngerer Vergangenheit sogar viele Amyloide entdeckt worden, die konkrete Aufgaben erfüllen. Beispielsweise verwenden Bakterien Amyloide, um einen extrem stabilen und widerstandsfähigen Biofilm zu erzeugen und sich so gegen Austrocknung und Angriffe von außen zu schützen.

Während von »normal« gefalteten Proteinen bereits über 100 000 Strukturen bekannt sind, wurden in den vergangenen drei Jahren mittels Kryoelektronenmikroskopie nur etwas mehr als 70 Amyloidstrukturen bestimmt. Daher funktionieren hier wissensbasierte Strukturvorhersagen, wie sie das AlphaFold-System betreibt, noch nicht. Es stehen schlicht zu wenige Daten für das Training der KI zur Verfügung. Bei diesen bekannten Amyloidstrukturen fällt vor allem auf, dass sich dasselbe Protein auf viele verschiedene Arten in eine Amyloidfibrille falten kann, es also eine Vielzahl von Strukturen einnehmen kann. Welche davon sind aber nun relevant für eine bestimmte Krankheit? Welche sind die Zielstrukturen, gegen die wir Medikamente entwickeln müssen? Auf solche und andere Fragen der Proteinfaltung gilt es künftig dringend Antworten zu finden. Das wird einerseits im Labor geschehen, andererseits aber von nun an auch ganz besonders mit Hilfe der Ergebnisse aus den mächtigen Computersimulationen.

QUELLEN

Gremer, L. et al.: Fibril structure of amyloid-ß(1-42) by cryoelectron microscopy. Science 358, 2017

Jumper, J.: Highly accurate protein structure prediction with AlphaFold. Nature 596, 2021

Lindorff-Larsen, K. et al.: How fast-folding proteins fold. Science 334, 2011

Röder, C. et al.: Cryo-EM structure of islet amyloid polypeptide fibrils reveals similarities with amyloid-ß fibrils. Nature Structural & Molecular Biology 27, 2020

Senior, A. W. et al.: Improved protein structure prediction using potentials from deep learning. Nature 577, 2020