Polyedrische Modelle ikosaedrischer Architektur
Virusstrukturen sind herausragende Beispiele für ikosaedrische Symmetrie in der Biologie. Ihre Architekturen werden derzeit anhand einer Reihe von Goldberg-Polyedern14 – dreidimensionalen Körpern mit fünf- und sechseckigen Flächen – modelliert und klassifiziert, die einen Bezugsrahmen für die Positionen der Kapsidproteine bieten (Abb. 1a). Insbesondere zeigen die polyedrischen Flächen die Positionen der pentagonalen und hexagonalen Proteincluster an, die Pentamere bzw. Hexamere genannt werden. Die gleichen Polyeder liefern auch die Baupläne für die atomaren Positionen der Fulleren-Käfige in der Kohlenstoffchemie, insbesondere für das Buckminster-Fulleren, das als Buckyball1 bekannt ist. Sie sind auch die Blaupausen für die strukturelle Organisation einer Vielzahl von künstlichen und natürlichen Protein-Nanocontainern. Ihre Duale, die geodätischen Polyeder15, sind die architektonischen Entwürfe der geodätischen Kuppeln von Buckminster Fuller.
Goldberg-Polyeder können aus einem sechseckigen Gitter konstruiert werden, indem 12 Sechsecke durch Fünfecke ersetzt werden (Abb. 1b), wie es das Eulersche Theorem erfordert, um eine geschlossene polyedrische Form zu erzeugen16. Der Abstand \(D\) zwischen den Fünfecken an benachbarten fünffachen Scheitelpunkten ist der einzige Freiheitsgrad in dieser Konstruktion und kann daher zur Kennzeichnung der verschiedenen geometrischen Optionen in dieser unendlichen Reihe von Polyedern verwendet werden. \(D\) kann nur bestimmte Werte annehmen, die durch die zugrunde liegende hexagonale Gittergeometrie eingeschränkt sind. Insbesondere erhält man unter Verwendung der hexagonalen Koordinaten \(h\) und \(k\), die beliebige ganzzahlige Werte oder Null annehmen, um zwischen den Mittelpunkten benachbarter Sechsecke im Gitter zu navigieren, die folgende geometrische Einschränkung11:
Hier entspricht \({A}_{0}\) dem Flächeninhalt des kleinsten Dreiecks zwischen beliebigen hexagonalen Mittelpunkten, also dem Fall \(h=1\) und \(k=0\) – oder äquivalent dazu \(h=0\) und \(k=1\). Eine ähnliche Formel wurde für längliche Kapsidstrukturen abgeleitet17.
T wird als Triangulationszahl bezeichnet (Abb. 1c), da sie geometrisch als ikosaedrische Triangulationen interpretiert wird, die durch die Verbindung der Mittelpunkte benachbarter Fünfecke und Sechsecke erhalten werden, d. h. als duale (geodätische) Polyeder. T gibt die Anzahl der Dreiecksflächen, Facetten genannt, in der Triangulation an, die eine Dreiecksfläche des Ikosaeders flächenmäßig bedecken. Die Assoziation einer Proteinuntereinheit mit jeder Ecke einer solchen Dreiecksfacette übersetzt diese unendliche Reihe von Triangulationen in die Capsid-Layouts der Quasiequivalenztheorie (Abb. 1d). Solche Baupläne erlauben nur Capsid-Layouts mit 60T CPs, organisiert in 12 Pentameren und \(10(T-1)\) Hexameren11. Die durch Gl. 1 ausgedrückte Bedingung ist daher eine geometrische Beschränkung der möglichen Werte von T und der möglichen CP-Zahlen in den CK-Geometrien. Die Anfangselemente der Reihe sind \(T=\)1, 3, 4 und 7, so dass die Anzahl der in kleinen ikosaedrischen Kapsiden enthaltenen CPs 60, 180, 240 bzw. 420 beträgt (ergänzende Tabelle 1).
Dies ist jedoch nur eine Möglichkeit, wie eine ikosaedrische Struktur aus Wiederholungen derselben (asymmetrischen) Einheit aufgebaut werden kann, und schließt Geometrien aus, die aus Proteinen unterschiedlicher Größe aufgebaut sind (z. B. ein Haupt- und ein Nebenkapsidprotein) oder Kapsiden, die aus einem Protein aufgebaut sind, in dem eine oder mehrere Domänen unterschiedliche Rollen spielen. Solche Capsid-Layouts müssen aus Gittern konstruiert werden, bei denen jeder Scheitelpunkt in Bezug auf die Länge, die Anzahl und die relativen Winkel seiner vorstehenden Kanten identisch ist, die relativen Winkel zwischen verschiedenen Kanten am gleichen Scheitelpunkt jedoch variieren können, was die Besetzung durch verschiedene Arten von Proteinen oder Proteindomänen widerspiegelt. Aus geometrischer Sicht gibt es nur 11 Gitter (Kapitel 2 in Grünbaum und Shephard18), die dieses verallgemeinerte Quasi-Äquivalenzprinzip erfüllen, nämlich die archimedischen Gitter – auch bekannt als einheitliche Gitter13,16. Unter diesen Gittern gibt es nur vier, die ein hexagonales Untergitter enthalten (Abb. 2a). Eines davon ist das hexagonale Gitter selbst, auf dem das CK-Klassifikationsschema basiert. Dieses Gitter trägt die Bezeichnung \((6,6,6)\) entsprechend der Art der regelmäßigen Polygone, die jeden Scheitelpunkt umgeben, in diesem Fall drei Sechsecke. Das Sechseckgitter ist jedoch nur das einfachste Gitter, das diese Konstruktion ermöglicht. Andere Gitter, die Sechsecke in angemessenen Abständen, d. h. als sechseckiges Untergitter, enthalten, eignen sich ebenfalls für die CK-Konstruktion, wurden aber bisher ignoriert. Dies sind das trihexagonale Tiling \((3,6,3,6)\), das snub-hexagonale Tiling \(({3}^{4},6)\) und das rhombitrihexagonale Tiling \((3,4,6,4)\) (Abb. 2a). Diese Gitter werden auch Hexadeltille, Snubhextille bzw. das abgestumpfte Hexadeltille-Gitter genannt16.
In Analogie zur Konstruktion von Caspar und Klug klassifizieren wir die ikosaedrischen Polyeder, die aus diesen Kacheln durch Ersetzen von 12 Sechsecken durch Fünfecke konstruiert werden können (Abb. 2b). Die Ersetzung der nächstgelegenen Sechsecke führt in jedem Fall zu einem ikosaedersymmetrischen archimedischen Körper (Abb. 2c), der dem Anfang einer unendlichen Reihe von Polyedern entspricht, die durch weitere Abstände zwischen den Fünfecken konstruiert werden. Um die verschiedenen polyedrischen Strukturen in der Serie zu charakterisieren, verwenden wir wieder die hexagonalen Koordinaten \(h\) und \(k\), die jetzt die Schritte zwischen den hexagonalen Mittelpunkten im hexagonalen Untergitter angeben, um die möglichen Abstände zwischen den fünfeckigen Einfügungen zu kennzeichnen. In den drei zusätzlichen Gittern sind die Mittelpunkte benachbarter Sechsecke weiter voneinander entfernt als im hexagonalen Gitter. Daher ist die Fläche, die von einer Dreiecksfacette bedeckt wird, die die Mittelpunkte benachbarter Sechsecke verbindet (d. h. der Fall \(h=0\) und \(k=1\) oder umgekehrt), um einen Faktor \({\alpha }_{t}=4/3\ca. 1.33) für das \((3,6,3,6)\)-Gitter, \({\alpha }_{s}=7/3\ca. 2.33\) für das \(({3}^{4},6)\)-Gitter und \({\alpha }_{r}=4/3+2/\sqrt{3}\ca. 2.49\) für das \((3,4,6,3)\)-Gitter, d.h., um Faktoren, die den relativen Größen der asymmetrischen Gittereinheiten entsprechen (siehe farbige Hervorhebung in Abb. 2a). Die T-Zahl in der CK-Konstruktion kann daher für die neuen Gitter wie folgt skaliert werden
wobei \(j=t,s,r\) den in der Konstruktion verwendeten Gittertyp angibt und das trihexagonale, das stumpfhexagonale bzw. das rhombitrihexagonale Gitter bezeichnet. Insbesondere hat ein Polyeder mit der Bezeichnung \({T}_{j}(h,k)\) die gleiche Anzahl von Fünfecken und Sechsecken wie ein \(T(h,k)\) Caspar-Klug-Gitter, aber die von seinen Flächen bedeckte Oberfläche ist aufgrund der zusätzlichen Polygone (Dreiecke, Quadrate) zwischen den Sechsecken und Fünfecken größer. Dies wird durch den Skalierungsfaktor \({\alpha }_{j}\) angezeigt, der sich auf den Oberflächengewinn entsprechend dem planaren Gitter bezieht, aus dem es konstruiert ist, wie in Abb. 2 dargestellt.
Die sich daraus ergebenden Geometrien (ergänzende Tabellen 2-4) erweitern das Spektrum möglicher ikosaedrischer viraler Baupläne erheblich. Zum Beispiel liegen \({T}_{t}(1,0)=4/3\), \({T}_{s}(1,0)=7/3\) und \({T}_{r}(1,0)=(4/3+2/\sqrt{3})\) zwischen den \(T(1,0)=1\) und \(T(1,1)=3\) CK-Blaupausen in Bezug auf die Capsidgröße (Abb. 2d), wenn man annimmt, dass ihre hexagonalen (Unter-)Gitter denselben Fußabdruck auf der Capsidoberfläche haben, d. h. dieselben CP-Größen. Darüber hinaus stellen einige dieser Geometrien alternative Layouts für ähnlich große CK-Geometrien dar, wie z. B. \({T}_{t}(1,1)=4\) und \({T}_{s}(1,1)=7\) für \(T(2,0)=4\) bzw. \(T(2,1)=7\) Strukturen. In diesen Fällen haben die alternativen Kapsidmodelle dieselben relativen Oberflächenbereiche, aber es wird vorhergesagt, dass sie eine unterschiedliche Anzahl und Ausrichtung von Hexameren und Pentameren haben, mit Zwischenräumen zwischen diesen Kapsomeren. Diese alternativen Strukturen (und ihre Duale) entsprechen bisher unvermuteten Capsid-Layouts und bieten einen vereinheitlichenden Rahmen für die Klassifizierung ikosaedrischer Virusarchitekturen.
Nicht-quasi-äquivalente Architekturen in der HK97-Linie
Es werden immer mehr Capsid-Architekturen mit CP-Zahlen und Capsid-Layouts berichtet, die mit den geometrischen Entwürfen der CK-Theorie nicht vereinbar sind. Viren mit Kapsiden, die aus einer Kombination von Haupt- und Nebenkapsidprotein bestehen, sind Beispiele, die mit der klassischen CK-Theorie schwer zu interpretieren sind. Hier stellen wir Beispiele aus der HK97-Linie vor, die zeigen, dass solche Viren im Rahmen des hier vorgeschlagenen Archimedischen Gitters rationalisiert werden können.
Der Bacillus-Phage Basilisk beispielsweise enthält 1080 CPs, die 540 Hauptkapsidproteine (MCPs) und 540 Nebenkapsidproteine (mCPs)19 kombinieren. Unter Verwendung der Beziehung \(60\ T\) für CP-Zahlen in der CK-Theorie würde dies einer \(T\)-Zahl von 18 entsprechen, die durch die geometrische Beschränkung in der CK-Theorie gemäß Gl. 1 ausgeschlossen ist. Wenn man sich nur auf die 12 Pentamere (genauer gesagt, 11 Pentamere und ein mutmaßliches Portal) und 80 Hexamere konzentriert, würde die Struktur als \(T(3,0)=9\)19 eingestuft werden. Dabei werden jedoch die 180 interstitiellen Trimere ignoriert und die relativen Orientierungen der Proteincluster sowie die Oberfläche des Kapsids falsch dargestellt (Abb. 3a). Im Gegensatz dazu werden die CP-Positionen von Basilisk durch eine \({T}_{t}(3,0)=12\)-Struktur, die auf der trihexagonalen Gitterreihe im Rahmen des übergreifenden ikosaedrischen Konstruktionsprinzips basiert, genau dargestellt. Diese Klassifizierung stimmt auch mit den Messungen der Oberfläche von Basilisk (\(1,69\mal 1{0}^{4}\ {{\rm{nm}}}^{2}\), siehe Methoden) überein, die mit der Oberfläche des Phagen SIO-2 (\(1,70\mal 1{0}^{4}\ {{\rm{nm}}}^{2}\)) vergleichbar ist, der ein klassisches \(T=12\)-Kapsid ist20. Das Basilisk-Kapsid ist also eine ikosaedrische Struktur von ähnlicher Größe wie eine CK-Geometrie, weist aber eine CP-Zahl und ein Kapsid-Layout auf, die im CK-Formalismus nicht möglich sind.
Basilisk (Abb. 3a) teilt seine MCP-Faltung mit anderen Bakteriophagen, Archaeen- und Tierviren der HK97-Linie12,21,22. Eine Neubewertung anderer Virusstrukturen innerhalb dieser Linie zeigt, dass diese evolutionär verwandten Viren die gleiche zugrunde liegende ikosaedrische Gittergeometrie aufweisen, d. h., Sie gehören zur gleichen Serie polyedrischer Designs (in diesem Fall die trihexagonale Serie von \({T}_{t}\)-Architekturen).
Zum Beispiel organisiert das Herpes Simplex Virus Typ 1 (HSV-1) sein MCP (VP5) in Hexameren und Pentameren mit Orientierungen, die an die des Basilisk-Kapsids erinnern (Abb. 3b). Die Positionen dieser Kapsomere stehen im Einklang mit der derzeitigen Klassifizierung von HSV-1 als \(T(4,0)=16\). Dies stellt jedoch die relativen Orientierungen der Hexamere falsch dar und ignoriert das sekundäre Netzwerk von trimeren Komplexen zwischen den Kapsomeren, die aus drei mCPs (Tr1, Tr2a und Tr2b) gebildet werden23. Die Klassifizierung als \({T}_{t}(4,0)=64/3\)-Struktur im neuen System (ergänzende Tabelle 2) spiegelt jedoch sowohl die 960 MCPs als auch die 960 mCPs genau wider. Dasselbe gilt für das humane Cytomegalovirus (HCMV)24 (Struktur nicht gezeigt), das strukturell dem HSV-1 ähnelt.
Das reife Kapsid des Phagen \(\lambda\) (Abb. 3c) ist ein weiteres Beispiel für ein Virus der HK97-Linie mit einer trihexagonalen ikosaedrischen Struktur. Es wird derzeit als \(T(2,1)=7\)12 klassifiziert, aber die Ausrichtung der Kapsomere zeigt stattdessen das Layout einer \({T}_{t}(2,1)=28/3\)-Struktur, da die vorstehenden Domänen der MCP – und nicht zusätzliche mCP – das dreieckige Untergitter besetzen. An diesen Positionen befinden sich auch die Verstärkungsproteine gpD25, was die Bedeutung dieser trimeren Positionen im Oberflächengitter unterstreicht (Abb. 3c). Halorubrum sodomense tailed virus 2 (HSTV-2), ein weiteres Mitglied der HK97-Linie, wurde ebenfalls als \(T(2,1)=7\) klassifiziert. Sein Kapsid enthält jedoch gpD-ähnliche Trimere, die die Zwischenpositionen zwischen den Kapsomeren einnehmen, was mit der trihexagonalen Struktur \({T}_{t}(2,1)=28/3\) (siehe Abb. 8 in Pietilä et al.26). Dies bedeutet eine Zunahme des Kapsidvolumens (und folglich der Genomgröße) um einen Faktor \({\alpha }_{t}^{3/2}\ca. 1,54\) im Vergleich zu einem klassischen \(T(2,1)\) Kapsid. Diese Vorhersage stimmt mit der empirischen Beobachtung überein, dass das Genom von HSTV-2 ~\(1,4-1,7\) größer ist als das von Phagen mit \(T=7\)-Schwanz26, was seine Einstufung als \({T}_{t}(2,1)=28/3\)-Kapsid in unserem Rahmen weiter untermauert. Ein weiteres Beispiel ist der thermophile Bakteriophage P23-45, der derzeit als übergroßes \(T=7\)-Kapsid klassifiziert wird27.
Zusammenfassend legen diese Beispiele nahe, dass das hier eingeführte Klassifizierungsschema für die Virusarchitektur strukturelle Merkmale hervorhebt, die evolutionär verwandte Viren gemeinsam haben, und sich somit als Charakteristikum für virale Linien eignet.
Alternative Capsid-Layouts mit identischer Stöchiometrie
Es gibt viele Beispiele für quasiequivalente virale Capside, die aus der gleichen Anzahl von CPs gebildet werden, aber unterschiedliche CP-Positionen und Capsomere aufweisen. Die CK-Theorie unterscheidet nicht zwischen ihnen. Wir zeigen hier jedoch am Beispiel verschiedener \(T=3\)-Geometrien, dass die archimedischen Gitter und ihre Duale, die so genannten Laves-Gitter, eine Möglichkeit bieten, dieses Problem zu lösen.
In der CK-Theorie werden hexagonale Flächengitter und ihre Duale, die dem Dreiecksgitter (3, 3, 3) entsprechen, austauschbar verwendet. Das kleinste ikosaedrische Polyeder, das sich aus einem Dreiecksgitter ableitet, ist das Ikosaeder, das aus 20 Dreiecken besteht. Das nächstgrößere Polyeder wird aus 60 Dreiecken gebildet und bietet eine Blaupause für eine klassische \(T=3\)-Struktur. Unter Verwendung der Konvention der CK-Theorie, wonach polyedrische Flächen Gruppen von Proteinen darstellen müssen, die von der Anzahl her der Rotationssymmetrie der Kachel entsprechen (z. B. Dreiecke, die drei Proteine darstellen usw.), können Kapsid-Layouts mit polyedrischen Strukturen in Verbindung gebracht werden. Das Pariacoto-Virus (PAV; Abb. 4a) mit seiner starken Interaktion zwischen den drei Ketten, die die dreieckigen Einheiten bilden, ist ein Beispiel für diese Art von \({T}^{D}(1,1)\)-Oberflächenarchitektur.
Die Duale der anderen archimedischen Gitter (trihexagonal, snub hexagonal, rhombitrihexagonal) zeigen alternative Oberflächenarchitekturen zu denen der CK-Theorie in Form von Rauten-, Blümchen- bzw. Drachenkacheln (vgl. Ergänzende Tabelle 5). Bei strikter Anwendung der CK-Regel, dass die Symmetrie einer Kachel mit der Anzahl der durch die Kachel repräsentierten Proteine korreliert sein muss, werden die dualen trihexagonalen Gitter (\({T}_{t}^{D}\)), d. h. die Rautenkacheln mit Kacheln, die Cluster aus zwei Proteinen (CP-Dimere) darstellen, herausgefiltert. Rautenkacheln bieten alternative Layouts zu den CK-Oberflächengittern und beschreiben Kapside mit derselben Proteinstöchiometrie, aber unterschiedlicher CP-Organisation. Der Bakteriophage MS2 (Abb. 4b), ein Virus, das aus 90 CP-Dimeren zusammengesetzt ist, ist ein Beispiel für ein \(T=3\)-Rhombengitter (\({T}_{t}^{D}(1,1)\); ergänzende Tabelle 5). Man beachte, dass die Proteinstöchiometrie in diesem Fall zwar mit dem CK-Rahmen übereinstimmt, was den 180 Proteinen entspricht, die für eine \(T=3\)-Struktur erwartet werden, dass aber die Identifizierung als \({T}_{t}^{D}(1,1)\)-Geometrie eine genauere Darstellung der CP-Positionen und ihrer relativen Orientierungen auf der Kapsidoberfläche liefert.
Nicht-quasi-äquivalente und höherwertige Rautenkacheln
Wenn man die CK-Konvention so erweitert, dass die Rauten mehr als zwei CPs darstellen können, solange ihre Positionen auf der Kachel die Symmetrie der Kachel respektieren, sind auch höhere Zahlen von Proteinen geometrisch denkbar. Dies könnte z. B. durch die Kombination von zwei Dimeren erreicht werden. Die Proteinstöchiometrie für solche Kapsiden wäre \(120\ T(h,k)\), und die ersten Elemente der Reihe würden 120, 360 und 480 Proteine enthalten. Das Picobirnavirus ist ein Beispiel für das erste Element dieser Reihe (ergänzende Abb. 3a). Dieses Virus bildet rhombusartige Kacheln, die aus zwei parallel angeordneten Proteindimeren bestehen, und enthält insgesamt 120 Proteine28. Diese Struktur wurde traditionell als verbotene \(T=2\)-Zahl im CK-Rahmen beschrieben, passt aber natürlich in den neuen Rahmen als Rautenkacheln höherer Ordnung. Die nächsten Elemente dieser Reihe sagen die Existenz der verbotenen Zahlen \(T=6\) (360 Proteine) und \(8\) (480 Proteine) voraus. Diesem Muster folgend ist es logisch, über die Möglichkeit rhombusartiger Kacheln nachzudenken, die drei Proteindimere darstellen, die ebenfalls die erforderliche zweifache Symmetrie erfüllen würden. Die Proteinstöchiometrie für diese Kapsiden wäre \(180\, T(h,k)\), und die drei kleinsten Geometrien dieses Typs würden 180, 540 und 720 Proteine enthalten. Ein Beispiel für das erste Element dieser Reihe ist das Zika-Virus (ergänzende Abb. 3b) aus der Familie der Flaviviridae. Jede Rautenkachel in seinem Kapsid repräsentiert sechs längliche Proteine (drei Dimere parallel unter Beachtung der zweifachen Symmetrie der Kachel), so dass die 30 Kacheln insgesamt 180 Proteine darstellen. In einer Pionierarbeit im Jahr 2002 erkannten das Rossmann-Labor und seine Mitarbeiter, dass die drei E-Monomere in jeder ikosaedrischen asymmetrischen Einheit des Dengue-Virus29 keine quasi-äquivalenten symmetrischen Umgebungen in dem externen, ikosaedrischen Gerüst haben, das aus den 90 Glykoprotein-E-Dimeren besteht. Unser Ansatz, der auf den Dualen der archimedischen Gitter basiert, berücksichtigt solche nicht-quasiequivalenten Kapsidstrukturen.
Unser Rahmen erweitert somit die Vorhersagen der Quasiequivalenztheorie durch ein detaillierteres Verständnis der Kapsidgeometrie, indem er zwischen Kapsidarchitekturen mit unterschiedlichen Arten von Kapsidprotein-Organisationen und Schnittstellen bei gleicher Anzahl von Kapsidproteinen unterscheidet. Dies ist wichtig für ein besseres Verständnis der biophysikalischen Eigenschaften von Viruskapsiden, wie z. B. ihrer Stabilität, und ihrer Rolle im viralen Lebenszyklus, z. B. während des Auf- und Abbaus von Virionen, und zeigt geometrische Beschränkungen der viralen Evolution auf.