Polyhedrale modellen van icosahedrale architectuur
Virusstructuren zijn prominente voorbeelden van icosahedrale symmetrie in de biologie. Hun architecturen worden momenteel gemodelleerd en geclassificeerd in termen van de reeks Goldberg-polyeders14 – driedimensionale vaste lichamen met vijf- en zeshoekige vlakken – die een referentiekader bieden voor de posities van de capsideproteïnen (Fig. 1a). In het bijzonder geven de veelvlakkige vlakken de posities aan van vijfhoekige en zeshoekige eiwitclusters, die respectievelijk pentameren en hexameren worden genoemd. Dezelfde veelvlakken geven ook blauwdrukken voor de atomaire posities van de fullereen-kooien in de koolstofchemie, in het bijzonder de Buckminster fullereen die bekend staat als de buckyball1. Zij leveren ook blauwdrukken voor de structurele organisatie van een breed scala van zowel door de mens vervaardigde als natuurlijke eiwit-nanocontainers. Hun dualen, de geodetische veelvlakken15, zijn de architectonische ontwerpen van de geodetische koepels van Buckminster Fuller.
Goldberg veelvlakken kunnen worden geconstrueerd uit een zeshoekig rooster (rooster) door 12 zeshoeken te vervangen door vijfhoeken (fig. 1b), zoals vereist door de Stelling van Euler om een gesloten veelvlakvorm te verkrijgen16. De afstand tussen de vijfhoeken op naburige vijfhoekpunten is de enige vrijheidsgraad in deze constructie, en kan daarom worden gebruikt om de verschillende geometrische opties in deze oneindige reeks veelvlakken te labelen. \Dergelijke waarden kunnen alleen specifieke waarden aannemen, die beperkt worden door de onderliggende geometrie van het zeshoekige rooster. Met behulp van de hexagonale coördinaten h(h) en k(k), die geheel of nul kunnen zijn om tussen de middens van naburige hexagonen in het rooster te navigeren, verkrijgt men de volgende meetkundige beperking11:
Hier komt ({A}_{0}) overeen met de oppervlakte van de kleinste driehoek tussen willekeurige zeshoekige middens, dus het geval \(h=1\) en \(k=0\)-of omgekeerd \(h=0\) en \(k=1\). Een soortgelijke formule is afgeleid voor langwerpige capsidestructuren17.
T wordt het driehoeksgetal genoemd (fig. 1c) vanwege de geometrische interpretatie in termen van de icosahedrale driehoeken die worden verkregen door middelpunten van naburige vijf- en zeshoeken met elkaar te verbinden, d.w.z. in termen van de duale (geodetische) veelvlakken. T geeft het aantal driehoekige vlakken, facetten genoemd, in de triangulatie aan die een driehoekig vlak van de icosaëder qua oppervlakte bestrijken. De associatie van een eiwitsubeenheid met elke hoek van zo’n driehoekig facet vertaalt deze oneindige reeks van driehoekjes in de capside-indelingen in de quasiequivalentietheorie (Fig. 1d). Dergelijke blauwdrukken laten alleen capside-indelingen toe met 60T CPs, georganiseerd in 12 pentamers en \(10(T-1)\) hexamers11. De voorwaarde van Eq. 1 is dus een meetkundige beperking van de mogelijke waarden van T en de mogelijke CP-aantallen in de CK-geometrieën. De eerste elementen van de reeks zijn (T=) 1, 3, 4, en 7, en het aantal CP’s in kleine icosahedrale kapjes is dus respectievelijk 60, 180, 240, en 420 (supplementaire tabel 1).
Dit is echter slechts één manier waarop een icosahedrale structuur kan worden opgebouwd uit herhalingen van dezelfde (asymmetrische) eenheid, en sluit geometrieën uit die zijn opgebouwd uit eiwitten van verschillende grootte (zoals een major en minor capsid eiwit) of capsiden die zijn opgebouwd uit een eiwit waarin één of meer domeinen een onderscheiden rol spelen. Dergelijke capsidestructuren moeten worden opgebouwd uit rasters waarin elk hoekpunt identiek is in termen van lengte, aantal en relatieve hoek van zijn uitstekende randen, maar de relatieve hoeken tussen verschillende randen bij hetzelfde hoekpunt kunnen variëren, wat de bezetting door verschillende soorten eiwitten of eiwitdomeinen weerspiegelt. Vanuit meetkundig oogpunt zijn er slechts 11 roosters (hoofdstuk 2 in Grünbaum en Shephard18) die aan dit veralgemeende quasi-equivalentieprincipe voldoen; dit zijn de Archimedische roosters – ook wel uniforme roosters genoemd13,16. Van deze roosters zijn er slechts vier die een zeshoekig deelrooster bevatten (fig. 2a). Eén daarvan is het hexagonale rooster zelf waarop het CK-classificatieschema is gebaseerd. Dit rooster is gelabeld als (6,6,6) volgens de typen regelmatige veelhoeken die elk hoekpunt omringen, in dit geval drie zeshoeken. Het zeshoekige rooster is echter slechts het eenvoudigste rooster dat deze constructie mogelijk maakt. Andere roosters met zeshoeken op gepaste afstanden, dat wil zeggen als zeshoekig deelrooster, zijn evenzeer geschikt voor de CK constructie, maar zijn tot nu toe genegeerd. Het gaat om de driehoekige betegeling ((3,6,3,6)\), de stompe zeshoekige betegeling (({3}^{4},6)\), en de rhombitrihexagonale betegeling ((3,4,6,4)\) (Fig. 2a). Deze roosters worden ook wel hexadeltille, snub hextille, en het afgeknotte hexadeltille rooster genoemd, respectievelijk16.
Naar analogie van de constructie van Caspar en Klug classificeren we de icosahedrale veelvlakken die uit deze kantelingen kunnen worden geconstrueerd via vervanging van 12 zeshoeken door vijfhoeken (Fig. 2b). Vervanging van naaste buurhexagonen resulteert in elk geval in een icosaëder symmetrisch Archimedisch veelvlak (Fig. 2c) dat overeenkomt met het begin van een oneindige reeks veelvlakken, geconstrueerd door de pentagonale invoegingen verder uit elkaar te plaatsen. Om de verschillende veelvlakstructuren in de reeks te karakteriseren, gebruiken we opnieuw de hexagonale coördinaten (h) en (k), die nu stappen aangeven tussen de zeshoekige middens in het hexagonale deelrooster, om de mogelijke afstanden tussen de vijfhoekige invoegingen aan te geven. In de drie additionele roosters liggen de middens van naburige hexagonen verder weg dan in het hexagonale rooster. De oppervlakte van een driehoekig facet dat de middens van aangrenzende zeshoeken verbindt (dus het geval h=0 en k=1, of omgekeerd) is groter dan in de CK constructie met een factor ⅓ voor het geval h=0} en k=1).33) voor het rooster(3,6,3,6), \({alpha }_{s}=7/3) voor het rooster(3,4,6,6), en \({alpha }_{r}=4/3+2/\sqrt{3}), ongeveer 2,49) voor het rooster(3,4,6,3), d.w.z., met factoren die overeenkomen met de relatieve grootte van de asymmetrische roostereenheden (zie gekleurde markeringen in Fig. 2a). Het T-getal in de CK constructie kan daarom voor de nieuwe roosters als volgt worden geschaald
waarbij (j=t,s,r) het in de constructie gebruikte type rooster aangeeft, respectievelijk het driehoekige, het zeshoekige en het ruithoekige rooster. In het bijzonder heeft een veelvlak met het label \({T}_{j}(h,k)\) hetzelfde aantal pentagons en hexagons als een \(T(h,k)\) Caspar Klug rooster, maar de oppervlakte van de zijvlakken is groter door de extra veelhoeken (driehoeken, vierkanten) tussen de zeshoeken en vijfhoeken. Dit wordt aangegeven door de schaalfactor \({\alpha }_{j}) die verwijst naar de toename in oppervlakte naar gelang het vlakke rooster waaruit het is opgebouwd, zoals geïllustreerd in Fig. 2.
De resulterende geometrieën (aanvullende tabellen 2-4) verbreden het spectrum van mogelijke icosahedrale virale blauwdrukken aanzienlijk. Bijvoorbeeld, \({T}_{t}(1,0)=4/3), \({T}_{s}(1,0)=7/3) en \({T}_{r}(1,0)=(4/3+2/qrt{3})) liggen tussen de \(T(1,0)=1) en \(T(1,1)=3) CK blauwdrukken in termen van capside grootte (Fig. 2d) als hun hexagonale (sub)roosters worden verondersteld dezelfde voetafdruk op het capside oppervlak te hebben, dat wil zeggen, dezelfde CP groottes. Bovendien vormen sommige van deze geometrieën alternatieve lay-outs voor CK-geometrieën van vergelijkbare grootte, zoals {T}_{t}(1,1)=4) en {T}_{s}(1,1)=7) voor respectievelijk T(2,0)=4) en T(2,1)=7) structuren. In deze gevallen hebben de alternatieve capsidemodellen dezelfde relatieve oppervlakten, maar worden er verschillende aantallen en oriëntaties van hexamers en pentamers voorspeld, met interstitiële ruimtes tussen deze capsomeren. Deze alternatieve structuren (en hun dualen) komen overeen met voorheen onvermoede capsid lay-outs en bieden een verenigend raamwerk voor de classificatie van icosahedrale virusarchitecturen.
Niet-quasi-equivalente architecturen in de HK97-lijn
Er worden steeds meer capsid-architecturen gerapporteerd met CP-aantallen en capsid lay-outs die onverenigbaar zijn met de geometrische blauwdrukken van de CK-theorie. Virussen met capsiden gevormd uit een combinatie van een major en minor capsid proteïne zijn voorbeelden die moeilijk te interpreteren zijn in de klassieke CK theorie. Hier geven we voorbeelden uit de HK97-lijn, die aantonen dat zulke virussen kunnen worden gerationaliseerd in het hier voorgestelde Archimedische roosterraamwerk.
De Bacillus-faag Basilisk, bijvoorbeeld, bevat 1080 CP’s, een combinatie van 540 major capsid-eiwitten (MCP’s) en 540 minor capsid-eiwitten (mCP’s)19. Gebruik makend van de relatie voor CP-aantallen in de CK-theorie, zou dit overeenkomen met een CP-aantal van 18, dat wordt uitgesloten door de geometrische beperking in de CK-theorie gegeven door Eq. 1. Als men zich alleen concentreert op de 12 pentameren (om precies te zijn 11 pentameren en een vermeend portaal) en 80 hexameren, dan zou de structuur worden geclassificeerd als T(3,0)=919. Dit negeert echter de 180 interstantiële trimeren en geeft een verkeerde voorstelling van de relatieve oriëntaties van de eiwitclusters en het oppervlak van de kapside (Fig. 3a). Daarentegen worden de CP-posities van Basilisk nauwkeurig weergegeven door een structuur die gebaseerd is op de driehoekige roosterreeksen in het kader van het overkoepelende icosahedrale ontwerpprincipe. Deze classificatie is ook consistent met metingen van het oppervlak van Basilisk (1,69 maal 1{0}^{4} {{rm{nm}}}^{2}}, zie Methoden), dat vergelijkbaar is met het oppervlak van faag SIO-2 (1,70 maal 1{0}^{4} {{rm{nm}}}^{2}})), dat een klassieke \(T=12}) capsid is20. De Basilisk-capside is dus een icosahedrale structuur van vergelijkbare grootte als die van een CK-geometrie, maar vertoont een CP-getal en kapselindeling die niet mogelijk zijn in het CK-formalisme.
Basilisk (Fig. 3a) deelt zijn MCP vouw met andere bacteriofagen, archaeale en dierlijke virussen in de HK97-lineage12,21,22. Een herevaluatie van andere virusstructuren binnen deze lineage onthult dat deze evolutionair verwante virussen dezelfde onderliggende icosahedrale rastergeometrie delen, d.w.z, ze behoren tot dezelfde reeks veelvlakkige ontwerpen (in dit geval, de driehoekige reeks van {T}_{t})-architecturen).
Herpes simplex virus type 1 (HSV-1) bijvoorbeeld organiseert zijn MCP (VP5) in hexameren en pentameren met oriëntaties die doen denken aan die in het Basilisk-capsidium (Fig. 3b). De posities van deze capsomeren zijn consistent met de huidige classificatie van HSV-1 als (T(4,0)=16). Dit geeft echter een verkeerde voorstelling van de relatieve oriëntaties van de hexamers en negeert het secundaire netwerk van trimerische complexen tussen de capsomeren die gevormd worden uit drie mCP’s (Tr1, Tr2a en Tr2b)23. De indeling als een {T}_{t}(4,0)=64/3)-structuur in het nieuwe kader (supplementaire tabel 2) geeft echter zowel de 960 MCP’s als de 960 mCP’s nauwkeurig weer. Hetzelfde geldt voor het menselijke cytomegalovirus (HCMV)24 (structuur niet weergegeven), dat structureel vergelijkbaar is met HSV-1.
De rijpe capsid van faag \(\lambda\) (Fig. 3c) is een ander voorbeeld van een HK97-lijn virus met een trihexagonale icosahedrale structuur. Het is momenteel geclassificeerd als \(T(2,1)=7)12, maar de oriëntatie van de capsomeren vertoont in plaats daarvan de indeling van een \({T}_{t}(2,1)=28/3)-structuur, omdat de uitstekende domeinen van de MCP’s – in plaats van extra mCP’s – het driehoekige sublattice bezetten. Deze posities zijn ook de locaties van de versterkende eiwitten gpD25, wat het belang van deze trimerische posities in het oppervlakrooster onderstreept (Fig. 3c). Anderzijds is Halorubrum sodomense tailed virus 2 (HSTV-2), een ander lid van de HK97-lijn, geclassificeerd als T(2,1)=7. Zijn capsid bevat echter gpD-achtige trimeren die interstitionele posities tussen capsomeren innemen, hetgeen consistent is met de driehoekige structuur {T}_{t}(2,1)=28/3) (zie Fig. 8 in Pietilä et al.26). Dit impliceert een toename van het capsidevolume (en bijgevolg van de genoomgrootte) met een factor van ongeveer 1,54 ten opzichte van een klassieke capside met T(2,1). Deze voorspelling is consistent met de empirische waarneming dat HSTV-2 een genoom heeft dat ~(1.4-1.7) groter is dan dat van fagen met een T=7 staart26, wat de classificatie als een T=28/3 capsid in ons raamwerk verder ondersteunt. Een ander voorbeeld is de thermofiele bacteriofaag P23-45, die momenteel wordt geclassificeerd als een supergrote (T=7) capsid architectuur27.
Samenvattend suggereren deze voorbeelden dat het hier geïntroduceerde classificatieschema voor virusarchitectuur structurele kenmerken benadrukt die worden gedeeld door evolutionair verwante virussen, en zich dus leent als een kenmerk van virale lineages.
Alternatieve capsid lay-outs met identieke stoichiometrie
Er zijn vele voorbeelden van quasiequivalente virale capsiden die gevormd zijn uit hetzelfde aantal CPs, maar verschillende CP-posities en capsomeren vertonen. De CK-theorie maakt daar geen onderscheid tussen. Wij tonen hier echter aan, aan de hand van het voorbeeld van verschillende (T=3) geometrieën, dat de Archimedische roosters en hun dualen, de zogenaamde Laves roosters, een manier bieden om dit aan te pakken.
In de CK-theorie worden hexagonale oppervlak-roosters en hun dualen, die overeenkomen met het driehoekige rooster (3, 3, 3), onderling verwisselbaar gebruikt. De kleinste icosaëder, afgeleid van een driehoekig rooster, is de icosaëder, bestaande uit 20 driehoeken. Het op één na grootste veelvlak wordt gevormd uit 60 driehoeken, en levert een blauwdruk voor een klassieke (T=3) structuur. Door gebruik te maken van de conventie van de CK-theorie dat veelvlakkige vlakken groepen eiwitten moeten voorstellen die qua aantal overeenkomen met de rotatiesymmetrie van de tegel (b.v. driehoeken die drie eiwitten voorstellen enz.), kunnen capsidestructuren in verband worden gebracht met veelvlakkige structuren. Pariacoto virus (PAV; Fig. 4a), met zijn sterke interactie tussen de drie ketens die de driehoekige eenheden vormen, is een voorbeeld van dit type van \({T}^{D}(1,1)\) oppervlaktearchitectuur.
De dualen van de andere Archimedische roosters (trihexagonaal, snub hexagonaal, rhombitrihexagonaal) vertonen alternatieve oppervlakte architecturen voor die in de CK theorie in termen van respectievelijk rhomb, floret, en kite tiles (cf. supplementaire tabel 5). Strikte toepassing van de CK-regel dat de symmetrie van een tegel gecorreleerd moet zijn met het aantal eiwitten dat de tegel vertegenwoordigt, leidt tot de dubbele trihexagonale roosters (\({T}_{t}^{D}\)), d.w.z. de rhomb-kantelingen met tegels die clusters van twee eiwitten (CP-dimeren) vertegenwoordigen. Rhomb tilings bieden alternatieve indelingen voor de CK-oppervlak-roosters, die capsiden beschrijven met dezelfde eiwit-stoichiometrie maar verschillende CP-organisatie. Bacteriofaag MS2 (fig. 4b), een virus dat is opgebouwd uit 90 CP-dimeren, is een voorbeeld van een rhomb-structuur (\({T}_{t}^{D}(1,1)\); supplementaire tabel 5). Merk op dat hoewel de proteïnestoichiometrie in dit geval samenvalt met het CK raamwerk, wat overeenkomt met de 180 eiwitten die verwacht worden voor een T=3 structuur, de identificatie als een T=3 geometrie een nauwkeuriger weergave geeft van de CP posities en hun relatieve oriëntaties in het capsid oppervlak.
Niet-quasi-equivalente en hogere orde rhomb-tiltings
Uitbreiding van de CK-conventie om rhombs toe te staan meer dan twee CP’s voor te stellen, zolang hun posities op de tegel de symmetrie van de tegel respecteren, zijn geometrisch ook hogere aantallen eiwitten denkbaar. Dit zou bijvoorbeeld kunnen worden bereikt door twee dimeren te combineren. De proteïnestoichiometrie voor dergelijke capsiden zou 120, 360 en 480 proteïnen bevatten, en de eerste elementen van de reeks zouden 120, 360 en 480 proteïnen bevatten. Picobirnavirus is een voorbeeld van het eerste element van deze reeks (supplementaire fig. 3a). Dit virus vormt ruitvormige tegels die bestaan uit twee eiwitdimeren in parallelle oriëntatie, en bevat in totaal 120 eiwitten28. Deze structuur is traditioneel beschreven als een verboden getal in het CK raamwerk, maar past natuurlijk in het nieuwe raamwerk als een hogere orde rhomb tiling. De volgende elementen van deze reeks voorspellen het bestaan van de verboden getallen : (T=6) (360 proteïnen) en (8) (480 proteïnen). Volgens dit patroon is het logisch om te denken aan de mogelijkheid van ruitvormige tegels die drie eiwitdimeren voorstellen, die ook zouden voldoen aan de vereiste tweevoudige symmetrie. De eiwit stoichiometrie voor deze capsiden zou dan 180, T(h,k)zijn, en de drie kleinste geometrieën van dit type zouden 180, 540 en 720 eiwitten bevatten. Een voorbeeld van het eerste element van deze reeks is het Zika-virus (supplementaire fig. 3b) van de Flaviviridae-familie. Meer bepaald vertegenwoordigt elke ruitvormige tegel in zijn capside zes langwerpige eiwitten (drie dimeren parallel met respect voor de tweevoudige symmetrie van de tegel), zodat de 30 tegels in totaal 180 eiwitten vertegenwoordigen. In baanbrekend werk in 2002 realiseerden het Rossmann lab en medewerkers dat de drie E monomeren in elke icosahedrale asymmetrische eenheid van het Dengue virus29 geen quasiequivalente symmetrische omgevingen hebben in de externe, icosahedrale scaffold gevormd uit de 90 glycoproteïne E dimeren. Onze benadering, gebaseerd op de dualen van de Archimedische roosters, houdt rekening met zulke niet-quasiequivalente capsidestructuren.
Ons raamwerk breidt dus de voorspellingen van de quasiequivalentietheorie uit door een gedetailleerder begrip van de geometrie van de capsiden, waarbij onderscheid wordt gemaakt tussen capsidearchitecturen met verschillende soorten capsideproteïneorganisatie en -interfaces, gegeven dezelfde aantallen capsideproteïnen. Dit is belangrijk voor een beter begrip van de biofysische eigenschappen van virale capsiden, zoals hun stabiliteit, en hun rol in virale levenscycli, bijv. tijdens virion-assemblage en -desassemblage, en onthult geometrische beperkingen op virale evolutie.