Polyedriske modeller af icosaedrisk arkitektur
Virusstrukturer er fremtrædende eksempler på icosaedrisk symmetri i biologi. Deres arkitekturer er i øjeblikket modelleret og klassificeret i form af en række Goldberg-polyedre14 – tredimensionelle faste stoffer med pentagonale og hexagonale flader – som giver en referenceramme for positionerne af kapsidproteinerne (fig. 1a). Især angiver de polyedriske flader positionerne for pentagonale og hexagonale proteinklynger, der kaldes henholdsvis pentamere og hexamere. De samme polyedre giver også tegninger for de atomare positioner for fullerenburene i kulstofkemien, navnlig Buckminster-fullerenen, der er kendt som buckyball1. De er også et mønster for den strukturelle organisering af en lang række både menneskeskabte og naturlige proteinnanocontainere. Deres dualer, de geodætiske polyedre15 , er de arkitektoniske designs af Buckminster Fullers geodætiske kupler.
Goldberg-polyedre kan konstrueres ud fra et sekskantet gitter ved at erstatte 12 sekskanter med femkanter (fig. 1b), som det kræves i Eulers sætning for at generere en lukket polyedrisk form16. Afstanden \(D\) mellem femkanterne på de tilstødende femfoldige hjørner er den eneste frihedsgrad i denne konstruktion og kan derfor bruges til at mærke de forskellige geometriske muligheder i denne uendelige række af polyedre. \(D\) kan kun antage bestemte værdier, som begrænses af den underliggende sekskantede gittergeometri. Navnlig ved at bruge de hexagonale koordinater \(h\) og \(k\), som antager en hvilken som helst helhedsværdi eller nul for at navigere mellem midtpunkterne af nabosexagoner i gitteret, opnår man følgende geometriske begrænsning11:
Her svarer \({A}_{0}\) til arealet af den mindste trekant mellem eventuelle sekskantede midtpunkter, dvs. tilfældet \(h=1\) og \(k=0\)-eller tilsvarende \(h=0\) og \(k=1\). En lignende formel er blevet udledt for aflange capsidstrukturer17.
T kaldes trianguleringstallet (fig. 1c) på grund af dets geometriske fortolkning i form af de icosaedriske trianguleringer, der opnås ved at forbinde midtpunkterne af tilstødende pentagoner og hexagoner, dvs. i form af de dobbelte (geodætiske) polyedre. T angiver antallet af trekantede flader, kaldet facetter, i trianguleringen, som dækker en trekantet flade af icosaedret med et areal. Ved at knytte en proteinunderenhed til hvert hjørne af en sådan trekantet facet oversættes denne uendelige række af trianguleringer til capsid-layouts i kvasiekvivalensteorien (fig. 1d). Sådanne tegninger tillader kun capsidlayouts med 60T CP’er, der er organiseret i 12 pentamere og \(10(T-1)\ hexamere11. Betingelsen udtrykt ved Eq. 1 er derfor en geometrisk begrænsning af de mulige værdier af T og de mulige CP-numre i CK-geometrier. De indledende elementer i serien er \(T=\)1, 3, 4 og 7, og derfor er antallet af CP’er i små icosaedriske kapsider henholdsvis 60, 180, 240 og 420 (Supplerende tabel 1).
Dette er imidlertid kun én måde, hvorpå en icosaedrisk struktur kan opbygges af gentagelser af den samme (asymmetriske) enhed, og udelukker geometrier, der er opbygget af proteiner af forskellig størrelse (f.eks. et større og mindre kapsidprotein) eller kapsider, der er opbygget af et protein, hvor et eller flere domæner spiller forskellige roller. Sådanne kapsidlayouts skal konstrueres ud fra gitter, hvor hvert toppunkt er identisk med hensyn til længden, antallet og de relative vinkler af dets udragende kanter, men de relative vinkler mellem forskellige kanter ved det samme toppunkt kan variere, hvilket afspejler besættelsen af forskellige typer proteiner eller proteindomæner. Ud fra et geometrisk synspunkt er der kun 11 gitter (kapitel 2 i Grünbaum og Shephard18 ), der opfylder dette generaliserede kvasi-ækvivalensprincip, som er de arkimediske gitter – også kendt som ensartede gitter13,16. Blandt disse gitter er der kun fire, der indeholder et sekskantet undergitter (fig. 2a). Et af dem er selve det sekskantede gitter, som CK-klassifikationsskemaet er baseret på. Dette gitter er mærket \((6,6,6,6)\) i henhold til de typer regulære polygoner, der omgiver hvert toppunkt, i dette tilfælde tre sekskantede polygoner. Det sekskantede gitter er imidlertid kun det enkleste gitter, der muliggør denne konstruktion. Andre gitter, der indeholder sekskanter i passende afstande, dvs. som et sekskantet undergitter, er lige så velegnede til CK-konstruktionen, men er indtil nu blevet ignoreret. Det drejer sig om det trihexagonale flisebelægningssystem \((3,6,3,6)\), det snubhexagonale flisebelægningssystem \(({3}^{4},6)\) og det rhombitrihexagonale flisebelægningssystem \((3,4,6,4)\). (fig. 2a). Disse gitter kaldes også henholdsvis hexadeltille, snub hextille og det afkortede hexadeltille gitter16.
I analogi med Caspar og Klugs konstruktion klassificerer vi de icosaedriske polyedre, der kan konstrueres ud fra disse tilings via udskiftning af 12 hexagoner med pentagoner (Fig. 2b). Udskiftning af hexagoner i nærmeste nabo resulterer i hvert enkelt tilfælde i et icosaedisk symmetrisk arkimedisk rum (fig. 2c), der svarer til starten på en uendelig række af polyedre, der konstrueres ved at lægge de femkantede indsættelser længere fra hinanden. For at karakterisere de forskellige polyederstrukturer i serien bruger vi igen de hexagonale koordinater \(h\) og \(k\), der nu angiver trin mellem hexagonale midtpunkter i det hexagonale undergitter, til at angive de mulige afstande mellem de pentagonale indsættelser. I de tre yderligere gitter er midtpunkterne af naboskabende sekskanter længere væk fra hinanden end i det sekskantede gitter. Det område, der dækkes af en trekantet facet, som forbinder midtpunkterne af naboseksagoner (dvs. tilfældet \(h=0\) og \(k=1\) eller omvendt), er således større end i CK-konstruktionen med en faktor \({\alpha }_{t}=4/3\ca. 1).33\) for \((3,6,3,6)\) gitteret, \({\alpha }_{s}=7/3\approx 2.33\) for \(({3}^{4},6)\)\) gitteret og \({\alpha }_{r}=4/3+2/\sqrt{3}\approx 2.49\) for \((3,4,6,3)\)\) gitteret, dvs, med faktorer, der svarer til de relative størrelser af de asymmetriske gitterenheder (se farvede fremhævninger i fig. 2a). T-tallet i CK-konstruktionen kan derfor skaleres tilsvarende for de nye gitter som følger
hvor \(j=t,s,r\) angiver den gittertype, der er anvendt i konstruktionen, og betegner henholdsvis det trihexagonale, det snubhexagonale og det rhombitrihexagonale gitter. Et polyeder med betegnelsen \({T}_{j}(h,k)\) har det samme antal pentagoner og hexagoner som et \(T(h,k)\) Caspar Klug-gitter, men overfladen dækket af dets flader er større på grund af de ekstra polygoner (trekanter, firkanter) mellem seks- og femkanterne. Dette angives af skaleringsfaktoren \({\alpha }_{j}\), der henviser til gevinsten i overfladeareal i henhold til det plane gitter, som det er konstrueret ud fra, som illustreret i fig. 2.
De resulterende geometrier (Supplerende tabeller 2-4) udvider spektret af mulige icosaedriske virale blueprints betydeligt. F.eks. ligger \({T}_{t}(1,0)=4/3\), \({T}_{s}(1,0)=7/3\) og \({T}_{r}(1,0)=(4/3+2/\sqrt{3})\) mellem \(T(1,0)=1\) og \(T(1,1)=3\). CK-blåtryk med hensyn til capsidstørrelse (fig. 2d), hvis deres hexagonale (sub)gitter antages at have samme fodaftryk på capsidoverfladen, dvs. samme CP-størrelser. Desuden udgør nogle af disse geometrier alternative layouts for CK-geometrier af samme størrelse, som f.eks. \({T}_{t}(1,1)=4\) og \({T}_{s}(1,1)=7\) for henholdsvis \(T(2,0)=4\) og \(T(2,1)=7\)-strukturer. I disse tilfælde har de alternative capsidmodeller de samme relative overfladearealer, men forudsiges at have forskellige antal og orienteringer af hexamere og pentamere med interstitielle rum mellem disse capsomere. Disse alternative strukturer (og deres dualer) svarer til tidligere uanede capsidlayouts og tilbyder en forenende ramme for klassificeringen af icosaedriske virusarkitekturer.
Non-quasi-ækvivalente arkitekturer i HK97-linjen
Der rapporteres om et stigende antal capsidarkitekturer med CP-antal og capsidlayouts, der er uforenelige med CK-teoriens geometriske blueprints. Virus med capsider, der er dannet af en kombination af et større og mindre capsidprotein, er eksempler, som er udfordrende at fortolke i den klassiske CK-teori. Her giver vi eksempler fra HK97-linjen og viser, at sådanne vira kan rationaliseres i den Archimediske gitterramme, der foreslås her.
Bacillus-fagen Basilisk indeholder f.eks. 1080 CP’er, der kombinerer 540 major capsidproteiner (MCP’er) og 540 minor capsidproteiner (mCP’er)19 . Hvis man anvender relationen \(60\ T\\) for CP-numre i CK-teorien, ville dette svare til et \(T\)-tal på 18, hvilket er udelukket af den geometriske begrænsning i CK-teorien, der er givet ved ekv. 1. Hvis man kun fokuserer på de 12 pentamere (mere præcist 11 pentamere og en formodet portal) og 80 hexamere, så ville dens struktur blive klassificeret som \(T(3,0)=9\)19. Dette ignorerer imidlertid de 180 intersticiale trimere og giver et forkert billede af de relative orienteringer af proteinklyngerne samt af capsidets overfladeareal (fig. 3a). I modsætning hertil er Basilisk’ CP-positioner nøjagtigt repræsenteret af en \({T}_{t}(3,0)=12\)-struktur baseret på den trihexagonale gitterserie inden for rammerne af det overordnede icosaedriske designprincip. Denne klassifikation er også i overensstemmelse med målinger af Basilisk’ overfladeareal (\(1,69\times 1{0}^{4}\ {{\rm{nm}}}}^{2}\\), se Metoder), der er sammenlignelig med overfladearealet af fagen SIO-2 (\(1,70\times 1{0}^{4}\ {{{rm{nm}}}}^{2}}\)), som er et klassisk \(T=12\) capsid20. Basilisk-kapsiden er således en icosaedrisk struktur af samme størrelse som i en CK-geometri, men udviser et CP-tal og et capsidlayout, der ikke er muligt i CK-formalismen.
Basilisk (fig. 3a) deler sin MCP-foldning med andre bakteriofager, arkæale og animalske vira i HK97-linjen12,21,22. En revurdering af andre virusstrukturer inden for denne slægt afslører, at disse evolutionært beslægtede vira deler den samme underliggende icosaedriske gittergeometri, dvs, de tilhører den samme serie af polyedriske konstruktioner (i dette tilfælde den trihexagonale serie af \({T}_{t}\\)-arkitekturer).
For eksempel organiserer herpes simplex virus type 1 (HSV-1) sin MCP (VP5) i hexamere og pentamere med orienteringer, der minder om dem i Basilisk-kapsiden (fig. 3b). Placeringen af disse capsomerer er i overensstemmelse med den nuværende klassificering af HSV-1 som \(T(4,0)=16\). Dette giver imidlertid et forkert billede af de relative orienteringer af hexamere og ignorerer det sekundære netværk af trimeriske komplekser mellem capsomerne, som er dannet af tre mCP’er (Tr1, Tr2a og Tr2b)23. Klassificeringen som en \({T}_{t}(4,0)=64/3\) struktur i den nye ramme (Supplerende tabel 2) afspejler imidlertid nøjagtigt både dens 960 MCP’er og 960 mCP’er. Det samme gælder for humant cytomegalovirus (HCMV)24 (struktur ikke vist), som strukturelt ligner HSV-1.
Det modne capsid af fagen \(\lambda\) (Fig. 3c) er et andet eksempel på et virus af HK97-linjen med en trihexagonal icosahedral struktur. Den er i øjeblikket klassificeret som \(T(2,1)=7\)12, men orienteringen af capsomerne viser i stedet layoutet af en \({T}_{t}(2,1)=28/3\)-struktur, fordi de fremspringende domæner af MCP’erne – snarere end yderligere mCP’er – optager det trekantede undergitter. Disse positioner er også placeringerne af forstærkningsproteinerne gpD25, hvilket understreger betydningen af disse trimeriske positioner i overfladegitteret (Fig. 3c). Alternativt er Halorubrum sodomense tailed virus 2 (HSTV-2), et andet medlem af HK97-linjen, blevet klassificeret som \(T(2,1)=7\). Dets capsid indeholder imidlertid gpD-lignende trimere, der indtager intersticiale positioner mellem capsomere, hvilket er i overensstemmelse med den trihexagonale struktur \({T}_{t}(2,1)=28/3\) (se fig. 8 i Pietilä et al.26). Dette indebærer en forøgelse af capsidvolumen (og dermed genomstørrelsen) med en faktor \({\alpha }_{t}^{3/2}\ca. 1,54\) i forhold til et klassisk \(T(2,1)\) capsid. Denne forudsigelse er i overensstemmelse med den empiriske observation, at HSTV-2 har et genom, der er ~\(1,4-1,7\) større end det for \(T=7\) svansede fager26, hvilket yderligere underbygger dens klassificering som et \({T}_{t}(2,1)=28/3\) capsid i vores ramme. Et andet eksempel er den termofile bakteriofag P23-45, som i øjeblikket klassificeres som en superstørrelse \(T=7\)-capsidarkitektur27.
Sammenfattende tyder disse eksempler på, at det klassifikationsskema for virusarkitektur, der er indført her, fremhæver strukturelle træk, der deles af evolutionært beslægtede vira, og dermed egner sig som et kendetegn for virale slægtslinjer.
Alternative capsidlayouts med identisk stoichiometri
Der findes mange eksempler på kvasiekvivalente virale capsider, der er dannet af det samme antal CP’er, men som udviser forskellige CP-positioner og capsomerer. CK-teorien skelner ikke mellem dem. Vi viser imidlertid her på grundlag af eksemplet med forskellige \(T=3\)-geometrier, at de arkimediske gitter og deres dualer – kaldet Laves-gitter – giver mulighed for at løse dette.
I CK-teorien anvendes hexagonale overfladegitter og deres dualer, der svarer til det trekantede gitter (3, 3, 3), på kryds og tværs. Det mindste icosaedriske polyeder, der er afledt af et trekantgitter, er icosaederet, der består af 20 trekanter. Det næststørste er dannet af 60 trekanter og giver et udkast til en klassisk \(T=3\)-struktur. Ved hjælp af CK-teoriens konvention om, at polyedriske flader skal repræsentere grupper af proteiner, der antalsmæssigt svarer til fladens rotationssymmetri (f.eks. tre trekanter, der repræsenterer tre proteiner osv.), kan capsid-layouts forbindes med polyedriske strukturer. Pariacoto-virus (PAV; fig. 4a) med sin stærke interaktion mellem de tre kæder, der danner de trekantede enheder, er et eksempel på denne type \({T}^{D}(1,1)\) overfladearkitektur.