Polyedriske modeller af icosaedrisk arkitektur

Virusstrukturer er fremtrædende eksempler på icosaedrisk symmetri i biologi. Deres arkitekturer er i øjeblikket modelleret og klassificeret i form af en række Goldberg-polyedre14 – tredimensionelle faste stoffer med pentagonale og hexagonale flader – som giver en referenceramme for positionerne af kapsidproteinerne (fig. 1a). Især angiver de polyedriske flader positionerne for pentagonale og hexagonale proteinklynger, der kaldes henholdsvis pentamere og hexamere. De samme polyedre giver også tegninger for de atomare positioner for fullerenburene i kulstofkemien, navnlig Buckminster-fullerenen, der er kendt som buckyball1. De er også et mønster for den strukturelle organisering af en lang række både menneskeskabte og naturlige proteinnanocontainere. Deres dualer, de geodætiske polyedre15 , er de arkitektoniske designs af Buckminster Fullers geodætiske kupler.

Goldberg-polyedre kan konstrueres ud fra et sekskantet gitter ved at erstatte 12 sekskanter med femkanter (fig. 1b), som det kræves i Eulers sætning for at generere en lukket polyedrisk form16. Afstanden \(D\) mellem femkanterne på de tilstødende femfoldige hjørner er den eneste frihedsgrad i denne konstruktion og kan derfor bruges til at mærke de forskellige geometriske muligheder i denne uendelige række af polyedre. \(D\) kan kun antage bestemte værdier, som begrænses af den underliggende sekskantede gittergeometri. Navnlig ved at bruge de hexagonale koordinater \(h\) og \(k\), som antager en hvilken som helst helhedsværdi eller nul for at navigere mellem midtpunkterne af nabosexagoner i gitteret, opnår man følgende geometriske begrænsning11:

$$$T(h,k):= {D}^{2}(h,k)/{A}_{0}=\left({h}^{2}+hk+hk+{k}^{2}\right).$$
(1)

Her svarer \({A}_{0}\) til arealet af den mindste trekant mellem eventuelle sekskantede midtpunkter, dvs. tilfældet \(h=1\) og \(k=0\)-eller tilsvarende \(h=0\) og \(k=1\). En lignende formel er blevet udledt for aflange capsidstrukturer17.

T kaldes trianguleringstallet (fig. 1c) på grund af dets geometriske fortolkning i form af de icosaedriske trianguleringer, der opnås ved at forbinde midtpunkterne af tilstødende pentagoner og hexagoner, dvs. i form af de dobbelte (geodætiske) polyedre. T angiver antallet af trekantede flader, kaldet facetter, i trianguleringen, som dækker en trekantet flade af icosaedret med et areal. Ved at knytte en proteinunderenhed til hvert hjørne af en sådan trekantet facet oversættes denne uendelige række af trianguleringer til capsid-layouts i kvasiekvivalensteorien (fig. 1d). Sådanne tegninger tillader kun capsidlayouts med 60T CP’er, der er organiseret i 12 pentamere og \(10(T-1)\ hexamere11. Betingelsen udtrykt ved Eq. 1 er derfor en geometrisk begrænsning af de mulige værdier af T og de mulige CP-numre i CK-geometrier. De indledende elementer i serien er \(T=\)1, 3, 4 og 7, og derfor er antallet af CP’er i små icosaedriske kapsider henholdsvis 60, 180, 240 og 420 (Supplerende tabel 1).

Dette er imidlertid kun én måde, hvorpå en icosaedrisk struktur kan opbygges af gentagelser af den samme (asymmetriske) enhed, og udelukker geometrier, der er opbygget af proteiner af forskellig størrelse (f.eks. et større og mindre kapsidprotein) eller kapsider, der er opbygget af et protein, hvor et eller flere domæner spiller forskellige roller. Sådanne kapsidlayouts skal konstrueres ud fra gitter, hvor hvert toppunkt er identisk med hensyn til længden, antallet og de relative vinkler af dets udragende kanter, men de relative vinkler mellem forskellige kanter ved det samme toppunkt kan variere, hvilket afspejler besættelsen af forskellige typer proteiner eller proteindomæner. Ud fra et geometrisk synspunkt er der kun 11 gitter (kapitel 2 i Grünbaum og Shephard18 ), der opfylder dette generaliserede kvasi-ækvivalensprincip, som er de arkimediske gitter – også kendt som ensartede gitter13,16. Blandt disse gitter er der kun fire, der indeholder et sekskantet undergitter (fig. 2a). Et af dem er selve det sekskantede gitter, som CK-klassifikationsskemaet er baseret på. Dette gitter er mærket \((6,6,6,6)\) i henhold til de typer regulære polygoner, der omgiver hvert toppunkt, i dette tilfælde tre sekskantede polygoner. Det sekskantede gitter er imidlertid kun det enkleste gitter, der muliggør denne konstruktion. Andre gitter, der indeholder sekskanter i passende afstande, dvs. som et sekskantet undergitter, er lige så velegnede til CK-konstruktionen, men er indtil nu blevet ignoreret. Det drejer sig om det trihexagonale flisebelægningssystem \((3,6,3,6)\), det snubhexagonale flisebelægningssystem \(({3}^{4},6)\) og det rhombitrihexagonale flisebelægningssystem \((3,4,6,4)\). (fig. 2a). Disse gitter kaldes også henholdsvis hexadeltille, snub hextille og det afkortede hexadeltille gitter16.

Figur 2
figur2

Design af icosaedriske arkitekturer ud fra arkimediske gitter. a De fire arkimediske gitter, der muliggør Caspar-Klug-konstruktionen (fra top til bund): det hexagonale \((6,6,6)\), det trihexagonale \((3,6,3,6)\), det snubhexagonale \(({3}^{4},6)\) og det rhombitrihexagonale \((3,4,6,4)\)\) gitter. I hvert tilfælde er den asymmetriske enhed (gentagelsesenheden i gitteret) fremhævet. Dens overlapning med det hexagonale undergitter, der er anvendt til opbygning af de icosaedriske polyedre, er vist med rødt. Ud over det sekskantede gitter omfatter dette også en tredjedel af en trekantet overflade (blå) og desuden en trekant eller et halvt kvadrat (begge vist i grønt) for henholdsvis to af gitterne. b Konstruktion af arkimediske faste legemer ved at erstatte 12 sekskanter med femkanter i analogi med Caspar-Klug-konstruktionen (se også fig. 1b). c De polyederformer, der svarer til de eksempler, der er vist i b. De svarer hver især til den mindste polyeder i en uendelig række af polyedre for den givne gittertype. Foldede strukturer for større elementer i den nye serie findes i supplerende figur 2. d De mindste polyederformer (\({T}_{t}\), \({T}_{s}\) og \({T}_{r}\), der betegner polyedre afledt af henholdsvis det trihexagonale, snubhexagonale og rhombitrihexagonale gitter) er vist organiseret efter deres størrelse i forhold til Caspar-Klug-polyedrene. Da overfladearealerne skaleres i henhold til Eq. (2) i forhold til Caspar-Klug-geometrierne, falder de nye løsninger ind i de størrelsesmæssige huller mellem polyederne i Caspar-Klug-serien eller giver alternative layouts for capsider af samme størrelse, som det er tilfældet for \(T(2,0)={T}_{t}(1,1)=4/3T(1,1)=4\)

I analogi med Caspar og Klugs konstruktion klassificerer vi de icosaedriske polyedre, der kan konstrueres ud fra disse tilings via udskiftning af 12 hexagoner med pentagoner (Fig. 2b). Udskiftning af hexagoner i nærmeste nabo resulterer i hvert enkelt tilfælde i et icosaedisk symmetrisk arkimedisk rum (fig. 2c), der svarer til starten på en uendelig række af polyedre, der konstrueres ved at lægge de femkantede indsættelser længere fra hinanden. For at karakterisere de forskellige polyederstrukturer i serien bruger vi igen de hexagonale koordinater \(h\) og \(k\), der nu angiver trin mellem hexagonale midtpunkter i det hexagonale undergitter, til at angive de mulige afstande mellem de pentagonale indsættelser. I de tre yderligere gitter er midtpunkterne af naboskabende sekskanter længere væk fra hinanden end i det sekskantede gitter. Det område, der dækkes af en trekantet facet, som forbinder midtpunkterne af naboseksagoner (dvs. tilfældet \(h=0\) og \(k=1\) eller omvendt), er således større end i CK-konstruktionen med en faktor \({\alpha }_{t}=4/3\ca. 1).33\) for \((3,6,3,6)\) gitteret, \({\alpha }_{s}=7/3\approx 2.33\) for \(({3}^{4},6)\)\) gitteret og \({\alpha }_{r}=4/3+2/\sqrt{3}\approx 2.49\) for \((3,4,6,3)\)\) gitteret, dvs, med faktorer, der svarer til de relative størrelser af de asymmetriske gitterenheder (se farvede fremhævninger i fig. 2a). T-tallet i CK-konstruktionen kan derfor skaleres tilsvarende for de nye gitter som følger

$$${T}_{j}(h,k):= {\alpha }_{j}\left({h}^{2}+hk+{k}^{2}\right)={\alpha }_{j}\\ T(h,k)\ ,$$$
(2)

hvor \(j=t,s,r\) angiver den gittertype, der er anvendt i konstruktionen, og betegner henholdsvis det trihexagonale, det snubhexagonale og det rhombitrihexagonale gitter. Et polyeder med betegnelsen \({T}_{j}(h,k)\) har det samme antal pentagoner og hexagoner som et \(T(h,k)\) Caspar Klug-gitter, men overfladen dækket af dets flader er større på grund af de ekstra polygoner (trekanter, firkanter) mellem seks- og femkanterne. Dette angives af skaleringsfaktoren \({\alpha }_{j}\), der henviser til gevinsten i overfladeareal i henhold til det plane gitter, som det er konstrueret ud fra, som illustreret i fig. 2.

De resulterende geometrier (Supplerende tabeller 2-4) udvider spektret af mulige icosaedriske virale blueprints betydeligt. F.eks. ligger \({T}_{t}(1,0)=4/3\), \({T}_{s}(1,0)=7/3\) og \({T}_{r}(1,0)=(4/3+2/\sqrt{3})\) mellem \(T(1,0)=1\) og \(T(1,1)=3\). CK-blåtryk med hensyn til capsidstørrelse (fig. 2d), hvis deres hexagonale (sub)gitter antages at have samme fodaftryk på capsidoverfladen, dvs. samme CP-størrelser. Desuden udgør nogle af disse geometrier alternative layouts for CK-geometrier af samme størrelse, som f.eks. \({T}_{t}(1,1)=4\) og \({T}_{s}(1,1)=7\) for henholdsvis \(T(2,0)=4\) og \(T(2,1)=7\)-strukturer. I disse tilfælde har de alternative capsidmodeller de samme relative overfladearealer, men forudsiges at have forskellige antal og orienteringer af hexamere og pentamere med interstitielle rum mellem disse capsomere. Disse alternative strukturer (og deres dualer) svarer til tidligere uanede capsidlayouts og tilbyder en forenende ramme for klassificeringen af icosaedriske virusarkitekturer.

Non-quasi-ækvivalente arkitekturer i HK97-linjen

Der rapporteres om et stigende antal capsidarkitekturer med CP-antal og capsidlayouts, der er uforenelige med CK-teoriens geometriske blueprints. Virus med capsider, der er dannet af en kombination af et større og mindre capsidprotein, er eksempler, som er udfordrende at fortolke i den klassiske CK-teori. Her giver vi eksempler fra HK97-linjen og viser, at sådanne vira kan rationaliseres i den Archimediske gitterramme, der foreslås her.

Bacillus-fagen Basilisk indeholder f.eks. 1080 CP’er, der kombinerer 540 major capsidproteiner (MCP’er) og 540 minor capsidproteiner (mCP’er)19 . Hvis man anvender relationen \(60\ T\\) for CP-numre i CK-teorien, ville dette svare til et \(T\)-tal på 18, hvilket er udelukket af den geometriske begrænsning i CK-teorien, der er givet ved ekv. 1. Hvis man kun fokuserer på de 12 pentamere (mere præcist 11 pentamere og en formodet portal) og 80 hexamere, så ville dens struktur blive klassificeret som \(T(3,0)=9\)19. Dette ignorerer imidlertid de 180 intersticiale trimere og giver et forkert billede af de relative orienteringer af proteinklyngerne samt af capsidets overfladeareal (fig. 3a). I modsætning hertil er Basilisk’ CP-positioner nøjagtigt repræsenteret af en \({T}_{t}(3,0)=12\)-struktur baseret på den trihexagonale gitterserie inden for rammerne af det overordnede icosaedriske designprincip. Denne klassifikation er også i overensstemmelse med målinger af Basilisk’ overfladeareal (\(1,69\times 1{0}^{4}\ {{\rm{nm}}}}^{2}\\), se Metoder), der er sammenlignelig med overfladearealet af fagen SIO-2 (\(1,70\times 1{0}^{4}\ {{{rm{nm}}}}^{2}}\)), som er et klassisk \(T=12\) capsid20. Basilisk-kapsiden er således en icosaedrisk struktur af samme størrelse som i en CK-geometri, men udviser et CP-tal og et capsidlayout, der ikke er muligt i CK-formalismen.

Figur 3
figur3

Virus inden for en viral slægt, der vedtager den samme icosaedriske serie. Eksempler på vira i HK97-linjen, der viser, at forskellige medlemmer tilpasser sig den samme familie af icosaedriske polyedre: a Basilisk (\({T}_{t}(3,0)\)), b HSV-1 (\({T}_{t}(4,0)\)), c phage \(\lambda\) (\({T}_{t}(2,1)\)). Byggestenene i deres polyedriske overfladenetværk er vist med rødt (pentagoner), blåt (hexagoner) og grønt (trekanter) overlejret på figurer tilpasset fra (a)19, (b)23 og (c)25

Basilisk (fig. 3a) deler sin MCP-foldning med andre bakteriofager, arkæale og animalske vira i HK97-linjen12,21,22. En revurdering af andre virusstrukturer inden for denne slægt afslører, at disse evolutionært beslægtede vira deler den samme underliggende icosaedriske gittergeometri, dvs, de tilhører den samme serie af polyedriske konstruktioner (i dette tilfælde den trihexagonale serie af \({T}_{t}\\)-arkitekturer).

For eksempel organiserer herpes simplex virus type 1 (HSV-1) sin MCP (VP5) i hexamere og pentamere med orienteringer, der minder om dem i Basilisk-kapsiden (fig. 3b). Placeringen af disse capsomerer er i overensstemmelse med den nuværende klassificering af HSV-1 som \(T(4,0)=16\). Dette giver imidlertid et forkert billede af de relative orienteringer af hexamere og ignorerer det sekundære netværk af trimeriske komplekser mellem capsomerne, som er dannet af tre mCP’er (Tr1, Tr2a og Tr2b)23. Klassificeringen som en \({T}_{t}(4,0)=64/3\) struktur i den nye ramme (Supplerende tabel 2) afspejler imidlertid nøjagtigt både dens 960 MCP’er og 960 mCP’er. Det samme gælder for humant cytomegalovirus (HCMV)24 (struktur ikke vist), som strukturelt ligner HSV-1.

Det modne capsid af fagen \(\lambda\) (Fig. 3c) er et andet eksempel på et virus af HK97-linjen med en trihexagonal icosahedral struktur. Den er i øjeblikket klassificeret som \(T(2,1)=7\)12, men orienteringen af capsomerne viser i stedet layoutet af en \({T}_{t}(2,1)=28/3\)-struktur, fordi de fremspringende domæner af MCP’erne – snarere end yderligere mCP’er – optager det trekantede undergitter. Disse positioner er også placeringerne af forstærkningsproteinerne gpD25, hvilket understreger betydningen af disse trimeriske positioner i overfladegitteret (Fig. 3c). Alternativt er Halorubrum sodomense tailed virus 2 (HSTV-2), et andet medlem af HK97-linjen, blevet klassificeret som \(T(2,1)=7\). Dets capsid indeholder imidlertid gpD-lignende trimere, der indtager intersticiale positioner mellem capsomere, hvilket er i overensstemmelse med den trihexagonale struktur \({T}_{t}(2,1)=28/3\) (se fig. 8 i Pietilä et al.26). Dette indebærer en forøgelse af capsidvolumen (og dermed genomstørrelsen) med en faktor \({\alpha }_{t}^{3/2}\ca. 1,54\) i forhold til et klassisk \(T(2,1)\) capsid. Denne forudsigelse er i overensstemmelse med den empiriske observation, at HSTV-2 har et genom, der er ~\(1,4-1,7\) større end det for \(T=7\) svansede fager26, hvilket yderligere underbygger dens klassificering som et \({T}_{t}(2,1)=28/3\) capsid i vores ramme. Et andet eksempel er den termofile bakteriofag P23-45, som i øjeblikket klassificeres som en superstørrelse \(T=7\)-capsidarkitektur27.

Sammenfattende tyder disse eksempler på, at det klassifikationsskema for virusarkitektur, der er indført her, fremhæver strukturelle træk, der deles af evolutionært beslægtede vira, og dermed egner sig som et kendetegn for virale slægtslinjer.

Alternative capsidlayouts med identisk stoichiometri

Der findes mange eksempler på kvasiekvivalente virale capsider, der er dannet af det samme antal CP’er, men som udviser forskellige CP-positioner og capsomerer. CK-teorien skelner ikke mellem dem. Vi viser imidlertid her på grundlag af eksemplet med forskellige \(T=3\)-geometrier, at de arkimediske gitter og deres dualer – kaldet Laves-gitter – giver mulighed for at løse dette.

I CK-teorien anvendes hexagonale overfladegitter og deres dualer, der svarer til det trekantede gitter (3, 3, 3), på kryds og tværs. Det mindste icosaedriske polyeder, der er afledt af et trekantgitter, er icosaederet, der består af 20 trekanter. Det næststørste er dannet af 60 trekanter og giver et udkast til en klassisk \(T=3\)-struktur. Ved hjælp af CK-teoriens konvention om, at polyedriske flader skal repræsentere grupper af proteiner, der antalsmæssigt svarer til fladens rotationssymmetri (f.eks. tre trekanter, der repræsenterer tre proteiner osv.), kan capsid-layouts forbindes med polyedriske strukturer. Pariacoto-virus (PAV; fig. 4a) med sin stærke interaktion mellem de tre kæder, der danner de trekantede enheder, er et eksempel på denne type \({T}^{D}(1,1)\) overfladearkitektur.

Fig. 4
figure4

Capsidproteingrænseflader er begrænset af icosaedrisk geometri. Klassifikationen af icosaedriske designs skelner mellem capsidlayouts af virus, der er dannet af det samme antal proteiner. Eksempler på en trekant- og rhombetiling er vist: a Pariacoto-virus (\({T}^{D}(1,1)\)); b MS2 (\({T}_{t}^{D}(1,1)\)). Fliserne er vist overlejret på figurer tilpasset fra ViPER-databasen (Pariacoto-virus: PDB-id 1f8v64; MS2: PDB-id 2ms265)

Dualerne af de andre arkimediske gitter (trihexagonale, snubhexagonale, rhombitrihexagonale) præsenterer alternative overfladearkitekturer til dem i CK-teorien i form af henholdsvis rhomb-, floret- og kite-fliser (jf. Supplerende tabel 5). En streng anvendelse af CK-reglen om, at en flises symmetri skal være korreleret med antallet af proteiner, som flisen repræsenterer, udpeger de dobbelte trihexagonale gitter (\({T}_{t}^{D}\})), dvs. rhomb-fliserne med fliser, der repræsenterer klynger af to proteiner (CP-dimere). Rhomb-tilings giver alternative layouts til CK-overfladegitterne og beskriver capsider med den samme proteinstøkiometri, men med forskellig CP-organisation. Bakteriofagen MS2 (fig. 4b), en virus, der er sammensat af 90 CP-dimere, er et eksempel på en \(T=3\) rhombetiling (\({T}_{t}^{D}(1,1)\); Supplerende tabel 5). Bemærk, at mens proteinstoiometrien i dette tilfælde er sammenfaldende med CK-rammen, svarende til de 180 proteiner, der forventes for en \(T=3\)-struktur, giver identifikationen som en \({T}_{t}^{D}(1,1)\)-geometri en mere præcis redegørelse for CP-positioner og deres relative orienteringer i capsidoverfladen.

Nej kvasi-ækvivalente og rhombetilinger af højere orden

Udvides CK-konventionen til at tillade rhomber at repræsentere mere end to CP’er, så længe deres positioner på flisen respekterer flisens symmetri, er et højere antal proteiner også tænkeligt geometrisk set. Dette kunne f.eks. opnås ved at kombinere to dimere. Proteinstøkiometrien for sådanne kapsider ville være \(120\ T(h,k)\), og de første elementer i serien ville indeholde 120, 360 og 480 proteiner. Picobirnavirus er et eksempel på det første element i denne serie (supplerende fig. 3a). Denne virus danner rhombuslignende fliser bestående af to proteindimerer i parallel orientering og indeholder i alt 120 proteiner28. Denne struktur er traditionelt blevet beskrevet som et forbudt \(T=2\)-nummer i CK-rammen, men den passer naturligt ind i den nye ramme som en rhombeflisning af højere orden. De næste elementer i denne serie forudsiger, at der findes de forbudte tal \(T=6\) (360 proteiner) og \(8\) (480 proteiner). Efter dette mønster er det logisk at tænke på muligheden af rhombelignende fliser, der repræsenterer tre proteindimerer, hvilket også ville opfylde den krævede tofoldssymmetri. Proteinstoiometrien for disse kapsider ville være \(180\, T(h,k)\), og de tre mindste geometrier af denne type ville indeholde 180, 540 og 720 proteiner. Et eksempel på det første element i denne serie er Zikavirus (supplerende fig. 3b) i Flaviviridae-familien. Hver rombeplade i dens capsid repræsenterer seks langstrakte proteiner (tre parallelle dimere, der respekterer den dobbelte symmetri af pladen), således at de 30 plader repræsenterer 180 proteiner i alt. I et banebrydende arbejde i 2002 opdagede Rossmann-laboratoriet og samarbejdspartnere, at de tre E-monomerer i hver icosaedrisk asymmetrisk enhed i Denguevirus29 ikke har kvasiekvivalente symmetriske miljøer i det eksterne, icosaedriske stillads, der er dannet af de 90 glycoprotein E-dimerer. Vores tilgang, der er baseret på dualerne af de arkimediske gitter, tager højde for sådanne ikke-kvasieækvivalente capsidstrukturer.

Vores rammer udvider således forudsigelserne i kvasieækvivalensteorien med en mere detaljeret forståelse af capsidgeometrien, idet der skelnes mellem capsidarkitekturer med forskellige typer af capsidproteinorganisation og grænseflader, når der er det samme antal capsidproteiner. Dette er vigtigt for en bedre forståelse af de biofysiske egenskaber ved virale kapsider, f.eks. deres stabilitet, og deres rolle i virale livscyklusser, f.eks. under samling og adskillelse af virioner, og afslører geometriske begrænsninger for viral evolution.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.