Strukturella pussel i virologi löses med en övergripande icosaedrisk designprincip

Polyedriska modeller av icosaedrisk arkitektur
Intekvasi-ekvivalenta arkitekturer i HK97-linjen
Alternativa capsidlayouter med identisk stökiometri
Nej kvasi-ekvivalenta och högre ordningens rombtecken

Polyedriska modeller av icosaedrisk arkitektur

Virusstrukturer är framstående exempel på icosaedrisk symmetri i biologin. Deras arkitektur modelleras och klassificeras för närvarande i termer av en serie Goldbergpolyeder14 – tredimensionella solider med pentagonala och hexagonala ytor – som ger en referensram för positionerna för kapsidproteinerna (fig. 1a). De polyedriska ytorna anger särskilt positionerna för pentagonala och hexagonala proteinkluster som kallas pentamerer respektive hexamerer. Samma polyeder ger också blåkopior för de atomära positionerna för fullerenburarna i kolkemin, särskilt Buckminster-fullerenen som är känd som buckyball1. De utgör också ritningar för den strukturella organisationen av ett brett spektrum av både konstgjorda och naturliga proteinnanocontainrar. Deras dualer, de geodetiska polyederna15 , är de arkitektoniska utformningarna av Buckminster Fullers geodetiska kupoler.

Goldbergpolyeder kan konstrueras från ett hexagonalt rutnät (gitter) genom att ersätta 12 sexhörningar med femhörningar (fig. 1b), vilket krävs enligt Eulers sats för att generera en sluten polyedrisk form16. Avståndet $D$ mellan femhörnen vid angränsande femfältiga hörn är den enda frihetsgraden i denna konstruktion och kan därför användas för att märka de olika geometriska alternativen i denna oändliga serie polyedrar. $D$ kan endast anta specifika värden som begränsas av den underliggande hexagonala gittergeometrin. Särskilt genom att använda de hexagonala koordinaterna $h$ och $k$, som antar valfria heltalsvärden eller noll för att navigera mellan mittpunkterna för angränsande hexagoner i gittret, får man följande geometriska begränsning11:

$$$T(h,k):= {D}^{2}(h,k)/{A}_{0}=\vänster({h}^{2}+hk+{k}^{2}\right).$$

(1)

Här motsvarar ${A}_{0}$ arean av den minsta triangeln mellan alla hexagonala mittpunkter, det vill säga fallet $h=1$ och $k=0$- eller motsvarande $h=0$ och $k=1$. En liknande formel har tagits fram för långsträckta kapsidstrukturer17.

T kallas trianguleringstalet (fig. 1c) på grund av dess geometriska tolkning i termer av de isosaedriska trianguleringar som erhålls genom att förbinda mittpunkterna i angränsande fem- och sexhörningar, dvs. i termer av de dubbla (geodetiska) polyederna. T anger antalet triangulära ytor, så kallade facetter, i trianguleringen som täcker en triangulär yta av ikosaedern till ytan. Genom att en proteinunderenhet associeras med varje hörn av en sådan triangulär fasett översätts denna oändliga serie trianguleringar till capsidlayouter i kvasiekvivalensteorin (fig. 1d). Sådana ritningar tillåter endast kapsidlayouter med 60T CP, organiserade i 12 pentamerer och $10(T-1)\ hexamerer11. Det villkor som uttrycks av ekv. 1 är därför en geometrisk begränsning av de möjliga värdena på T och de möjliga CP-numren i CK-geometrierna. De första elementen i serien är \(T=$1, 3, 4 och 7, och därför är antalet CP som ingår i små isosaedriska kapslar 60, 180, 240 respektive 420 (kompletterande tabell 1).

Detta är dock bara ett sätt på vilket en ikosaedrisk struktur kan byggas upp av upprepningar av samma (asymmetriska) enhet, och utesluter geometrier som byggs upp av proteiner av olika storlekar (t.ex. ett större och ett mindre kapsidprotein) eller kapslar som byggs upp av ett protein där en eller flera domäner spelar skilda roller. Sådana kapsidlayouter måste byggas av gitter där varje hörn är identiskt när det gäller längden, antalet och de relativa vinklarna på dess utskjutande kanter, men de relativa vinklarna mellan olika kanter vid samma hörn kan variera, vilket avspeglar att de är upptagna av olika typer av proteiner eller proteindomäner. Ur geometrisk synvinkel finns det endast 11 nät (kapitel 2 i Grünbaum och Shephard18) som uppfyller denna generaliserade kvasi-ekvivalensprincip, vilka är de arkimediska nätverken – även kända som enhetliga nät13,16. Bland dessa gitter är det bara fyra som innehåller ett hexagonalt delgitter (fig. 2a). Ett av dem är själva det hexagonala gitteret som ligger till grund för CK:s klassificeringssystem. Detta gitter är märkt $(6,6,6)$ enligt de typer av regelbundna polygoner som omger varje hörn, i detta fall tre hexagoner. Det hexagonala gittret är dock bara det enklaste rutnätet som möjliggör denna konstruktion. Andra gitter som innehåller hexagoner på lämpliga avstånd, dvs. som ett hexagonalt delgitter, är lika lämpliga för CK-konstruktionen, men har hittills ignorerats. Dessa är den trihexagonala kaklingen $(3,6,3,6)$, den snub hexagonala kaklingen $({3}^{4},6)$, och den rombitrihexagonala kaklingen $(3,4,6,4)$. (fig. 2a). Dessa gitter kallas också hexadeltille, snub hextille respektive det trunkerade hexadeltille-gallret16.

I analogi med Caspar och Klugs konstruktion klassificerar vi de ikosaedriska polyeder som kan konstrueras från dessa tilings genom att ersätta 12 hexagoner med femhörningar (Fig. 2b). Ersättning av närmast angränsande hexagoner resulterar i varje fall i en isosaediskt symmetrisk arkimedisk solid (fig. 2c) som motsvarar början på en oändlig serie polyedrar, som konstrueras genom att femhörniga infogningar görs med större avstånd till varandra. För att karakterisera olika polyederstrukturer i serien använder vi återigen de hexagonala koordinaterna $h$ och $k$, som nu anger steg mellan hexagonala mittpunkter i det hexagonala delgittret, för att ange de möjliga avstånden mellan de pentagonala insatserna. I de tre ytterligare gittren är mittpunkterna för angränsande hexagoner mer avlägsna än i det hexagonala gittret. Den yta som täcks av en triangulär fasett som förbinder mittpunkterna på angränsande sexhörningar (dvs. fallet $h=0$ och $k=1$, eller vice versa) är större än i CK-konstruktionen med en faktor ${\alpha }_{t}=4/3\approx 1.33$ för $(3,6,3,6)$-gitteret, ${\alpha }_{s}=7/3\approx 2.33$ för $({3}^{4},6)$-gitteret, och ${\alpha }_{r}=4/3+2/\sqrt{3}\approx 2.49$ för $(3,4,6,3)$-gitteret, dvs, med faktorer som motsvarar de relativa storlekarna av de asymmetriska gitterenheterna (se färgade markeringar i fig. 2a). T-talet i CK-konstruktionen kan därför skalas i enlighet med detta för de nya gitterna enligt följande

$$${T}_{j}(h,k):= {\alpha }_{j}\vänster({h}^{2}+hk+{k}^{2}\right)={\alpha }_{j}\ T(h,k)\ ,$$$

(2)

varvid $j=t,s,r$ anger vilken typ av gitter som används i konstruktionen och betecknar det trihexagonala, det snubbhexagonala respektive det rombitrihexagonala gittret. En polyeder med beteckningen ${T}_{j}(h,k)$ har samma antal femhörningar och sexhörningar som en $T(h,k)$ Caspar Klug-gitter, men den yta som täcks av dess ytor är större på grund av de ytterligare polygoner (trianglar, kvadrater) som finns mellan sex- och femhörningarna. Detta indikeras av skalningsfaktorn ${\alpha }_{j}$ som hänvisar till vinsten i yta beroende på det plana gitter från vilket det är konstruerat, vilket illustreras i fig. 2.

De resulterande geometrierna (kompletterande tabeller 2-4) breddar avsevärt spektrumet av möjliga icosaedriska virala blåkopior. Till exempel ligger ${T}_{t}(1,0)=4/3$, ${T}_{s}(1,0)=7/3$ och ${T}_{r}(1,0)=(4/3+2/\sqrt{3})$ mellan $T(1,0)=1$ och $T(1,1)=3$. CK-blåkopior när det gäller capsidstorlek (fig. 2d) om deras hexagonala (sub)gitter antas ha samma fotavtryck på capsidytan, det vill säga samma CP-storlekar. Dessutom utgör vissa av dessa geometrier alternativa layouter för CK-geometrier av liknande storlek, såsom ${T}_{t}(1,1)=4$ och ${T}_{s}(1,1)=7$ för $T(2,0)=4$ respektive $T(2,1)=7$ strukturer. I dessa fall har de alternativa kapsidmodellerna samma relativa yta, men förutses ha olika antal och orientering av hexamerer och pentamerer, med interstitiella utrymmen mellan dessa kapsomerer. Dessa alternativa strukturer (och deras dualer) motsvarar tidigare oanade capsidlayouter och erbjuder en enhetlig ram för klassificering av icosaedriska virusarkitekturer.

Intekvasi-ekvivalenta arkitekturer i HK97-linjen

Ett ökande antal capsidarkitekturer rapporteras med CP-antal och capsidlayouter som är oförenliga med CK-teorins geometriska blåkopior. Virus med kapsidor som bildas av en kombination av ett större och ett mindre kapsidprotein är exempel som är utmanande att tolka i den klassiska CK-teorin. Här ger vi exempel från HK97-linjen och visar att sådana virus kan rationaliseras i det arkeimediska gitterramverk som föreslås här.

Bacillusfagen Basilisk, till exempel, innehåller 1080 CP, som kombinerar 540 större kapsidproteiner (MCP) och 540 mindre kapsidproteiner (mCP).

Det är en kombination av 540 större kapsidproteiner (MCP) och 540 mindre kapsidproteiner (mCP).

Det är en kombination av 540 större och 540 mindre kapsidproteiner (mCP)19 . Om man använder förhållandet $60\ T$ för CP-nummer i CK-teorin skulle detta motsvara ett $T$-tal på 18, vilket utesluts av den geometriska begränsningen i CK-teorin som ges av ekv. 1. Om man endast fokuserar på de 12 pentamerna (närmare bestämt 11 pentamerer och en förmodad portal) och 80 hexamerer, skulle dess struktur klassificeras som $T(3,0)=9$19. Detta ignorerar dock de 180 interstitiella trimrarna och ger en felaktig bild av de relativa orienteringarna av proteinklusterna samt kapsidens yta (fig. 3a). Basiliskens CP-positioner representeras däremot korrekt av en ${T}_{t}(3,0)=12$-struktur baserad på den trihexagonala gitterserien inom ramen för den övergripande icosaedriska designprincipen. Denna klassificering stämmer också överens med mätningar av Basiliskens yta ($1,69\times 1{0}^{4}\ {{\rm{nm}}}}^{2}\$, se Metoder), som är jämförbar med ytan hos faget SIO-2 ($1,70\times 1{0}^{4}\ {{{rm{nm}}}}^{2}$), som är ett klassiskt $T=12$-capsid20. Basiliskkapsidet är således en icosaedrisk struktur av liknande storlek som en CK-geometri, men uppvisar ett CP-nummer och en capsidlayout som inte är möjliga i CK-formalismen.

Basilisk (fig. 3a) delar sin MCP-veckning med andra bakteriofager, arkeal- och djurvirus i HK97-linjens12,21,22. En omvärdering av andra virusstrukturer inom denna linje avslöjar att dessa evolutionärt besläktade virus delar samma underliggande ikosaedriska gittergeometri, dvs, de tillhör samma serie av polyederkonstruktioner (i detta fall den trihexagonala serien av ${T}_{t}\$-arkitekturer).

Till exempel organiserar herpes simplex-virus typ 1 (HSV-1) sin MCP (VP5) i hexamerer och pentamerer med orienteringar som påminner om dem i Basilisk-kapsidet (fig. 3b). Placeringen av dessa kapsomerer överensstämmer med den nuvarande klassificeringen av HSV-1 som $T(4,0)=16$. Detta ger dock en felaktig bild av hexamerernas relativa orientering och ignorerar det sekundära nätverket av trimerkomplex mellan capsomererna som bildas av tre mCP:er (Tr1, Tr2a och Tr2b)23. Klassificeringen som en ${T}_{t}(4,0)=64/3$-struktur i det nya ramverket (kompletterande tabell 2) återspeglar dock korrekt både dess 960 MCP:er och 960 mCP:er. Samma sak gäller för humant cytomegalovirus (HCMV)24 (strukturen visas inte), som strukturellt liknar HSV-1.

Den mogna kapsiden av fagen $\lambda$ (fig. 3c) är ett annat exempel på ett HK97-linjebaserat virus med en trihexagonal ikosaedrisk struktur. Den klassificeras för närvarande som $T(2,1)=7$12, men kapsommarnas orientering uppvisar i stället layouten för en ${T}_{t}(2,1)=28/3$-struktur, eftersom de utskjutande domänerna hos MCP:erna – snarare än ytterligare mCP:er – ockuperar det triangulära sublattice. Dessa positioner är också de platser där förstärkningsproteinerna gpD25 befinner sig, vilket understryker betydelsen av dessa trimera positioner i ytgitteret (fig. 3c). Alternativt har Halorubrum sodomense tailed virus 2 (HSTV-2), en annan medlem av HK97-linjen, klassificerats som $T(2,1)=7$. Dess kapsid innehåller dock gpD-liknande trimerer som intar interstitiella positioner mellan kapsomerer, vilket överensstämmer med den trihexagonala strukturen ${T}_{t}(2,1)=28/3$. (se figur 8 i Pietilä et al.26). Detta innebär en ökning av capsidvolymen (och följaktligen av genomets storlek) med en faktor ${\alpha }_{t}^{3/2}\ca 1,54$ jämfört med en klassisk $T(2,1)$ capsid. Denna förutsägelse stämmer överens med den empiriska observationen att HSTV-2 har ett genom som är ~$1,4-1,7$ större än det hos $T=7$ svansade fager26, vilket ytterligare bekräftar dess klassificering som en ${T}_{t}(2,1)=28/3$ kapsid i vår ram. Ett annat exempel är det termofila bakteriofagen P23-45, som för närvarande klassificeras som en överdimensionerad $T=7$-capsidarkitektur27.

Sammanfattningsvis tyder dessa exempel på att det klassificeringsschema för virusarkitektur som introducerats här lyfter fram strukturella egenskaper som delas av evolutionärt besläktade virus, och därmed lämpar sig som en egenskap för virala linjer.

Alternativa capsidlayouter med identisk stökiometri

Det finns många exempel på kvasiekvivalenta viruskapsider som bildas av samma antal CP, men som uppvisar olika CP-positioner och capsomerer. CK-teorin skiljer inte mellan dem. Vi visar dock här, baserat på exemplet med olika $T=3$-geometrier, att de arkimediska gitterna och deras dualer – så kallade Laves-gitter – erbjuder ett sätt att ta itu med detta.

I CK-teorin används hexagonala ytgitter och deras dualer, som motsvarar det triangulära gittret (3, 3, 3), växelvis. Den minsta icosaedriska polyedern som härleds från ett triangulärt gitter är icosaedern, som består av 20 trianglar. Den näst största bildas av 60 trianglar och utgör en ritning för en klassisk $T=3$-struktur. Med hjälp av CK-teorins konvention att polyederytor måste representera grupper av proteiner som till antalet motsvarar plattans rotationssymmetri (t.ex. trianglar som representerar tre proteiner osv.) kan man förknippa capsidlayouter med polyederstrukturer. Pariacoto-virus (PAV; fig. 4a), med sin starka interaktion mellan de tre kedjor som bildar de triangulära enheterna, är ett exempel på denna typ av ${T}^{D}(1,1)$ ytarkitektur.

Dualen av de andra arkimediska nätverken (trihexagonala, snubbhexagonala, rhombitrihexagonala) uppvisar alternativa ytarkitekturer till de som finns i CK-teorin i termer av romb-, florett- och drakplattor, respektive (se. Kompletterande tabell 5). En strikt tillämpning av CK-regeln om att symmetrin hos en kakel måste korrelera med antalet proteiner som representeras av kakel, pekar ut de dubbla trihexagonala nätverken (${T}_{t}^{D}\})), dvs. de rombiskaktiga kakelverken med kakel som representerar kluster av två proteiner (CP-dimerer). Rhombtilingar ger alternativa layouter till CK-ytnätet och beskriver kapsidor med samma proteinstökiometri men med olika CP-organisering. Bakteriofag MS2 (fig. 4b), ett virus som är sammansatt av 90 CP-dimerer, är ett exempel på ett \(T=3$ rombtiling (${T}_{t}^{D}(1,1)$; kompletterande tabell 5). Observera att även om proteinstoikometrin i detta fall sammanfaller med CK-ramen, vilket motsvarar de 180 proteiner som förväntas för en $T=3$-struktur, ger identifieringen som en ${T}_{t}^{D}(1,1)$-geometri en mer exakt redogörelse för CP-positioner och deras relativa orientering i capsidytan.

Nej kvasi-ekvivalenta och högre ordningens rombtecken

Om man utvidgar CK-konventionen så att rombtecken kan representera mer än två CP, så länge deras positioner på plattan respekterar plattans symmetri, kan man också tänka sig ett högre antal proteiner geometriskt. Detta skulle till exempel kunna uppnås genom att kombinera två dimerer. Proteinstökiometrin för sådana kapslar skulle vara $120\ T(h,k)$, och de första elementen i serien skulle innehålla 120, 360 och 480 proteiner. Picobirnavirus är ett exempel på det första elementet i denna serie (kompletterande figur 3a). Detta virus bildar rombliknande plattor som består av två proteindimerer i parallell orientering och innehåller totalt 120 proteiner28. Denna struktur har traditionellt beskrivits som ett förbjudet $T=2$-tal i CK-ramen, men den passar naturligt in i den nya ramen som ett rombtegel av högre ordning. Nästa element i denna serie förutsäger förekomsten av de förbjudna talen $T=6$ (360 proteiner) och $8$ (480 proteiner). Om man följer detta mönster är det logiskt att tänka på möjligheten av rombliknande plattor som representerar tre proteindimerer, vilket också skulle uppfylla den nödvändiga tvåfaldiga symmetrin. Proteinstoikometrin för dessa kapslar skulle vara $180\, T(h,k)$, och de tre minsta geometrierna av denna typ skulle innehålla 180, 540 och 720 proteiner. Ett exempel på det första elementet i denna serie är zikaviruset (kompletterande figur 3b) i familjen Flaviviridae. Varje ruta i dess capsid representerar sex långsträckta proteiner (tre parallella dimerer som respekterar den dubbla symmetrin i rutan), så att de 30 rutorna representerar totalt 180 proteiner. I ett banbrytande arbete 2002 insåg Rossmann-laboratoriet och medarbetare att de tre E-monomererna i varje isosaedrisk asymmetrisk enhet i Dengueviruset29 inte har kvasiekvivalenta symmetriska miljöer i den externa, isosaedriska ställningen som bildas av de 90 E-dimerer av glykoprotein. Vårt tillvägagångssätt, som bygger på dualen av de arkimediska gitterna, tar hänsyn till sådana icke-kvasiekvivalenta kapsidstrukturer.

Vårt ramverk utvidgar således förutsägelserna i kvasiekvivalensteorin genom en mer detaljerad förståelse av kapsidgeometrin, och gör skillnad mellan kapsidarkitekturer med olika typer av organisering av kapsidproteiner och gränsytor givet samma antal kapsidproteiner. Detta är viktigt för en bättre förståelse av de biofysikaliska egenskaperna hos viruskapsider, t.ex. deras stabilitet, och deras roll i virusens livscykler, t.ex. vid sammansättning och demontering av virioner, och avslöjar geometriska begränsningar för virusens utveckling.

Alai

Polyedriska modeller av icosaedrisk arkitektur

Intekvasi-ekvivalenta arkitekturer i HK97-linjen

Alternativa capsidlayouter med identisk stökiometri

Nej kvasi-ekvivalenta och högre ordningens rombtecken

Lämna ett svar Avbryt svar