Modelli poliedrici di architettura icosaedrica
Le strutture dei virus sono esempi importanti di simmetria icosaedrica in biologia. Le loro architetture sono attualmente modellate e classificate in termini di serie di poliedri di Goldberg14 – solidi tridimensionali con facce pentagonali ed esagonali – che forniscono un quadro di riferimento per le posizioni delle proteine del capside (Fig. 1a). In particolare, le facce poliedriche indicano le posizioni dei cluster di proteine pentagonali ed esagonali chiamati rispettivamente pentameri ed esameri. Gli stessi poliedri forniscono anche i progetti per le posizioni atomiche delle gabbie di fullerene nella chimica del carbonio, in particolare il fullerene Buckminster noto come buckyball1. Forniscono anche i progetti per l’organizzazione strutturale di una vasta gamma di nanocontenitori proteici naturali e artificiali. I loro duali, i poliedri geodetici15 , sono i progetti architettonici delle cupole geodetiche di Buckminster Fuller.
I poliedri di Goldberg possono essere costruiti da una griglia esagonale (reticolo) sostituendo 12 esagoni con dei pentagoni (Fig. 1b), come richiesto dal Teorema di Eulero per generare una forma poliedrica chiusa16. La distanza \(D\) tra i pentagoni ai vertici quintupli vicini è l’unico grado di libertà in questa costruzione, e può quindi essere usata per etichettare le diverse opzioni geometriche in questa serie infinita di poliedri. \(D\) può assumere solo valori specifici che sono vincolati dalla sottostante geometria del reticolo esagonale. In particolare, usando le coordinate esagonali \(h) e \(k), che assumono qualsiasi valore intero o zero per navigare tra punti medi di esagoni vicini nel reticolo, si ottiene la seguente restrizione geometrica11:
Qui, \({A}_{0}}) corrisponde all’area del più piccolo triangolo tra qualsiasi punto medio esagonale, cioè il caso \(h=1\) e \(k=0\) – o equivalentemente, \(h=0\) e \(k=1\). Una formula simile è stata derivata per le strutture allungate del capside17.
T è chiamato il numero di triangolazione (Fig. 1c) a causa della sua interpretazione geometrica in termini di triangolazioni icosaedriche ottenute collegando punti medi di pentagoni ed esagoni vicini, cioè in termini di poliedri duali (geodetici). T indica il numero di facce triangolari, chiamate sfaccettature, nella triangolazione che coprono una faccia triangolare dell’icosaedro per area. L’associazione di una subunità proteica con ogni angolo di tale sfaccettatura triangolare traduce questa serie infinita di triangolazioni nei layout del capside nella teoria della quasiequivalenza (Fig. 1d). Tali schemi permettono solo layout del capside con 60T CPs, organizzati in 12 pentameri e \(10(T-1)\ esameri11. La condizione espressa dall’Eq. 1 è quindi una restrizione geometrica sui possibili valori di T e sui possibili numeri di CP nelle geometrie CK. Gli elementi iniziali della serie sono \(T=\)1, 3, 4, e 7, e quindi il numero di CP contenute in piccoli capside icosaedrici sono 60, 180, 240, e 420, rispettivamente (Tabella 1 supplementare).
Tuttavia, questo è solo un modo in cui una struttura icosaedrica può essere costruita da ripetizioni della stessa unità (asimmetrica), ed esclude le geometrie costruite da proteine di dimensioni diverse (come una proteina del capside maggiore e minore) o i capidi costruiti da una proteina in cui uno o più domini svolgono ruoli distinti. Tali layout del capside devono essere costruiti da tralicci in cui ogni vertice è identico in termini di lunghezze, numeri e angoli relativi dei suoi bordi sporgenti, ma gli angoli relativi tra i diversi bordi dello stesso vertice possono variare, riflettendo l’occupazione di diversi tipi di proteine o domini proteici. Da un punto di vista geometrico, ci sono solo 11 tralicci (Capitolo 2 in Grünbaum e Shephard18) che soddisfano questo principio di quasi-equivalenza generalizzato, che sono i tralicci archimedei, noti anche come tralicci uniformi13,16. Tra questi tralicci, solo quattro contengono un sublattice esagonale (Fig. 2a). Uno di questi è il reticolo esagonale stesso su cui si basa lo schema di classificazione CK. Questo reticolo è etichettato \((6,6,6)\) secondo i tipi di poligoni regolari che circondano ogni vertice, in questo caso tre esagoni. Tuttavia, il reticolo esagonale è solo il reticolo più semplice che permette questa costruzione. Altri reticoli che contengono esagoni a distanze appropriate, cioè come un sublattice esagonale, sono ugualmente adatti alla costruzione CK, ma sono stati finora ignorati. Questi sono la piastrellatura triesagonale ((3,6,3,6)\), la piastrellatura esagonale snub (({3}^{4},6)\), e la piastrellatura rombo-esagonale ((3,4,6,4)\) (Fig. 2a). Questi reticoli sono anche chiamati esadaille, snub hextille, e il reticolo esadaille troncato, rispettivamente16.
In analogia alla costruzione di Caspar e Klug, classifichiamo i poliedri icosaedrici che possono essere costruiti da questi tilings tramite la sostituzione di 12 esagoni con pentagoni (Fig. 2b). La sostituzione degli esagoni più vicini risulta in ogni caso in un solido archimedeo icosaedrico simmetrico (Fig. 2c) che corrisponde all’inizio di una serie infinita di poliedri, costruiti distanziando ulteriormente le inserzioni pentagonali. Come mezzo per caratterizzare diverse strutture poliedriche nella serie, usiamo di nuovo le coordinate esagonali \(h\) e \(k\), che ora indicano i passi tra i punti medi esagonali nel sublattice esagonale, per indicare le possibili distanze tra le inserzioni pentagonali. Nei tre reticoli supplementari, i punti medi degli esagoni vicini sono più distanti che nel reticolo esagonale. Così, l’area coperta da una faccetta triangolare che collega punti medi di esagoni vicini (cioè il caso \(h=0\) e \(k=1\), o viceversa) è più grande che nella costruzione CK di un fattore \({alpha }_{t}=4/3\ circa 1.33\) per il reticolo \(3,6,3,6)\, \({alpha }{s}=7/3\ circa 2,33\) per il reticolo \(3}^{4},6)\), e \({alpha }{r}=4/3+2/\sqrt{3} circa 2,49\) per il reticolo \(3,4,6,3)\, cioè, da fattori corrispondenti alle dimensioni relative delle unità del reticolo asimmetrico (vedi evidenziazioni colorate in Fig. 2a). Il numero T nella costruzione CK può quindi essere scalato di conseguenza per i nuovi reticoli come segue
dove \(j=t,s,r) indica il tipo di reticolo usato nella costruzione, denotando rispettivamente il reticolo triesagonale, l’esagonale snub e il romboesagonale. In particolare, un poliedro etichettato \({T}_{j}(h,k)\ ha lo stesso numero di pentagoni ed esagoni di un \(T(h,k)\) Caspar Klug, ma la superficie coperta dalle sue facce è maggiore a causa dei poligoni aggiuntivi (triangoli, quadrati) tra gli esagoni e i pentagoni. Questo è indicato dal fattore di scala \({alpha }_{j}\) che si riferisce al guadagno di superficie secondo il reticolo planare da cui è costruito come illustrato in Fig. 2.
Le geometrie risultanti (Tabelle supplementari 2-4) ampliano significativamente lo spettro dei possibili progetti virali icosaedrici. Per esempio, \({T}_{t}(1,0)=4/3\), \({T}_{s}(1,0)=7/3\) e \({T}_{r}(1,0)=(4/3+2/\sqrt{3})\) sono tra le \(T(1,0)=1\) e \(T(1,1)=3\) CK in termini di dimensioni del capside (Fig. 2d) se si assume che i loro (sotto)tralicci esagonali abbiano la stessa impronta sulla superficie del capside, cioè le stesse dimensioni CP. Inoltre, alcune di queste geometrie costituiscono layout alternativi per geometrie CK di dimensioni simili, come \({T}_{t}(1,1)=4\) e \({T}_{s}(1,1)=7\) per strutture \(T(2,0)=4\) e \(T(2,1)=7\), rispettivamente. In questi casi, i modelli alternativi di capside hanno le stesse aree di superficie relative, ma si prevede che abbiano numeri e orientamenti diversi di esameri e pentameri, con spazi interstiziali tra questi capsomeri. Queste strutture alternative (e i loro duali) corrispondono a disposizioni del capside precedentemente insospettate e offrono un quadro unificante per la classificazione delle architetture virali icosaedriche.
Architetture non equivalenti nella stirpe HK97
Sono stati riportati numeri crescenti di architetture del capside con numeri CP e disposizioni del capside che sono incompatibili con i progetti geometrici della teoria CK. I virus con capside formato da una combinazione di una proteina del capside maggiore e minore sono esempi che sono difficili da interpretare nella teoria CK classica. Qui forniamo esempi dalla stirpe HK97, dimostrando che tali virus possono essere razionalizzati nel quadro del reticolo archimediano qui proposto.
Il fago Basilisk del Bacillus, per esempio, contiene 1080 CP, combinando 540 proteine del capside maggiore (MCP) e 540 proteine del capside minore (mCP)19. Usando la relazione \(60\ T\) per i numeri CP nella teoria CK, questo corrisponderebbe ad un numero \(T\) di 18, che è escluso dalla restrizione geometrica nella teoria CK data dall’Eq. 1. Se ci si concentra solo sui 12 pentameri (più precisamente, 11 pentameri e un portale putativo) e 80 esameri, allora la sua struttura sarebbe classificata come \(T(3,0)=9\)19. Tuttavia, questo ignora i 180 trimeri interstiziali e rappresenta in modo errato gli orientamenti relativi dei cluster di proteine così come la superficie del capside (Fig. 3a). Al contrario, le posizioni CP di Basilisk sono accuratamente rappresentate da una struttura \({T}_{t}(3,0)=12\) basata sulla serie di reticoli triesagonali nel quadro del principio generale di progettazione icosaedrica. Questa classificazione è anche coerente con le misurazioni dell’area superficiale di Basilisk (1,69 volte 1{0}^{4}}^{2}), vedi Metodi), che è paragonabile all’area superficiale del fago SIO-2 (1,70 volte 1{0}^{4}}), che è un classico capside \(T=12})20. Il capside del Basilisco è quindi una struttura icosaedrica di dimensioni simili a quelle di una geometria CK, ma esibisce un numero CP e una disposizione del capside che non sono possibili nel formalismo CK.
Basilisk (Fig. 3a) condivide la sua piega MCP con altri batteriofagi, virus archeiali e animali della linea HK9712,21,22. Una rivalutazione delle strutture di altri virus all’interno di questa stirpe rivela che questi virus evolutivamente correlati condividono la stessa geometria reticolare icosaedrica sottostante, cioè, appartengono alla stessa serie di disegni poliedrici (in questo caso, la serie triesagonale di architetture \({T}_{t}\).
Per esempio, l’herpes simplex virus tipo 1 (HSV-1) organizza il suo MCP (VP5) in esameri e pentameri con orientamenti che ricordano quelli del capside del Basilisco (Fig. 3b). Le posizioni di questi capsomeri sono coerenti con l’attuale classificazione di HSV-1 come \(T(4,0)=16\). Tuttavia, questo rappresenta male gli orientamenti relativi degli esameri e ignora la rete secondaria di complessi trimerici tra i capsomeri che sono formati da tre mCP (Tr1, Tr2a e Tr2b)23. La classificazione come struttura \({T}_{t}(4,0)=64/3\) nel nuovo quadro (Tabella supplementare 2), tuttavia, riflette accuratamente entrambi i suoi 960 MCP e 960 mCP. Lo stesso vale per il citomegalovirus umano (HCMV)24 (struttura non mostrata), che è strutturalmente simile a HSV-1.
Il capside maturo del fago \(\lambda\) (Fig. 3c) è un altro esempio di virus della linea HK97 con una struttura icosaedrica triesagonale. È attualmente classificato come \(T(2,1)=7\)12, ma l’orientamento dei capsomeri mostra invece la disposizione di una struttura \({T}_{t}(2,1)=28/3\), perché i domini sporgenti dei MCPs-piuttosto che ulteriori mCPs-occupano il sublattice triangolare. Queste posizioni sono anche le posizioni delle proteine di rinforzo gpD25, evidenziando l’importanza di queste posizioni trimeriche nel reticolo di superficie (Fig. 3c). In alternativa, Halorubrum sodomense tailed virus 2 (HSTV-2), un altro membro della stirpe HK97, è stato classificato come \(T(2,1)=7\). Tuttavia, il suo capside contiene trimeri simili a gpD che occupano posizioni interstiziali tra i capsomeri, il che è coerente con la struttura triesagonale \({T}_{t}(2,1)=28/3\) (vedi Fig. 8 in Pietilä et al.26). Questo implica un aumento del volume del capside (e, di conseguenza, la dimensione del genoma) di un fattore di \({alpha }_{t}^{3/2}\circa 1.54\) rispetto ad un classico \(T(2,1)\ capside. Questa previsione è coerente con l’osservazione empirica che HSTV-2 ha un genoma che è ~\(1,4-1,7\) più grande di quello dei fagi con coda \(T=7\)26, confermando ulteriormente la sua classificazione come un \({T}_{t}(2,1)=28/3\) capside nel nostro quadro. Un altro esempio è il batteriofago termofilo P23-45, che è attualmente classificato come un’architettura del capside \(T=7\) supersized27.
In sintesi, questi esempi suggeriscono che lo schema di classificazione per l’architettura del virus qui introdotto evidenzia le caratteristiche strutturali condivise da virus evolutivamente correlati, e quindi si presta come una caratteristica dei lineages virali.
Disposizioni alternative del capside con stechiometria identica
Ci sono molti esempi di capidi virali quasi equivalenti che sono formati dallo stesso numero di CP, ma presentano posizioni CP e capsomeri diversi. La teoria CK non distingue tra loro. Tuttavia, dimostriamo qui, basandoci sull’esempio di diverse geometrie \(T=3\), che i reticoli archimedei e i loro duali, chiamati reticoli di Laves, forniscono un mezzo per affrontare questo problema.
Nella teoria CK, i reticoli di superficie esagonali e i loro duali, corrispondenti al reticolo triangolare (3, 3, 3), sono usati in modo intercambiabile. Il più piccolo poliedro icosaedrico derivato da un reticolo triangolare è l’icosaedro, formato da 20 triangoli. Il successivo più grande è formato da 60 triangoli, e fornisce un modello per una struttura classica \(T=3\). Usando la convenzione della teoria CK che le facce poliedriche devono rappresentare gruppi di proteine che corrispondono, per numero, alla simmetria rotazionale della piastrella (per esempio, i triangoli rappresentano tre proteine ecc.), i layout del capside possono essere associati a strutture poliedriche. Il virus Pariacoto (PAV; Fig. 4a), con la sua forte interazione tra le tre catene che formano le unità triangolari, è un esempio di questo tipo di architettura superficiale \({T}^{D}(1,1)\).
I duali degli altri reticoli archimedei (triesagonale, esagonale snub, rombitriesagonale) presentano architetture di superficie alternative a quelle della teoria CK in termini di rombo, floret, e piastrelle kite, rispettivamente (cf. Tabella supplementare 5). Applicando rigorosamente la regola CK che la simmetria di una mattonella deve essere correlata al numero di proteine rappresentate dalla mattonella, si individuano i reticoli triesagonali duali (\T}_{t}^{D}), cioè i reticoli a rombo con mattonelle che rappresentano gruppi di due proteine (dimeri CP). Le piastrelle a rombo forniscono layout alternativi ai reticoli di superficie CK, descrivendo capidi con la stessa stechiometria proteica ma una diversa organizzazione CP. Il batteriofago MS2 (Fig. 4b), un virus assemblato da 90 dimeri CP, è un esempio di una piastrellatura a rombi \(T=3\) (\({T}_{t}^{D}(1,1)\); Tabella supplementare 5). Si noti che mentre la stechiometria delle proteine in questo caso coincide con il quadro CK, corrispondente alle 180 proteine previste per una struttura \(T=3\), l’identificazione come una geometria \({T}_{t}^{D}(1,1)\) fornisce un resoconto più accurato delle posizioni CP e dei loro orientamenti relativi nella superficie del capside.
Triturazioni a rombi non equivalenti e di ordine superiore
Estendendo la convenzione CK per permettere ai rombi di rappresentare più di due CP, purché le loro posizioni sulla piastrella rispettino la simmetria della piastrella, un numero maggiore di proteine è concepibile anche geometricamente. Questo potrebbe essere ottenuto, per esempio, combinando due dimeri. La stechiometria delle proteine per tali capidi sarebbe \(120\ T(h,k)\), e i primi elementi della serie conterrebbero 120, 360 e 480 proteine. Picobirnavirus rappresenta un esempio del primo elemento di questa serie (Fig. 3a supplementare). Questo virus forma piastrelle a forma di rombo costituite da due dimeri di proteine in orientamento parallelo, e contiene 120 proteine in totale28. Questa struttura è stata tradizionalmente descritta come un numero proibito \(T=2\) nel quadro CK, ma si adatta naturalmente nel nuovo quadro come una piastrella a rombo di ordine superiore. I prossimi elementi di questa serie prevedono l’esistenza dei numeri proibiti \(T=6\) (360 proteine) e \(8\) (480 proteine). Seguendo questo schema, è logico pensare alla possibilità di piastrelle a forma di rombo che rappresentano tre dimeri di proteine, che soddisferebbero anche la simmetria bipolare richiesta. La stechiometria delle proteine per questi capidi sarebbe \(180\, T(h,k)\), e le tre geometrie più piccole di questo tipo conterrebbero 180, 540 e 720 proteine. Un esempio del primo elemento di questa serie è il virus Zika (Fig. 3b supplementare) nella famiglia Flaviviridae. In particolare, ogni piastrella a rombo nel suo capside rappresenta sei proteine allungate (tre dimeri in parallelo che rispettano la doppia simmetria della piastrella), così che le 30 piastrelle rappresentano 180 proteine in totale. In un lavoro pionieristico del 2002, il laboratorio di Rossmann e collaboratori si sono resi conto che i tre monomeri E in ogni unità icosaedrica asimmetrica del virus della Dengue29 non hanno ambienti simmetrici quasi equivalenti nell’impalcatura icosaedrica esterna formata dai 90 dimeri della glicoproteina E. Il nostro approccio basato sui duali dei tralicci archimedei accoglie tali strutture capsidiche non quasiequivalenti.
Il nostro quadro estende quindi le previsioni della teoria della quasiequivalenza con una comprensione più dettagliata della geometria del capside, distinguendo tra architetture capsidiche con diversi tipi di organizzazione delle proteine capsidiche e interfacce dato lo stesso numero di proteine capsidiche. Questo è importante per una migliore comprensione delle proprietà biofisiche dei capidi virali, come la loro stabilità, e il loro ruolo nei cicli di vita virali, ad esempio durante l’assemblaggio e il disassemblaggio del virione, e rivela i vincoli geometrici sull’evoluzione virale.