Modelos poliédricos de arquitectura icosaédrica
Las estructuras de los virus son ejemplos destacados de simetría icosaédrica en biología. Actualmente, sus arquitecturas se modelan y clasifican en función de la serie de poliedros de Goldberg14 -sólidos tridimensionales con caras pentagonales y hexagonales- que proporcionan un marco de referencia para las posiciones de las proteínas de la cápside (Fig. 1a). En particular, las caras poliédricas indican las posiciones de los grupos de proteínas pentagonales y hexagonales denominados pentámeros y hexámeros, respectivamente. Los mismos poliedros también proporcionan planos para las posiciones atómicas de las jaulas de fullereno en la química del carbono, en particular el fullereno de Buckminster conocido como buckyball1. Asimismo, proporcionan planos para la organización estructural de una amplia gama de nanocontenedores de proteínas, tanto artificiales como naturales. Sus duales, los poliedros geodésicos15, son los diseños arquitectónicos de las cúpulas geodésicas de Buckminster Fuller.
Los poliedros de Goldberg pueden construirse a partir de una rejilla hexagonal (celosía) sustituyendo 12 hexágonos por pentágonos (Fig. 1b), tal y como exige el Teorema de Euler para generar una forma poliédrica cerrada16. La distancia \(D\) entre los pentágonos en los vértices quíntuples vecinos es el único grado de libertad en esta construcción, y por tanto puede utilizarse para etiquetar las diferentes opciones geométricas en esta serie infinita de poliedros. \(D\) sólo puede tomar valores específicos que están restringidos por la geometría de la red hexagonal subyacente. En particular, utilizando las coordenadas hexagonales \(h\) y \(k\), que toman cualquier valor entero o cero para navegar entre puntos medios de hexágonos vecinos en la red, se obtiene la siguiente restricción geométrica11:
Aquí, \({A}_{0}\) corresponde al área del triángulo más pequeño entre cualesquiera puntos medios hexagonales, es decir, el caso \(h=1\) y \(k=0\) -o equivalentemente, \(h=0\) y \(k=1\). Se ha derivado una fórmula similar para las estructuras alargadas de la cápside17.
T se denomina número de triangulación (Fig. 1c) debido a su interpretación geométrica en términos de las triangulaciones icosaédricas obtenidas al conectar los puntos medios de los pentágonos y hexágonos vecinos, es decir, en términos de los poliedros duales (geodésicos). T indica el número de caras triangulares, llamadas facetas, en la triangulación que cubren una cara triangular del icosaedro por área. La asociación de una subunidad proteica con cada esquina de dicha faceta triangular traduce esta serie infinita de triangulaciones en los planos de la cápside en la teoría de la cuasi equivalencia (Fig. 1d). Dichos planos sólo permiten disposiciones de la cápside con 60T CPs, organizados en 12 pentámeros y \(10(T-1)\Nhexámeros11. La condición expresada por la Ecuación 1 es, por tanto, una restricción geométrica sobre los posibles valores de T y los posibles números de CP en las geometrías CK. Los elementos iniciales de la serie son \(T=\)1, 3, 4, y 7, y por lo tanto el número de CPs contenidos en las pequeñas cápsulas icosaédricas son 60, 180, 240, y 420, respectivamente (Tabla Suplementaria 1).
Sin embargo, ésta es sólo una de las formas en que puede construirse una estructura icosaédrica a partir de repeticiones de la misma unidad (asimétrica), y excluye las geometrías construidas a partir de proteínas de diferentes tamaños (como una proteína de la cápside mayor y otra menor) o las cápsides construidas a partir de una proteína en la que uno o varios dominios desempeñan papeles diferenciados. Estos diseños de cápside deben construirse a partir de entramados en los que cada vértice es idéntico en términos de longitudes, números y ángulos relativos de sus aristas salientes, pero los ángulos relativos entre diferentes aristas en el mismo vértice pueden variar, reflejando la ocupación por diferentes tipos de proteínas o dominios proteicos. Desde un punto de vista geométrico, sólo hay 11 celosías (capítulo 2 de Grünbaum y Shephard18) que satisfacen este principio de cuasi-equivalencia generalizado, que son las celosías arquimedianas, también conocidas como celosías uniformes13,16. Entre estas celosías, sólo cuatro contienen una subcelosía hexagonal (Fig. 2a). Una de ellas es la propia red hexagonal en la que se basa el esquema de clasificación CK. Este entramado está etiquetado como \((6,6,6)\Nsegún los tipos de polígonos regulares que rodean cada vértice, en este caso tres hexágonos. Sin embargo, la red hexagonal es sólo la red más sencilla que permite esta construcción. Otras celosías que contienen hexágonos a distancias adecuadas, es decir, como una subcelosía hexagonal, son igualmente susceptibles de la construcción CK, pero hasta ahora han sido ignoradas. Se trata de la celosía trihexagonal \((3,6,3,6)\N, la celosía hexagonal de tipo snub \N(({3}^{4},6)\Ny la celosía rombitrihexagonal \N((3,4,6,4)\N- (Fig. 2a). (Fig. 2a). Estos entramados también se denominan hexadeltille, hextille de chorro y entramado hexadeltille truncado, respectivamente16.
Por analogía con la construcción de Caspar y Klug, clasificamos los poliedros icosaédricos que se pueden construir a partir de estos tilings mediante la sustitución de 12 hexágonos por pentágonos (Fig. 2b). La sustitución de los hexágonos más próximos da lugar en cada caso a un sólido icosaédrico simétrico de Arquímedes (Fig. 2c) que corresponde al inicio de una serie infinita de poliedros, construidos espaciando más las inserciones pentagonales. Como medio para caracterizar las diferentes estructuras poliédricas de la serie, volvemos a utilizar las coordenadas hexagonales \(h\) y \(k\), que ahora indican los pasos entre los puntos medios hexagonales en la subred hexagonal, para indicar las posibles distancias entre las inserciones pentagonales. En los tres entramados adicionales, los puntos medios de los hexágonos vecinos son más distales que en el entramado hexagonal. Por lo tanto, el área cubierta por una faceta triangular que conecta los puntos medios de los hexágonos vecinos (es decir, el caso \(h=0\) y \(k=1\), o viceversa) es mayor que en la construcción CK por un factor \({\alpha }_{t}=4/3\approx 1.33) para el entramado \((3,6,3,6)\Nde la red, \N({{alpha }_{s}=7/3\Naproximadamente 2,33) para el entramado \(({3}^{4},6)\Nde la red, y \N({{alpha }_{r}=4/3+2/{sqrt{3}\Naproximadamente 2,49) para el entramado \((3,4,6,3)\Nde la red, es decir, por los factores correspondientes a los tamaños relativos de las unidades asimétricas de la red (véase los resaltados de color en la Fig. 2a). Por lo tanto, el número T en la construcción CK se puede escalar en consecuencia para las nuevas celosías como sigue
donde (j=t,sr\) indica el tipo de red utilizado en la construcción, denotando la red trihexagonal, la red hexagonal y la red rombohexagonal, respectivamente. En particular, un poliedro etiquetado como \ {T}_{j}(h,k)\Ntiene el mismo número de pentágonos y hexágonos que una red \N(T(h,k)\Nde Caspar Klug. Caspar Klug, pero la superficie cubierta por sus caras es mayor debido a los polígonos adicionales (triángulos, cuadrados) entre los hexágonos y pentágonos. Esto se indica mediante el factor de escala \({\alpha }_{j}\) que se refiere a la ganancia de superficie en función de la red plana a partir de la cual se construye, como se ilustra en la Fig. 2.
Las geometrías resultantes (Tablas Suplementarias 2-4) amplían significativamente el espectro de posibles planos virales icosaédricos. Por ejemplo, \({T}_{t}(1,0)=4/3\), \({T}_{s}(1,0)=7/3\) y \({T}_{r}(1,0)=(4/3+2/{sqrt{3})\) se encuentran entre los planos \(T(1,0)=1\) y \(T(1,1)=3\) CK en términos de tamaño de la cápside (Fig. 2d) si se supone que sus (sub)redes hexagonales tienen la misma huella en la superficie de la cápside, es decir, los mismos tamaños de CP. Además, algunas de estas geometrías constituyen disposiciones alternativas para geometrías CK de tamaño similar, como \({T}_{t}(1,1)=4\) y \({T}_{s}(1,1)=7\) para estructuras \(T(2,0)=4\) y \(T(2,1)=7\), respectivamente. En estos casos, los modelos alternativos de cápside tienen las mismas áreas de superficie relativas, pero se predice que tienen diferentes números y orientaciones de hexámeros y pentámeros, con espacios intersticiales entre estos capsómeros. Estas estructuras alternativas (y sus duales) corresponden a disposiciones de la cápside previamente insospechadas y ofrecen un marco unificador para la clasificación de las arquitecturas icosaédricas de los virus.
Arquitecturas no casi equivalentes en el linaje HK97
Se informa de un número creciente de arquitecturas de la cápside con números de CP y disposiciones de la cápside que son incompatibles con los planos geométricos de la teoría CK. Los virus con cápsides formadas a partir de una combinación de una proteína de cápside mayor y otra menor son ejemplos que suponen un reto para la interpretación de la teoría CK clásica. Aquí proporcionamos ejemplos del linaje HK97, demostrando que tales virus pueden ser racionalizados en el marco del entramado arquimediano propuesto aquí.
El fago Basilisk de Bacillus, por ejemplo, contiene 1080 CPs, combinando 540 proteínas de cápside mayor (MCPs) y 540 proteínas de cápside menor (mCPs)19. Utilizando la relación \(60\ T\) para los números de CP en la teoría CK, esto correspondería a un número \(T\) de 18, que está excluido por la restricción geométrica en la teoría CK dada por la Ec. 1. Si uno sólo se centra en los 12 pentámeros (más precisamente, 11 pentámeros y un portal putativo) y 80 hexámeros, entonces su estructura se clasificaría como \(T(3,0)=9\)19. Sin embargo, esto ignora los 180 trímeros intersticiales y falsea las orientaciones relativas de los grupos de proteínas, así como la superficie de la cápside (Fig. 3a). Por el contrario, las posiciones del CP de Basilisk están representadas con precisión por una estructura \({T}_{t}(3,0)=12\) basada en la serie de celosía trihexagonal en el marco del principio de diseño icosaédrico global. Esta clasificación también es consistente con las mediciones del área superficial de Basilisk (\(1,69 veces 1{0}^{4}\ {{rm{nm}}^{2}\), que es comparable al área superficial del fago SIO-2 (\(1,70 veces 1{0}^{4}\ {{rm{nm}}^{2}\)), que es una cápside clásica \(T=12\)20. La cápside de Basilisk es, por tanto, una estructura icosaédrica de tamaño similar a la de una geometría CK, pero exhibe un número CP y una disposición de la cápside que no son posibles en el formalismo CK.
Basilisk (Fig. 3a) comparte su pliegue MCP con otros bacteriófagos, virus arqueos y animales del linaje HK9712,21,22. Una reevaluación de las estructuras de otros virus dentro de este linaje revela que estos virus evolutivamente relacionados comparten la misma geometría de red icosaédrica subyacente, es decir pertenecen a la misma serie de diseños poliédricos (en este caso, la serie trihexagonal de arquitecturas \({T}_{t}\)).
Por ejemplo, el virus del herpes simple tipo 1 (HSV-1) organiza su MCP (VP5) en hexámeros y pentámeros con orientaciones que recuerdan a las de la cápside de Basilisk (Fig. 3b). Las posiciones de estos capsómeros son consistentes con la clasificación actual del HSV-1 como \(T(4,0)=16\). Sin embargo, esto representa mal las orientaciones relativas de los hexámeros e ignora la red secundaria de complejos triméricos entre los capsómeros que se forman a partir de tres mCPs (Tr1, Tr2a y Tr2b)23. Sin embargo, la clasificación como estructura \({T}_{t}(4,0)=64/3\) en el nuevo marco (Tabla Suplementaria 2), refleja con precisión tanto sus 960 MCPs como sus 960 mCPs. Lo mismo ocurre con el citomegalovirus humano (HCMV)24 (estructura no mostrada), que es estructuralmente similar al HSV-1.
La cápside madura del fago \(\lambda\) (Fig. 3c) es otro ejemplo de un virus del linaje HK97 con una estructura icosaédrica trihexagonal. Actualmente se clasifica como \(T(2,1)=7\)12, pero la orientación de los capsómeros muestra en cambio la disposición de una estructura \({T}_{t}(2,1)=28/3\), porque los dominios que sobresalen de los MCPs -en lugar de los mCPs adicionales- ocupan la subred triangular. Estas posiciones son también las localizaciones de las proteínas de refuerzo gpD25, destacando la importancia de estas posiciones triméricas en la red superficial (Fig. 3c). Por otro lado, el virus Halorubrum sodomense tailed 2 (HSTV-2), otro miembro del linaje HK97, ha sido clasificado como \ (T(2,1)=7\). Sin embargo, su cápside contiene trímeros similares a la gpD que ocupan posiciones intersticiales entre los capsómeros, lo que es consistente con la estructura trihexagonal \({T}_{t}(2,1)=28/3\) (véase la Fig. 8 en Pietilä et al.26). Esto implica un aumento del volumen de la cápside (y, en consecuencia, del tamaño del genoma) en un factor de \({\alpha }_{t}^{3/2}\\a aproximadamente 1,54\a) con respecto a una cápside clásica \(T(2,1)\a). Esta predicción es consistente con la observación empírica de que el HSTV-2 tiene un genoma que es ~\(1,4-1,7\) más grande que el de los fagos con cola \(T=7\)26, corroborando aún más su clasificación como una cápside \({T}_{t}(2,1)=28/3\) en nuestro marco. Otro ejemplo es el bacteriófago termófilo P23-45, que actualmente se clasifica como una arquitectura de cápside \(T=7\) superdimensionada27.
En resumen, estos ejemplos sugieren que el esquema de clasificación para la arquitectura de los virus introducido aquí destaca las características estructurales compartidas por los virus evolutivamente relacionados, y por lo tanto se presta como una característica de los linajes virales.
Disposiciones alternativas de la cápside con estequiometría idéntica
Hay muchos ejemplos de cápsides virales cuasi equivalentes que se forman a partir del mismo número de CPs, pero que exhiben diferentes posiciones de CPs y capsómeros. La teoría CK no distingue entre ellos. Sin embargo, aquí demostramos, basándonos en el ejemplo de diferentes geometrías \(T=3\), que las celosías arquimedianas y sus duales -llamadas celosías de Laves- proporcionan un medio para abordar esto.
En la teoría CK, las celosías de superficie hexagonal y sus duales, correspondientes a la celosía triangular (3, 3, 3), se utilizan de forma intercambiable. El poliedro icosaédrico más pequeño derivado de una red triangular es el icosaedro, formado por 20 triángulos. El siguiente más grande está formado por 60 triángulos, y proporciona un plano para una estructura clásica \(T=3\). Utilizando la convención de la teoría CK de que las caras poliédricas deben representar grupos de proteínas que correspondan, por su número, a la simetría rotacional de la baldosa (por ejemplo, los triángulos representan tres proteínas, etc.), las disposiciones de la cápside pueden asociarse con estructuras poliédricas. El virus de Pariacoto (PAV; Fig. 4a), con su fuerte interacción entre las tres cadenas que forman las unidades triangulares, es un ejemplo de este tipo de arquitectura superficial \({T}^{D}(1,1)\Nde la cápside.
Los duales de las otras celosías arquimedianas (trihexagonal, snub hexagonal, rhombitrihexagonal) presentan arquitecturas de superficie alternativas a las de la teoría CK en términos de baldosas de rombo, floretes y cometas, respectivamente (cf. Tabla suplementaria 5). Aplicando estrictamente la regla CK de que la simetría de una baldosa debe estar correlacionada con el número de proteínas representadas por la baldosa, se destacan las celosías trihexagonales duales (\({T}_{t}^{D}\)), es decir, los tilings de rombo con baldosas que representan grupos de dos proteínas (dímeros CP). Los tilings de rombos proporcionan disposiciones alternativas a las redes de superficie CK, describiendo cápsides con la misma estequiometría de proteínas pero con diferente organización de CP. El bacteriófago MS2 (Fig. 4b), un virus ensamblado a partir de 90 dímeros CP, es un ejemplo de un entramado rómbico \(T=3\) (\({T}_{t}^{D}(1,1)\N; Tabla Suplementaria 5). Obsérvese que mientras la estequiometría de las proteínas en este caso coincide con el marco CK, correspondiente a las 180 proteínas esperadas para una estructura \(T=3\), la identificación como una geometría \({T}_{t}^{D}(1,1)\Nofrece una explicación más precisa de las posiciones de las CP y sus orientaciones relativas en la superficie de la cápside.
Rombos no equivalentes y de orden superior
Ampliando la convención CK para permitir que los rombos representen más de dos CP, siempre que sus posiciones en la baldosa respeten la simetría de la misma, también son concebibles geométricamente números mayores de proteínas. Esto podría lograrse, por ejemplo, combinando dos dímeros. La estequiometría de las proteínas para tales cápsides sería \(120\ T(h,k)\Ny los primeros elementos de la serie contendrían 120, 360 y 480 proteínas. El Picobirnavirus representa un ejemplo del primer elemento de esta serie (Fig. Suplementaria 3a). Este virus forma tejas en forma de rombo compuestas por dos dímeros de proteínas en orientación paralela, y contiene 120 proteínas en total28. Esta estructura se ha descrito tradicionalmente como un número prohibido \ (T=2\) en el marco CK, pero encaja de forma natural en el nuevo marco como un mosaico de rombos de orden superior. Los siguientes elementos de esta serie predicen la existencia de los números prohibidos \(T=6\) (360 proteínas) y \(8\) (480 proteínas). Siguiendo este patrón, es lógico pensar en la posibilidad de que los mosaicos en forma de rombo representen tres dímeros de proteínas, lo que también satisfaría la simetría doble requerida. La estequiometría de las proteínas para estas cápsides sería \(180\, T(h,k)\Ny las tres geometrías más pequeñas de este tipo contendrían 180, 540 y 720 proteínas. Un ejemplo del primer elemento de esta serie es el virus Zika (Fig. Suplementaria 3b) de la familia Flaviviridae. En concreto, cada baldosa de rombos de su cápside representa seis proteínas alargadas (tres dímeros en paralelo respetando la doble simetría de la baldosa), de modo que las 30 baldosas representan 180 proteínas en total. En un trabajo pionero realizado en 2002, el laboratorio Rossmann y sus colaboradores se dieron cuenta de que los tres monómeros E de cada unidad asimétrica icosaédrica del virus del dengue29 no tienen entornos simétricos cuasi equivalentes en el andamiaje externo icosaédrico formado por los 90 dímeros de la glicoproteína E. Nuestro enfoque basado en los duales de los entramados arquimedianos da cabida a estas estructuras de cápside no cuasiequivalentes.
Nuestro marco amplía así las predicciones de la teoría de la cuasiequivalencia mediante una comprensión más detallada de la geometría de la cápside, distinguiendo entre las arquitecturas de la cápside con diferentes tipos de organización de las proteínas de la cápside e interfaces dado el mismo número de proteínas de la cápside. Esto es importante para comprender mejor las propiedades biofísicas de las cápsides virales, como su estabilidad, y sus funciones en los ciclos de vida virales, por ejemplo, durante el ensamblaje y el desensamblaje del virión, y revela restricciones geométricas en la evolución viral.