Modelos poliédricos da arquitectura icosaédrica
Estruturas víricas são exemplos proeminentes da simetria icosaédrica em biologia. Suas arquiteturas são atualmente modeladas e classificadas em termos da série de Goldberg poliedros14 – sólidos de três dimensões com faces pentagonais e hexagonais – que fornecem uma estrutura de referência para as posições das proteínas capsidiais (Fig. 1a). Em particular, as faces poliédricas indicam as posições dos grupos de proteínas pentagonais e hexagonais chamados pentamers e hexamers, respectivamente. Os mesmos poliedros também fornecem plantas para as posições atômicas das gaiolas de fullerene na química do carbono, em particular o Buckminster fullerene conhecido como buckyball1. Eles também fornecem plantas para a organização estrutural de uma ampla gama de nanocontainers de proteínas naturais e artificiais. Os seus duplos, os poliedros geodésicos15 , são os desenhos arquitectónicos das cúpulas geodésicas do Buckminster Fuller.
Poliedros de Goldberg podem ser construídos a partir de uma grelha hexagonal (treliça) substituindo 12 hexágonos por pentágonos (Fig. 1b), como requerido pelo Teorema de Euler para gerar uma forma poliédrica fechada16. A distância entre os pentágonos nos cinco vértices vizinhos é o único grau de liberdade nesta construção, e por isso pode ser usada para rotular as diferentes opções geométricas nesta série infinita de poliedros. \(D) só pode assumir valores específicos que são limitados pela geometria da malha hexagonal subjacente. Em particular, usando as coordenadas hexagonais \(h\) e \(k\), que assumem quaisquer valores inteiros ou zero para navegar entre os pontos médios dos hexágonos vizinhos na malha, obtém-se a seguinte restrição geométrica11:
Aqui, {{A}_{0}} corresponde à área do menor triângulo entre quaisquer pontos médios hexagonais, ou seja, o caso {(h=1}) e {k=0\)-ou equivalente, {(h=0\) e {k=1}. Uma fórmula semelhante foi derivada para as estruturas alongadas capilares17,
T é chamada de número de triangulação (Fig. 1c) devido à sua interpretação geométrica em termos das triangulações icosaédricas obtidas pela conexão dos pontos médios dos pentágonos e hexágonos vizinhos, ou seja, em termos da poliedrose dupla (geodésica). T indica o número de faces triangulares, chamadas facetas, na triangulação que cobrem uma face triangular do icosaedro por área. A associação de uma subunidade proteica com cada canto de tal face triangular traduz esta série infinita de triangulações nos layouts de capsidão da teoria da quasiequivalência (Fig. 1d). Tais esquemas só permitem layouts de capsid com 60T CPs, organizados em 12 pentamers e hexamers11. A condição expressa por Eq. 1 é, portanto, uma restrição geométrica aos possíveis valores de T e aos possíveis números CP nas geometrias CK. Os elementos iniciais da série são \(T=\)1, 3, 4, e 7, e portanto o número de PCs contidos nos pequenos capitéis icosaédricos são 60, 180, 240, e 420, respectivamente (Tabela Suplementar 1).
No entanto, esta é apenas uma forma na qual uma estrutura icosaédrica pode ser construída a partir de repetições da mesma unidade (assimétrica), e exclui geometrias construídas a partir de proteínas de tamanhos diferentes (como uma proteína de capsids maiores e menores) ou capsids construídas a partir de uma proteína na qual um ou vários domínios desempenham papéis distintos. Tais esquemas de capsids devem ser construídos a partir de lattices em que cada vértice é idêntico em termos de comprimentos, números e ângulos relativos das suas bordas salientes, mas os ângulos relativos entre diferentes bordas no mesmo vértice podem variar, reflectindo a ocupação por diferentes tipos de proteínas ou domínios proteicos. De um ponto de vista geométrico, existem apenas 11 retículas (Capítulo 2 em Grünbaum e Shephard18) que satisfazem este princípio generalizado de quase-equivalência, que são as retículas Arquimedes – também conhecidas como retículas uniformes13,16. Dentre essas árvores, apenas quatro contêm uma subárvore hexagonal (Fig. 2a). Uma delas é a própria árvore hexagonal na qual se baseia o esquema de classificação CK. Esta malha é rotulada \((6,6,6)\) de acordo com os tipos de polígonos regulares que circundam cada vértice, neste caso três hexágonos. No entanto, a grade hexagonal é apenas a grade mais simples que permite esta construção. Outras grelhas contendo hexágonos a distâncias adequadas, ou seja, como sublatícia hexagonal, são igualmente receptivas à construção CK, mas têm sido até agora ignoradas. Estes são o revestimento tri-hexagonal ((3,6,3,6)}), o revestimento hexagonal snub (({3}^{4},6)}), e o revestimento rhombitrihexagonal ((3,4,6,4)}) (Fig. 2a). Estas treliças também são chamadas de hexadeltille, snub hextille, e a treliça hexadelle truncada, respectivamente16.
Por analogia à construção de Caspar e Klug, classificamos os poliedros icosaédricos que podem ser construídos a partir destas inclinações através da substituição de 12 hexágonos por pentágonos (Fig. 2b). A substituição dos hexágonos vizinhos mais próximos resulta em cada caso num sólido arquimédico icosaédrico simétrico (Fig. 2c) que corresponde ao início de uma série infinita de poliedros, construídos espaçando as inserções pentagonais mais afastadas. Como forma de caracterizar diferentes estruturas poliédricas da série, utilizamos novamente as coordenadas hexagonais (h) e (k), indicando agora os passos entre os pontos médios hexagonais no sublatício hexagonal, para indicar as distâncias possíveis entre as inserções pentagonais. Nas três retículas adicionais, os pontos médios dos hexágonos vizinhos são mais distais do que na retícula hexagonal. Assim, a área coberta por uma faceta triangular ligando os pontos médios dos hexágonos vizinhos (ou seja, o caso \\(h=0\) e \(k=1\), ou vice-versa) é maior do que na construção CK por um fator {\t}_4/3\approx 1.33) para a malha, 7/3/aproximadamente 2,33) para a malha, e 2,49) para a malha, i.e., 4,6,6,6) para a malha, por factores correspondentes às dimensões relativas das unidades de malha assimétrica (ver destaques coloridos na Fig. 2a). O número T na construção CK pode, portanto, ser escalonado de acordo com as novas estruturas da seguinte forma
where \(j=t,s,r\) indica o tipo de malha utilizada na construção, denotando o trihexagonal, o hexagonal snub, e a malha rhombitrihexagonal, respectivamente. Em particular, um poliedro rotulado como poliedro tem o mesmo número de pentágonos e hexágonos que um poliedro rotulado como poliedro. A malha Caspar Klug, mas a superfície coberta por suas faces é maior devido aos polígonos adicionais (triângulos, quadrados) entre os hexágonos e pentagonos. Isto é indicado pelo fator de escala {\i1}({\i}_j}) que se refere ao ganho de área de superfície de acordo com a malha plana a partir da qual é construída, como ilustrado na Fig. 2.
As geometrias resultantes (Tabelas Suplementares 2-4) ampliam significativamente o espectro de possíveis plantas virais icosaédricas. Por exemplo, {T}_{t}(1,0)=4/3\), {T}_{s}(1,0)=7/3\) e {T}_{r}(1,0)=(4/3+2/\sqrt{3})}) estão entre os {T(1,0)=1\ e {T(1,1)=3\) Os planos de CK em termos de tamanho do capsid (Fig. 2d) se as suas (sub)lattices hexagonais tiverem a mesma pegada na superfície do capsid, ou seja, os mesmos tamanhos de PC. Adicionalmente, algumas destas geometrias constituem layouts alternativos para geometrias CK de tamanho semelhante, tais como {T}_{t}(1,1)=4\) e {T}_{s}(1,1)=7\) para estruturas {T(2,0)=4\) e {T(2,1)=7\), respectivamente. Nestes casos, os modelos alternativos de capsiders têm as mesmas áreas de superfície relativa, mas estão previstos números e orientações diferentes de hexâmetros e pentímetros, com espaços intersticiais entre estes capilares. Essas estruturas alternativas (e suas duplas) correspondem a layouts de capsid anteriormente insuspeitados e oferecem uma estrutura unificadora para a classificação das arquiteturas de vírus icosaédricas.
Arquiteturas não-quasi-equivalentes na linhagem HK97
Números crescentes de arquiteturas de capsidos são relatados com números CP e layouts de capsidos que são incompatíveis com os planos geométricos da teoria CK. Vírus com capsids formados a partir de uma combinação de uma proteína capsid maior e menor são exemplos que são difíceis de interpretar na teoria clássica da CK. Aqui fornecemos exemplos da linhagem HK97, demonstrando que tais vírus podem ser racionalizados na estrutura da malha Archimedian proposta aqui.
O Bacillus phage Basilisk, por exemplo, contém 1080 CPs, combinando 540 proteínas capsidas maiores (MCPs) e 540 proteínas capsidas menores (mCPs)19. Usando a relação {60\ T} para números CP na teoria CK, isto corresponderia a um número de 18, que é excluído pela restrição geométrica na teoria CK dada por Eq. 1. Se apenas se concentrasse nos 12 pentímetros (mais precisamente, 11 pentímetros e um portal putativo) e 80 hexâmetros, então sua estrutura seria classificada como { T(3,0)=9\)19. No entanto, isto ignora os 180 trimers intersticiais e representa erroneamente as orientações relativas dos grupos de proteínas, bem como a área da superfície da capa (Fig. 3a). Em contraste, as posições de PC do Basilisco são precisamente representadas por uma estrutura \({T}_{t}(3,0)=12\) baseada na série de treliças trihexagonais no quadro do princípio de design icosaédrico dominante. Esta classificação também é consistente com as medidas da área de superfície do Basilisco (1,69 vezes 1{0}^{4}}^^{2}}, ver Métodos), que é comparável à área de superfície do fago SIO-2 (1,70 vezes 1{0}^{4}^{2}}), que é um capsid clássico 20. O basilisco capsid é assim uma estrutura icosaédrica de tamanho semelhante ao de uma geometria CK, mas exibe um número CP e um layout capsid que não são possíveis no formalismo CK.
Basilisk (Fig. 3a) compartilha sua dobra de MCP com outros bacteriófagos, vírus arqueológicos e animais na linhagem HK9712,21,22. Uma reavaliação de outras estruturas virais dentro desta linhagem revela que estes vírus evolutivamente relacionados compartilham a mesma geometria da malha icosaédrica subjacente, ou seja eles pertencem à mesma série de desenhos poliédricos (neste caso, a série trihexagonal de {T}_{t})-arquitecturas).
Por exemplo, o vírus herpes simplex tipo 1 (HSV-1) organiza o seu MCP (VP5) em hexamers e pentamers com orientações que lembram as do Capsider Basilisk (Fig. 3b). As posições destes capsômeros são consistentes com a classificação atual do HSV-1 como \(T(4,0)=16\). No entanto, isso representa erroneamente as orientações relativas dos hexâmetros e ignora a rede secundária de complexos triméricos entre os capsômeros que são formados a partir de três mCPs (Tr1, Tr2a e Tr2b)23. A classificação como uma estrutura {T}_{t}(4,0)=64/3\) na nova estrutura (Tabela Complementar 2), no entanto, reflete com precisão tanto seus 960 MCPs quanto 960 mCPs. O mesmo vale para o citomegalovírus humano (HCMV)24 (estrutura não mostrada), que é estruturalmente similar ao HSV-1.
O capsido maduro do fago \(\lambda) (Fig. 3c) é outro exemplo de um vírus de linhagem HK97 com uma estrutura icosaédrica trihexagonal. Ele é atualmente classificado como {T(2,1)=7)12, mas a orientação dos capsomers exibe em vez disso o layout de uma estrutura {T}_{t}(2,1)=28/3\), porque os domínios salientes dos MCPs – couro do que os mCPs adicionais – ocupam o sublatício triangular. Estas posições são também as localizações das proteínas de reforço gpD25, realçando a importância destas posições triméricas na malha de superfície (Fig. 3c). Alternativamente, o Halorubrum sodomense tailed virus 2 (HSTV-2), outro membro da linhagem HK97, foi classificado como \(T(2,1)=7\). No entanto, o seu capsid contém trimers do tipo gpD que ocupam posições intersticiais entre capsómeros, o que é consistente com a estrutura tri-hexagonal \i({T}_{t}(2,1)=28/3\) (ver Fig. 8 em Pietilä et al.26). Isto implica um aumento do volume capsid (e, consequentemente, do tamanho do genoma) por um factor de cerca de 1,54 em relação a um capsid clássico (T(2,1)/2). Esta previsão é consistente com a observação empírica de que o HSTV-2 tem um genoma que é ~(1,4-1,7) maior do que o dos fagos26, corroborando ainda mais a sua classificação como um capsid do nosso quadro. Outro exemplo é a bacteriófago termófila P23-45, que é atualmente classificada como uma arquitetura capsid de tamanho superdimensionado \(T=7\) capsid27.
Em resumo, estes exemplos sugerem que o esquema de classificação da arquitetura de vírus aqui introduzido destaca características estruturais compartilhadas por vírus evolutivamente relacionados, e assim se presta como uma característica de linhagens virais.
Alternativos layouts de capsids com estequiometria idêntica
Existem muitos exemplos de capsids virais quasiequivalentes que são formados a partir do mesmo número de CPs, mas exibem diferentes posições de CP e capsômeros. A teoria CK não faz distinção entre eles. No entanto, demonstramos aqui com base no exemplo de diferentes geometrias \(T=3\), que as telas Arquimedesas e as suas duplas telas de Laves – chamadas de Laves – fornecem um meio de abordar isto.
Na teoria CK, as telas de superfície hexagonais e as suas duplas, correspondentes à tela triangular (3, 3, 3), são utilizadas de forma intercambiável. O menor poliedro icosaédrico derivado de uma malha triangular é o icosaedro, feito de 20 triângulos. O próximo maior é formado a partir de 60 triângulos, e fornece uma planta para uma estrutura clássica \(T=3\). Usando a convenção da teoria CK de que as faces poliédricas devem representar grupos de proteínas que correspondem, por número, à simetria rotacional do azulejo (por exemplo, triângulos representando três proteínas, etc.), os layouts de capa podem ser associados a estruturas poliédricas. O vírus Pariacoto (PAV; Fig. 4a), com sua forte interação entre as três cadeias que formam as unidades triangulares, é um exemplo deste tipo de arquitetura de superfície.
As duas outras telas arquimedes (trihexagonal, hexagonal snub, rhombitrihexagonal) apresentam arquiteturas de superfície alternativas às da teoria CK em termos de losango, floret, e kite tiles, respectivamente (cf. Tabela suplementar 5). Aplicando estritamente a regra CK de que a simetria de uma telha deve ser correlacionada com o número de proteínas representadas pela telha, destaca-se a dupla malha tri-hexagonal (\T_{t}^{D}}), ou seja, a inclinação da lombada com telhas representando clusters de duas proteínas (dímeros CP). Os inclinações da lombada fornecem layouts alternativos às lattices da superfície CK, descrevendo as capsids com a mesma estequiometria de proteínas, mas com uma organização de PC diferente. Bacteriófago MS2 (Fig. 4b), um vírus montado a partir de 90 dímeros de PC, é um exemplo de um mosaico de uma lombada (T=3\) (\T}_{t}^{D}(1,1)}); Tabela suplementar 5). Note que enquanto a estequiometria de proteínas neste caso coincide com a estrutura CK, correspondente às 180 proteínas esperadas para uma estrutura \(T=3\), a identificação como uma geometria \(T}_{t}^{D}(1,1)}) fornece uma descrição mais precisa das posições de PC e suas orientações relativas na superfície da cápsula.
Inclinação de losangos de ordem superior e não-quasi-equivalente
Extendendo a convenção CK para permitir que os losangos representem mais de dois PC, desde que as suas posições na telha respeitem a simetria da telha, também são concebíveis geometricamente números mais elevados de proteínas. Isto poderia ser conseguido, por exemplo, através da combinação de dois dímeros. A estequiometria de proteínas para tais capsids seria de 120 T(h,k)}, e os primeiros elementos da série conteriam 120, 360 e 480 proteínas. O Picobirnavírus representa um exemplo do primeiro elemento desta série (Fig. 3a Suplementar). Este vírus forma azulejos em forma de losango compostos por dois dímeros de proteínas em orientação paralela, e contém 120 proteínas no total28. Esta estrutura tem sido tradicionalmente descrita como um número proibido \(T=2\) na estrutura CK, mas encaixa naturalmente na nova estrutura como um mosaico de ordem mais alta para losangos. Os elementos seguintes desta série prevêem a existência dos números proibidos \(T=6\) (360 proteínas) e \(8\) (480 proteínas). Seguindo este padrão, é lógico pensar na possibilidade de ladrilhos semelhantes a losangos representando três dímeros de proteínas, o que também satisfaria a simetria dupla requerida. A estequiometria proteica para estes capsidos seria de 180, T(h,k)}, e as três menores geometrias deste tipo conteriam 180, 540 e 720 proteínas. Um exemplo do primeiro elemento desta série é o vírus Zika (Fig. 3b suplementar) na família Flaviviridae. Em particular, cada telha da lombada no seu interior representa seis proteínas alongadas (três dímeros em paralelo respeitando a dupla simetria da telha), de modo que as 30 telhas representam 180 proteínas no total. No trabalho pioneiro de 2002, o laboratório Rossmann e colaboradores perceberam que os três monómeros E em cada unidade assimétrica icosaédrica do vírus da dengue29 não têm ambientes simétricos quasiequivalentes no andaime icosaédrico externo formado a partir dos 90 dímeros de glicoproteína E. A nossa abordagem baseada na dualidade das redes Arquimedes acomoda tais estruturas não quasiequivalentes capsident.
A nossa estrutura alarga assim as previsões da teoria da quasiequivalência através de uma compreensão mais detalhada da geometria capsident, distinguindo entre arquitecturas capsident com diferentes tipos de organização da proteína capsident e interfaces dado o mesmo número de proteínas capsident. Isto é importante para uma melhor compreensão das propriedades biofísicas das capsidas virais, tais como a sua estabilidade, e o seu papel nos ciclos de vida viral, por exemplo, durante a montagem e desmontagem do virião, e revela restrições geométricas na evolução viral.