Organização e expressão genómica
RNAs genómicos de luteovírus contêm cinco a sete ORFs conservadas (Fig. 3). As ORFs 1, 2, 3 e 5 são compartilhadas entre todos os membros da Luteoviridae. Os luteovírus carecem de ORF0. Os enamovírus têm falta de ORF4. Os genomas luteo- e polerovírus contêm um pequeno ORF (ORF3a) a montante do ORF3. Genomas de lutéovírus contêm um pequeno ORF (ORF6) a jusante do ORF5. O genoma PLRV contém ORFs 6 e 7, dentro do ORF5 e ORF8 dentro do ORF1. No enamo- e polerovírus ORF0 sobrepõe-se ORF1 por mais de 600 nt, que também se sobrepõe ORF2 por mais de 600 nt. Nos luteovírus, o ORF1 sobrepõe-se ao ORF2 por menos de 50 nt. Na maioria das sequências genómicas de luteo- e polerovírus, o ORF4 está completamente contido no ORF3. Um único códão de terminação em âmbar (UAG) separa o ORF5 do ORF3.
Luteovírus têm relativamente curto 5′ e seqüências não-codificadoras intergênicas. A primeira ORF é precedida por 21 nt no RNA CABYV e 142 nt no RNA do SbDV (Soybean dwarf virus). As ORFs 2 e 3 são separadas por 112-200 nt de RNA não-codificante. Há uma variação considerável no comprimento da sequência a jusante do ORF5, que varia de 167 nt para CYDV-RPV a 650 nt para SbDV.
Luteovirids empregam uma ampla gama de estratégias para expressar seus genomas compactos. ORFs 0, 1, 2, e 8 são expressas diretamente a partir de RNAs genômicos. Os ORFs a jusante são expressos a partir de RNAs sub-genômicos (sgRNAs) que são transcritos de locais de iniciação interna por RNA polimerases (RdRps) dependentes de vírus a partir de RNAs de cadeia negativa e são 3′ co-terminal com o RNA genômico. Como o códon de iniciação para ORF0 de polero- e enamovírus está a montante do ORF1, a tradução do ORF1 é iniciada por ‘leaky scanning’ no qual os ribossomos contornam o AUG do ORF0 e continuam a varrer o RNA genômico até alcançarem o AUG do ORF1. Os produtos protéicos do ORF2 são expressos como uma fusão translacional com o produto do ORF1. A uma frequência baixa mas significativa durante a expressão do ORF1, a tradução continua para ORF2 através de um “framehift” -1 que produz uma grande proteína contendo sequências codificadas por ambos ORFs 1 e 2 em um único polipeptídeo. O framehift é mediado por uma “seqüência hepta-nucleotídea escorregadia” (na forma X XXY YYZ) e uma estrutura secundária de RNA a jusante denominada pseudoknot que faz com que os ribossomos façam uma pausa e, em seguida, voltem um nt antes de continuar a tradução no novo quadro de leitura. ORF8, que só foi identificado em PLRV, reside inteiramente dentro de ORF1 em um quadro de leitura diferente e codifica uma proteína associada à replicação de 5 kDa. Para expressar ORF8, as sequências dentro da ORF dobram numa estrutura chamada site interno de entrada de ribossomas (IRES), que recruta ribossomas para iniciar a tradução cerca de 1600 nt a jusante do terminal 5′ do RNA de PLRV.
ORFs 3a, 3, 4, e 5 são expressos através de um mecanismo de digitalização com fugas do terminal 5′ do sgRNA1, que está localizado cerca de 200 nt a montante do ORF3 no final do ORF2 e se estende até ao terminal 3′ do genoma. A tradução do ORF3a é iniciada em um códon não-AUG. O ORF4 da maioria dos luteo- e polerovírus está contido no ORF3. Em todos os luteovírus, o ORF5 é expresso apenas como uma fusão translacional com os produtos do ORF3 através da leitura do códão UAG stop no final do ORF3, que produz uma proteína com o produto do ORF3 no seu terminal N e o produto do ORF5 no seu terminal C. A leitura é regulada por interações RNA-RNA locais e de longa distância e no caso de luteovírus e alguns polerovírus requer a presença de repetições CCXXXX (onde X é qualquer base) a jusante do códão de parada ORF3. Os luteovírus e os polerovírus produzem segundo sgRNA menor capaz de expressar ORFs 6 e 7. Os terceiros sgRNAs, que não parecem codificar proteínas, são produzidos a níveis muito altos em luteovírus, mas apenas a níveis baixos em PLRV.
Embora os RNAs de enamo- e polerovírus contenham 5′ VPgs que interagem com factores de iniciação de tradução, os RNAs de luteovírus contêm apenas um fosfato 5′. Os termini não modificados do 5′ são mal reconhecidos para iniciação de tradução. Para contornar este problema, o genoma BYDV-PAV contém uma pequena sequência (elemento de tradução BYDV; BTE) localizada na região não codificadora a jusante do ORF5, que interage com sequências próximas do terminal 5′ de RNA genómico e sgRNA1 para promover a iniciação de tradução independente do limite.
O silenciamento de genes pós-transcritivo (PTGS) é uma defesa antiviral inata e altamente adaptativa encontrada em todos os eucariotas que é ativada por RNAs (dsRNAs) de dupla cadeia, que são produzidos durante a replicação do vírus. Pesquisas sobre as funções das proteínas codificadas por luteovírus mostraram que as proteínas 28-34 kDa codificadas por ORF0 são fortes supressores de SCPG locais e sistêmicos para polero- e enamovírus. Os genomas dos luteovírus não possuem ORF0, mas o produto do ORF4 em funções luteovírus para suprimir os PTGS sistêmicos.
As proteínas codificadas por ORF1 de enamo- e polerovírus contêm o VPg e uma protease serina tipo quimotripsina que é responsável pelo processamento proteolítico das poliproteínas codificadas por ORF1. A protease cliva a proteína ORF1 internamente para liberar o VPg, que é ligado covalentemente ao RNA genômico. A proteína expressa pela ORF8 de PLRV é necessária para a replicação do vírus. Os ORF2 luteovíricos têm uma capacidade de codificação de 59-67 kDa para proteínas que são muito similares aos RdRps conhecidos e, portanto, provavelmente representam a porção catalítica da replicase viral.
Para luteo- e polerovíricos ORF3a produz proteínas altamente conservadas 4.8-5.3 kDa que são essenciais para movimentos de longa distância. ORF3 codifica o PC principal dos luteovírus, que varia em tamanho de 21 a 23 kDa. A ORF5 tem uma capacidade de codificação de 29-56 kDa. No entanto, a ORF5 é expressa apenas como uma fusão translacional com o produto da ORF3 quando, cerca de 10% do tempo, a tradução não pára no final da ORF3 e continua até ao final da ORF5. A porção ORF5 desta proteína readthrough tem sido implicada na transmissão do pulgão e na estabilidade do vírus. Experiências com PLRV e BYDV-PAV mostraram que a região N-terminal da proteína ORF5 readthrough determina a capacidade das partículas de vírus de se ligarem a proteínas produzidas por bactérias endosibióticas de vetores afídeos. As interacções das partículas de vírus com estas proteínas parecem ser essenciais para a persistência dos vírus nos afídeos. As mudanças de seqüência de nucleotídeos dentro do ORF5 do PEMV-1 abolem a transmissibilidade do afídeo. As porções N-terminais das proteínas ORF5 são altamente conservadas entre os luteovírus enquanto os C-termini são muito mais variáveis.
Os genomas luteo- e polerovírus possuem um ORF4 que está contido no ORF3 e codifica proteínas de 17-21 kDa. Os vírus que contêm mutações no ORF4 são capazes de se replicar em protoplastos de plantas isoladas, mas são deficientes ou atrasados no movimento sistêmico em plantas inteiras. Portanto, o produto do ORF4 parece ser necessário para o movimento do vírus dentro das plantas infectadas. Esta hipótese é suportada pela observação de que os enamovírus carecem de ORF4. Enquanto os luteo- e polerovírus estão limitados ao floema e tecidos associados, o enamovírus PEMV-1 é capaz de se mover sistemicamente através de outros tecidos vegetais na presença do PEMV-2, que sob condições naturais coexiste invariavelmente com o PEMV-1.
alguns genomas de luteo- e polerovírus contêm pequenos ORFs dentro e/ou a jusante do ORF5. Em luteovírus, não foram detectados produtos protéicos destes ORFs em células infectadas. Os genomas BYDV-PAV que não expressam ORF6 ainda são capazes de se replicar em protoplastos. Os tamanhos previstos das proteínas expressas por ORFs 6 e 7 de PLRV são 7,1 e 14 kDa, respectivamente. Com base em estudos mutacionais, foi proposto que estas regiões do genoma podem regular a transcrição tardiamente em infecção.