Organización y expresión del genoma
Los ARN genómicos de los luteovíridos contienen de cinco a siete ORFs conservados (Fig. 3). Los ORFs 1, 2, 3 y 5 se comparten entre todos los miembros de los Luteoviridae. Los luteovirus carecen de ORF0. Los enamovirus carecen de ORF4. Los genomas de los luteovirus y polerovirus contienen un pequeño ORF (ORF3a) antes del ORF3. Los genomas de los luteovirus contienen un pequeño ORF (ORF6) antes del ORF5. El genoma del PLRV contiene los ORFs 6 y 7, dentro del ORF5 y el ORF8 dentro del ORF1. En los enamovirus y polerovirus, el ORF0 se solapa con el ORF1 en más de 600 nt, que también se solapa con el ORF2 en más de 600 nt. En los luteovirus, el ORF1 se solapa con el ORF2 en menos de 50 nt. En la mayoría de las secuencias genómicas de los luteovirus y polerovirus, el ORF4 está completamente contenido en el ORF3. Un único codón de terminación ámbar (UAG) separa el ORF5 del ORF3.
Los luteovirus tienen secuencias no codificantes 5′ e intergénicas relativamente cortas. El primer ORF está precedido por 21 nt en el ARN de CABYV y 142 nt en el ARN del virus del enanismo de la soja (SbDV). Los ORFs 2 y 3 están separados por 112-200 nt de ARN no codificante. Existe una considerable variación en la longitud de la secuencia aguas abajo del ORF5, que oscila entre los 167 nt del CYDV-RPV y los 650 nt del SbDV.
Los luteovirus emplean una amplia gama de estrategias para expresar sus genomas compactos. Los ORFs 0, 1, 2 y 8 se expresan directamente a partir de ARNs genómicos. Los ORFs aguas abajo se expresan a partir de ARNs subgenómicos (sgRNAs) que se transcriben a partir de sitios de iniciación internos por ARN polimerasas dependientes del virus (RdRps) a partir de ARNs de cadena negativa y son 3′ co-terminales con el ARN genómico. Dado que el codón de iniciación del ORF0 de los polerovirus y los enamovirus se encuentra aguas arriba del ORF1, la traducción del ORF1 se inicia mediante un «escaneo de fuga» en el que los ribosomas pasan por alto el AUG del ORF0 y continúan escaneando el ARN genómico hasta llegar al AUG del ORF1. Los productos proteicos del ORF2 se expresan como una fusión traslacional con el producto del ORF1. En una frecuencia baja pero significativa durante la expresión del ORF1, la traducción continúa en el ORF2 a través de un desplazamiento de marco -1 que produce una gran proteína que contiene secuencias codificadas por ambos ORFs 1 y 2 en un solo polipéptido. El cambio de marco está mediado por una «secuencia de hepta-nucleótidos resbaladiza» (de la forma X XXY YYZ) y una estructura secundaria de ARN aguas abajo denominada pseudo-nudo que hace que los ribosomas hagan una pausa y retrocedan un nt antes de continuar la traducción en el nuevo marco de lectura. El ORF8, que sólo se ha identificado en el PLRV, reside por completo dentro del ORF1 en un marco de lectura diferente y codifica una proteína de 5 kDa asociada a la replicación. Para expresar el ORF8, las secuencias dentro del ORF se pliegan en una estructura llamada sitio de entrada del ribosoma interno (IRES), que recluta a los ribosomas para iniciar la traducción unos 1600 nt aguas abajo del extremo 5′ del ARN del PLRV.
Los ORFs 3a, 3, 4 y 5 se expresan a través de un mecanismo de barrido de fugas desde el extremo 5′ del sgRNA1, que está situado unos 200 nt aguas arriba del ORF3 en el extremo del ORF2 y se extiende hasta el extremo 3′ del genoma. La traducción del ORF3a se inicia en un codón no-AUG. El ORF4 de la mayoría de los luteovirus y polerovirus está contenido en el ORF3. En todos los luteovíridos, el ORF5 se expresa únicamente como una fusión traslacional con los productos del ORF3 por readthrough del codón de parada UAG al final del ORF3, que produce una proteína con el producto del ORF3 en su N-terminal y el producto del ORF5 en su C-terminal. La lectura está regulada por interacciones locales y a larga distancia entre el ARN y el ARN y, en el caso de los luteovirus y algunos polerovirus, requiere la presencia de repeticiones CCXXXX (donde X es cualquier base) aguas abajo del codón de parada del ORF3. Los luteovirus y los polerovirus producen segundos sgRNA más pequeños capaces de expresar los ORFs 6 y 7. Los terceros sgRNAs, que no parecen codificar proteínas, se producen a niveles muy altos en los luteovirus, pero sólo a niveles bajos en el PLRV.
Mientras que los ARN de enamo y polerovirus contienen 5′ VPgs que interactúan con los factores de iniciación de la traducción, los ARN de luteovirus sólo contienen un 5′ fosfato. Los extremos 5′ no modificados se reconocen mal para la iniciación de la traducción. Para evitar este problema, el genoma de BYDV-PAV contiene una secuencia corta (elemento de traducción de BYDV; BTE) situada en la región no codificante 3′ aguas abajo del ORF5 que interactúa con secuencias cercanas a los 5′ terminales del ARN genómico y del sgRNA1 para promover la iniciación de la traducción independiente de la tapa.
El silenciamiento génico postranscripcional (PTGS) es una defensa antiviral innata y altamente adaptativa que se encuentra en todos los eucariotas y que es activada por los ARN de doble cadena (dsRNA), que se producen durante la replicación del virus. La investigación sobre las funciones de las proteínas codificadas por los luteovirus ha demostrado que las proteínas de 28-34 kDa codificadas por el ORF0 son fuertes supresores de la PTGS local y sistémica para los polerovirus y enamovirus. Los genomas de los luteovirus carecen de ORF0, pero el producto de ORF4 en los luteovirus funciona para suprimir la PTGS sistémica.
Las proteínas codificadas por ORF1 de los enamovirus y polerovirus contienen la VPg y una proteasa de serina similar a la quimotripsina que es responsable del procesamiento proteolítico de las poliproteínas codificadas por ORF1. La proteasa escinde la proteína ORF1 internamente para liberar la VPg, que está unida covalentemente al ARN genómico. La proteína expresada por el ORF8 del PLRV es necesaria para la replicación del virus. Los ORF2 de los luteovirus tienen una capacidad de codificación de 59-67 kDa para proteínas que son muy similares a las RdRps conocidas y, por lo tanto, es probable que representen la porción catalítica de la replicasa viral.
Para los luteovirus y polerovirus el ORF3a produce proteínas altamente conservadas de 4,8-5,3 kDa que son esenciales para el movimiento a larga distancia. ORF3 codifica la principal PC de los luteovirus, cuyo tamaño oscila entre 21 y 23 kDa. El ORF5 tiene una capacidad de codificación de 29 a 56 kDa. Sin embargo, el ORF5 se expresa sólo como una fusión traslacional con el producto del ORF3 cuando, aproximadamente el 10% de las veces, la traducción no se detiene al final del ORF3 y continúa hasta el final del ORF5. La porción ORF5 de esta proteína de lectura ha sido implicada en la transmisión de los áfidos y en la estabilidad del virus. Los experimentos con PLRV y BYDV-PAV han demostrado que la región N-terminal de la proteína de lectura ORF5 determina la capacidad de las partículas del virus para unirse a las proteínas producidas por las bacterias endosimbióticas de los vectores de los áfidos. Las interacciones de las partículas del virus con estas proteínas parecen ser esenciales para la persistencia de los virus en los áfidos. Los cambios en la secuencia de nucleótidos dentro del ORF5 de PEMV-1 suprimen la transmisibilidad de los áfidos. Las porciones N-terminales de las proteínas ORF5 están muy conservadas entre los luteovirus, mientras que las C-terminales son mucho más variables.
Los genomas de luteo y polerovirus poseen un ORF4 que está contenido dentro del ORF3 y codifica proteínas de 17-21 kDa. Los virus que contienen mutaciones en el ORF4 son capaces de replicarse en protoplastos de plantas aisladas, pero son deficientes o tienen un retraso en el movimiento sistémico en plantas enteras. Por lo tanto, el producto de ORF4 parece ser necesario para el movimiento del virus dentro de las plantas infectadas. Esta hipótesis está respaldada por la observación de que los enamovirus carecen de ORF4. Mientras que los luteovirus y los polerovirus se limitan al floema y a los tejidos asociados, el enamovirus PEMV-1 es capaz de moverse sistémicamente a través de otros tejidos de la planta en presencia del PEMV-2, que en condiciones naturales coexiste invariablemente con el PEMV-1.
Algunos genomas de luteovirus y polerovirus contienen pequeños ORFs dentro de y/o aguas abajo del ORF5. En los luteovirus, no se han detectado productos proteicos a partir de estos ORF en las células infectadas. Los genomas de BYDV-PAV que no expresan el ORF6 siguen siendo capaces de replicarse en protoplastos. Los tamaños previstos de las proteínas expresadas por los ORFs 6 y 7 de PLRV son de 7,1 y 14 kDa, respectivamente. Basándose en estudios mutacionales, se ha propuesto que estas regiones del genoma pueden regular la transcripción en las últimas etapas de la infección.