Organisation et expression du génome
Les ARN génomiques des luteoviridés contiennent cinq à sept ORF conservés (figure 3). Les ORFs 1, 2, 3 et 5 sont partagés entre tous les membres des Luteoviridae. Les Luteovirus sont dépourvus d’ORF0. Les Enamovirus manquent l’ORF4. Les génomes des lutéovirus et des polerovirus contiennent un petit ORF (ORF3a) en amont de l’ORF3. Les génomes de Luteovirus contiennent un petit ORF (ORF6) en aval de l’ORF5. Le génome du PLRV contient les ORF 6 et 7, au sein de l’ORF5 et l’ORF8 au sein de l’ORF1. Chez les énamovirus et les polérovirus, l’ORF0 chevauche l’ORF1 de plus de 600 nt, qui chevauche également l’ORF2 de plus de 600 nt. Chez les lutéovirus, l’ORF1 chevauche l’ORF2 de moins de 50 nt. Dans la plupart des séquences génomiques des lutéovirus et des polérovirus, l’ORF4 est entièrement contenu dans l’ORF3. Un codon de terminaison unique, ambré dans le cadre (UAG), sépare l’ORF5 de l’ORF3.
Les lutéovirus ont des séquences 5′ et intergéniques non codantes relativement courtes. Le premier ORF est précédé de 21 nt dans l’ARN du CABYV et de 142 nt dans l’ARN du Soybean dwarf virus (SbDV). Les ORF 2 et 3 sont séparés par 112-200 nt d’ARN non codant. Il existe une variation considérable dans la longueur de la séquence en aval de l’ORF5, qui varie de 167 nt pour le CYDV-RPV à 650 nt pour le SbDV.
Les lutéovirus emploient un large éventail de stratégies pour exprimer leurs génomes compacts. Les ORF 0, 1, 2 et 8 sont exprimés directement à partir des ARN génomiques. Les ORF en aval sont exprimés à partir d’ARN sous-génomiques (sgRNA) qui sont transcrits à partir de sites d’initiation internes par des ARN polymérases ARN-dépendantes (RdRps) codées par le virus à partir d’ARN à brin négatif et sont 3′ co-terminaux avec l’ARN génomique. Comme le codon d’initiation de l’ORF0 des poléro- et énamovirus est en amont de celui de l’ORF1, la traduction de l’ORF1 est initiée par un » balayage fuyant » dans lequel les ribosomes contournent l’AUG de l’ORF0 et continuent à balayer l’ARN génomique jusqu’à ce qu’ils atteignent l’AUG de l’ORF1. Les produits protéiques de l’ORF2 sont exprimés sous la forme d’une fusion translationnelle avec le produit de l’ORF1. À une fréquence faible mais significative pendant l’expression de l’ORF1, la traduction se poursuit dans l’ORF2 par un décalage de cadre de lecture de -1 qui produit une grande protéine contenant les séquences codées par les ORF 1 et 2 dans un seul polypeptide. Le changement de cadre est médié par une « séquence hepta-nucléotidique glissante » (de la forme X XXY YYZ) et une structure secondaire d’ARN en aval appelée pseudo-note qui provoque une pause des ribosomes, puis un décalage d’un nt en arrière avant de poursuivre la traduction dans le nouveau cadre de lecture. L’ORF8, qui n’a été identifié que dans le PLRV, réside entièrement dans l’ORF1 dans un cadre de lecture différent et code pour une protéine de 5 kDa associée à la réplication. Pour exprimer l’ORF8, les séquences à l’intérieur de l’ORF se replient dans une structure appelée site interne d’entrée des ribosomes (IRES), qui recrute les ribosomes pour initier la traduction à environ 1600 nt en aval de l’extrémité 5′ de l’ARN du PLRV.
Les ORF 3a, 3, 4 et 5 sont exprimés par un mécanisme de balayage fuyant à partir de l’extrémité 5′ du sgRNA1, qui est situé environ 200 nt en amont de l’ORF3 à la fin de l’ORF2 et s’étend jusqu’à l’extrémité 3′ du génome. La traduction de l’ORF3a est initiée à un codon non-AUG. L’ORF4 de la plupart des lutéovirus et des polérovirus est contenu dans l’ORF3. Chez tous les lutéovirus, l’ORF5 est exprimé uniquement sous forme de fusion translationnelle avec les produits de l’ORF3 par lecture du codon stop UAG à l’extrémité de l’ORF3, ce qui produit une protéine avec le produit de l’ORF3 à son extrémité N-terminale et le produit de l’ORF5 à son extrémité C-terminale. La lecture est régulée par des interactions ARN-ARN locales et à longue distance et, dans le cas des lutéovirus et de certains polérovirus, elle nécessite la présence de répétitions CCXXXX (où X est une base quelconque) en aval du codon stop de l’ORF3. Les lutéovirus et les polérovirus produisent des seconds sgRNA plus petits capables d’exprimer les ORFs 6 et 7. Les troisièmes sgRNA, qui ne semblent pas coder pour des protéines, sont produits à des niveaux très élevés chez les lutéovirus, mais seulement à des niveaux faibles chez le PLRV.
Alors que les ARN des énamo- et polérovirus contiennent des 5′ VPgs qui interagissent avec les facteurs d’initiation de la traduction, les ARN des lutéovirus ne contiennent qu’un 5′ phosphate. Les 5′ terminaisons non modifiées sont mal reconnues pour l’initiation de la traduction. Pour contourner ce problème, le génome du BYDV-PAV contient une courte séquence (BYDV translation element ; BTE) située dans la région 3′ non codante en aval de l’ORF5 qui interagit avec des séquences proches des 5′ terminaisons de l’ARN génomique et du sgRNA1 pour favoriser l’initiation de la traduction indépendante de la coiffe.
L’extinction post-transcriptionnelle des gènes (PTGS) est une défense antivirale innée et hautement adaptative que l’on retrouve chez tous les eucaryotes et qui est activée par les ARN double brin (dsRNA), qui sont produits pendant la réplication des virus. Les recherches sur les fonctions des protéines codées par les lutéovirus ont montré que les protéines de 28-34 kDa codées par l’ORF0 sont de puissants suppresseurs des PTGS locaux et systémiques pour les poléro- et énamovirus. Les génomes des lutéovirus sont dépourvus d’ORF0, mais le produit de l’ORF4 chez les lutéovirus fonctionne pour supprimer la PTGS systémique.
Les protéines codées par l’ORF1 des énamo- et polérovirus contiennent le VPg et une sérine protéase de type chymotrypsine qui est responsable du traitement protéolytique des polyprotéines codées par l’ORF1. La protéase clive la protéine ORF1 en interne pour libérer la VPg, qui est attachée de manière covalente à l’ARN génomique. La protéine exprimée par l’ORF8 du PLRV est nécessaire à la réplication du virus. Les ORF2 des lutéovirus ont une capacité de codage de 59-67 kDa pour des protéines qui sont très similaires aux RdRps connues et représentent donc probablement la partie catalytique de la réplicase virale.
Pour les lutéovirus et les polérovirus, l’ORF3a produit des protéines hautement conservées de 4,8-5,3 kDa qui sont essentielles pour les déplacements sur de longues distances. L’ORF3 code pour la principale PC des lutéovirus, dont la taille varie de 21 à 23 kDa. L’ORF5 a une capacité de codage de 29 à 56 kDa. Cependant, l’ORF5 n’est exprimé que sous la forme d’une fusion translationnelle avec le produit de l’ORF3 lorsque, environ 10 % du temps, la traduction ne s’arrête pas à la fin de l’ORF3 et continue jusqu’à la fin de l’ORF5. La partie ORF5 de cette protéine de lecture a été impliquée dans la transmission des pucerons et la stabilité du virus. Des expériences avec le PLRV et le BYDV-PAV ont montré que la région N-terminale de la protéine de lecture ORF5 détermine la capacité des particules virales à se lier aux protéines produites par les bactéries endosymbiotiques des pucerons vecteurs. Les interactions des particules virales avec ces protéines semblent être essentielles pour la persistance des virus dans les pucerons. Les changements de séquence nucléotidique dans l’ORF5 du PEMV-1 abolissent la transmissibilité aux pucerons. Les portions N-terminales des protéines ORF5 sont hautement conservées parmi les lutéovirus alors que les C-terminaux sont beaucoup plus variables.
Les génomes des lutéovirus et des polérovirus possèdent un ORF4 qui est contenu dans l’ORF3 et qui code pour des protéines de 17-21 kDa. Les virus qui contiennent des mutations dans l’ORF4 sont capables de se répliquer dans des protoplastes végétaux isolés, mais sont déficients ou retardés dans le mouvement systémique dans les plantes entières. Par conséquent, le produit de l’ORF4 semble être nécessaire au mouvement du virus dans les plantes infectées. Cette hypothèse est soutenue par l’observation que les énamovirus sont dépourvus d’ORF4. Alors que les lutéovirus et les polérovirus sont limités au phloème et aux tissus associés, l’énamovirus PEMV-1 est capable de se déplacer de manière systémique dans d’autres tissus végétaux en présence de PEMV-2, qui, dans des conditions naturelles, coexiste invariablement avec PEMV-1.
Certains génomes de lutéovirus et de polérovirus contiennent de petits ORF à l’intérieur et/ou en aval de l’ORF5. Chez les lutéovirus, aucun produit protéique n’a été détecté à partir de ces ORF dans les cellules infectées. Les génomes de BYDV-PAV qui n’expriment pas l’ORF6 sont toujours capables de se répliquer dans les protoplastes. Les tailles prédites des protéines exprimées par les ORFs 6 et 7 du PLRV sont de 7,1 et 14 kDa, respectivement. Sur la base d’études mutationnelles, il a été proposé que ces régions du génome puissent réguler la transcription tard dans l’infection.