Genomisk organisation og ekspression
Genomisk RNA fra luteovirider indeholder fem til syv bevarede ORF’er (Fig. 3). ORF’erne 1, 2, 3 og 5 er fælles for alle medlemmer af Luteoviridae. Luteovirusser mangler ORF0. Enamovirusser mangler ORF4. Luteo- og polerovirusgenomerne indeholder en lille ORF (ORF3a) opstrøms for ORF3. Luteovirus-genomer indeholder en lille ORF (ORF6) nedstrøms for ORF5. PLRV-genomet indeholder ORF’erne 6 og 7 inden for ORF5 og ORF8 inden for ORF1. I enamo- og polerovirusene overlapper ORF0 ORF1 med mere end 600 nt, som også overlapper ORF2 med mere end 600 nt. I luteovirusene overlapper ORF1 ORF2 med mindre end 50 nt. I de fleste luteo- og polerovirus-genomsekvenser er ORF4 helt indeholdt i ORF3. Et enkelt, in-frame amber (UAG)-terminationskodon adskiller ORF5 fra ORF3.
Luteovirider har relativt korte 5′ og intergeniske ikke-kodende sekvenser. Den første ORF er forudgået af 21 nt i CABYV RNA og 142 nt i Soybean dwarf virus (SbDV) RNA. ORF’erne 2 og 3 er adskilt af 112-200 nt ikke-kodende RNA. Der er betydelig variation i længden af sekvensen nedstrøms ORF5, som varierer fra 167 nt for CYDV-RPV til 650 nt for SbDV.
Luteovirider anvender en bred vifte af strategier til at udtrykke deres kompakte genomer. ORF’erne 0, 1, 2 og 8 udtrykkes direkte fra genomiske RNA’er. Nedstrøms ORF’er udtrykkes fra sub-genomiske RNA’er (sgRNA’er), der transskriberes fra interne initieringssteder af viruskodede RNA-afhængige RNA-polymeraser (RdRps) fra negative RNA-strenge RNA’er og er 3′ co-terminale med det genomiske RNA. Da initieringskodonet for ORF0 i polero- og enamovirus er opstrøms for ORF1, initieres translation af ORF1 ved “leaky scanning”, hvor ribosomer omgår ORF0’s AUG og fortsætter med at scanne det genomiske RNA, indtil de når ORF1’s AUG. Proteinprodukterne fra ORF2 udtrykkes som en translationel fusion med produktet fra ORF1. Med en lav, men betydelig hyppighed under ekspressionen af ORF1 fortsætter translationen til ORF2 gennem et -1 frameshift, der producerer et stort protein, som indeholder sekvenser, der er kodet af både ORF 1 og 2, i et enkelt polypeptid. Frameshiftet formidles af en “glidende hepta-nucleotidsekvens” (i formen X XXY YYZ) og en sekundær struktur af RNA nedstrøms, kaldet en pseudoknot, der får ribosomerne til at holde pause og derefter flytte sig et nt tilbage, før de fortsætter oversættelsen i den nye læseramme. ORF8, som kun er blevet identificeret i PLRV, ligger helt inden for ORF1 i en anden læseramme og koder for et 5 kDa replikationsassocieret protein. For at udtrykke ORF8 foldes sekvenser inden for ORF’en til en struktur kaldet et IRES-sted (internal ribosome entry site), som rekrutterer ribosomer til at indlede translation ca. 1600 nt nedstrøms for 5′-terminus af PLRV-RNA.
ORF’erne 3a, 3, 4 og 5 udtrykkes gennem en leaky scanning-mekanisme fra 5′-terminus af sgRNA1, som er placeret ca. 200 nt opstrøms for ORF3 ved slutningen af ORF2 og strækker sig til genomets 3′-terminus. Oversættelse af ORF3a påbegyndes ved et ikke-AUG-kodon. ORF4 i de fleste luteo- og polerovirus er indeholdt i ORF3. I alle luteovirider udtrykkes ORF5 kun som en translationel fusion med produkterne fra ORF3 ved at læse UAG-stopkodonet i slutningen af ORF3, hvilket giver et protein med ORF3-produktet ved sin N-terminus og ORF5-produktet ved sin C-terminus. Gennemlæsning reguleres af lokale og langdistance RNA-RNA-interaktioner og kræver i tilfælde af luteovirus og nogle polerovirus tilstedeværelsen af CCXXXX-repeats (hvor X er en vilkårlig base) nedstrøms for ORF3-stopkodonet. Luteo- og polerovirus producerer et andet mindre sgRNA, der er i stand til at udtrykke ORF’erne 6 og 7. Tredje sgRNA’er, som ikke synes at kode for proteiner, produceres i meget høje niveauer i luteovirus, men kun i lave niveauer i PLRV.
Mens enamo- og polerovirus-RNA’er indeholder 5′ VPgs, der interagerer med translationsinitieringsfaktorer, indeholder luteovirus-RNA’er kun en 5′ fosfat. Umodificerede 5′-terminaler genkendes dårligt med henblik på translationsinitiering. For at omgå dette problem indeholder BYDV-PAV-genomet en kort sekvens (BYDV translation element; BTE), der er placeret i den 3′ ikke-kodende region nedstrøms ORF5, som interagerer med sekvenser nær 5′-terminalerne af genomisk RNA og sgRNA1 for at fremme cap-uafhængig translationsinitiering.
Post-transkriptionel gensilens (PTGS) er et medfødt og meget adaptivt antiviralt forsvar, der findes i alle eukaryoter, og som aktiveres af dobbeltstrengede RNA’er (dsRNA’er), der produceres under virusreplikation. Forskning i funktionerne af de proteiner, der er kodet af luteovirider, har vist, at de 28-34 kDa-proteiner, der er kodet af ORF0, er stærke undertrykkere af lokal og systemisk PTGS for polero- og enamovirusser. Luteovirusgenomer mangler ORF0, men produktet af ORF4 i luteovirus fungerer til at undertrykke systemisk PTGS.
De ORF1-kodede proteiner fra enamo- og polerovirus indeholder VPg og en chymotrypsinlignende serinprotease, der er ansvarlig for den proteolytiske behandling af ORF1-kodede polyproteiner. Proteasen spalter ORF1-proteinet internt for at frigøre VPg, som er kovalent bundet til genomisk RNA. Det protein, der udtrykkes af ORF8 i PLRV, er nødvendigt for virusreplikation. Luteovirid ORF2’er har en kodningskapacitet på 59-67 kDa for proteiner, der ligner meget kendte RdRps og derfor sandsynligvis repræsenterer den katalytiske del af den virale replikase.
For luteo- og polerovirus producerer ORF3a stærkt konserverede 4,8-5,3 kDa-proteiner, der er essentielle for langdistancebevægelser. ORF3 koder for luteovirernes vigtigste CP, som varierer i størrelse fra 21 til 23 kDa. ORF5 har en kodningskapacitet på 29-56 kDa. ORF5 udtrykkes imidlertid kun som en translationel fusion med produktet af ORF3, når translation i ca. 10 % af tilfældene ikke stopper ved slutningen af ORF3 og fortsætter til slutningen af ORF5. ORF5-delen af dette readthrough-protein er blevet inddraget i bladlusoverførsel og virusstabilitet. Forsøg med PLRV og BYDV-PAV har vist, at den N-terminale region af ORF5-gennemgangsproteinet bestemmer viruspartiklernes evne til at binde sig til proteiner, der produceres af endosymbiotiske bakterier i bladlusvektorer. Viruspartiklernes interaktion med disse proteiner synes at være afgørende for virusenes persistens i bladlus. Nukleotidsekvensændringer i ORF5 af PEMV-1 ophæver overførbarheden til bladlus. De N-terminale dele af ORF5-proteinerne er meget bevarede blandt luteovirider, mens C-terminalerne er meget mere variable.
Luteo- og polerovirusgenomerne besidder en ORF4, der er indeholdt i ORF3 og koder for proteiner på 17-21 kDa. Virus, der indeholder mutationer i ORF4, er i stand til at replikere i isolerede planteprotoplaster, men er mangelfulde eller forsinkede i systemisk bevægelse i hele planter. Det ser derfor ud til, at ORF4’s produkt er nødvendigt for virusets bevægelse i inficerede planter. Denne hypotese støttes af observationen af, at enamovirusser mangler ORF4. Mens luto- og polerovirus er begrænset til floem og tilknyttede væv, er enamovirus PEMV-1 i stand til at bevæge sig systemisk gennem andre plantevæv i tilstedeværelse af PEMV-2, som under naturlige forhold altid eksisterer sammen med PEMV-1.
Nogle luto- og polerovirusgenomer indeholder små ORF’er inden for og/eller nedstrøms for ORF5. I luteovirus er der ikke påvist nogen proteinprodukter fra disse ORF’er i inficerede celler. BYDV-PAV-genomer, der ikke udtrykker ORF6, er stadig i stand til at replikere i protoplaster. Den forudsagte størrelse af de proteiner, der udtrykkes af ORF 6 og 7 i PLRV, er henholdsvis 7,1 og 14 kDa. På grundlag af mutationsundersøgelser er det blevet foreslået, at disse genomregioner kan regulere transkriptionen sent i infektionen.