Organizacja genomu i ekspresja
Genomowe RNA luteowirusów zawiera pięć do siedmiu konserwowanych ORF-ów (Rys. 3). ORF-y 1, 2, 3 i 5 są wspólne dla wszystkich członków Luteoviridae. Luteowirusy nie posiadają ORF0. Enamowirusy nie posiadają ORF4. Genomy luteo- i polerowirusów zawierają mały ORF (ORF3a) przed ORF3. Genomy luteowirusów zawierają mały ORF (ORF6) downstream of ORF5. Genom PLRV zawiera ORF 6 i 7, w obrębie ORF5 oraz ORF8 w obrębie ORF1. W enamo- i polerowirusach ORF0 nakłada się na ORF1 o ponad 600 nt, który również nakłada się na ORF2 o ponad 600 nt. W luteowirusach ORF1 zachodzi na ORF2 o mniej niż 50 nt. W większości sekwencji genomów luteo- i polerowirusów, ORF4 jest całkowicie zawarty w ORF3. Pojedynczy kodon terminacji UAG (in-frame amber) oddziela ORF5 od ORF3.
Luteowirusy mają stosunkowo krótkie 5′ i międzygenowe sekwencje niekodujące. Pierwszy ORF jest poprzedzony przez 21 nt w CABYV RNA i 142 nt w Soybean dwarf virus (SbDV) RNA. ORF-y 2 i 3 są oddzielone 112-200 nt niekodującego RNA. Istnieje znaczne zróżnicowanie w długości sekwencji poniżej ORF5, która waha się od 167 nt dla CYDV-RPV do 650 nt dla SbDV.
Luteowirusy stosują szeroki zakres strategii do ekspresji swoich zwartych genomów. ORF-y 0, 1, 2 i 8 ulegają ekspresji bezpośrednio z genomowego RNA. ORF-y niższego rzędu ulegają ekspresji z subgenomowych RNA (sgRNA), które są transkrybowane z wewnętrznych miejsc inicjacji przez zakodowane w wirusie polimerazy RNA zależne od RNA (RdRps) z RNA o ujemnej nici i są 3′ współkońcowe z genomowym RNA. Ponieważ kodon inicjacyjny dla ORF0 polero- i enamowirusów znajduje się przed kodonem ORF1, translacja ORF1 jest inicjowana przez „nieszczelne skanowanie”, w którym rybosomy omijają AUG ORF0 i kontynuują skanowanie genomowego RNA, aż dotrą do AUG ORF1. Produkty białkowe ORF2 ulegają ekspresji jako fuzja translacyjna z produktem ORF1. Z niską, ale znaczącą częstotliwością podczas ekspresji ORF1, translacja jest kontynuowana do ORF2 poprzez -1 frameshift, który wytwarza duże białko zawierające sekwencje kodowane przez oba ORF 1 i 2 w pojedynczym polipeptydzie. W przesunięciu ramki pośredniczy „śliska sekwencja hepta-nukleotydowa” (w formie X XXY YYZ) oraz drugorzędowa struktura RNA określana jako pseudoknot, która powoduje, że rybosomy zatrzymują się, a następnie cofają o jeden nt przed kontynuacją translacji w nowej ramce odczytu. ORF8, który został zidentyfikowany tylko w PLRV, znajduje się całkowicie wewnątrz ORF1 w innej ramce odczytu i koduje białko związane z replikacją o masie 5 kDa. W celu ekspresji ORF8, sekwencje wewnątrz ORF składają się w strukturę zwaną wewnętrznym miejscem wejścia rybosomu (IRES), która rekrutuje rybosomy do rozpoczęcia translacji około 1600 nt w dół od 5′ terminusa PLRV RNA.
ORFs 3a, 3, 4, i 5 ulegają ekspresji poprzez mechanizm leaky scanning z 5′ terminusu sgRNA1, który znajduje się około 200 nt w górę od ORF3 na końcu ORF2 i rozciąga się do 3′ terminusu genomu. Translacja ORF3a jest inicjowana przy kodonie innym niż AUG. ORF4 większości luteo- i polerowirusów jest zawarty w ORF3. U wszystkich luteowirusów ORF5 ulega ekspresji tylko jako translacyjna fuzja z produktami ORF3 w wyniku odczytu kodonu stop UAG na końcu ORF3, co powoduje powstanie białka z produktem ORF3 na jego N-końcu i produktem ORF5 na jego C-końcu. Odczyt jest regulowany przez lokalne i długodystansowe interakcje RNA-RNA, a w przypadku luteowirusów i niektórych polerowirusów wymaga obecności powtórzeń CCXXXX (gdzie X jest dowolną zasadą) za kodonem stop ORF3. Luteo- i polerowirusy wytwarzają drugie, mniejsze sgRNA zdolne do ekspresji ORF 6 i 7. Trzecie sgRNA, które nie wydają się kodować białek, są produkowane na bardzo wysokim poziomie u luteowirusów, ale tylko na niskim poziomie u PLRV.
Podczas gdy enamo- i polerowirusowe RNA zawierają 5′ VPgs, które oddziałują z czynnikami inicjacji translacji, luteowirusowe RNA zawierają tylko 5′ fosforan. Niezmodyfikowane 5′ termini są słabo rozpoznawane do inicjacji translacji. Aby obejść ten problem, genom BYDV-PAV zawiera krótką sekwencję (BYDV translation element; BTE) zlokalizowaną w 3′ niekodującym regionie poniżej ORF5, która oddziałuje z sekwencjami w pobliżu 5′ terminin genomowego RNA i sgRNA1 w celu promowania niezależnej od czapeczki inicjacji translacji.
Posttranskrypcyjne wyciszanie genów (PTGS) jest wrodzoną i wysoce adaptacyjną obroną przeciwwirusową występującą u wszystkich eukariontów, która jest aktywowana przez dwuniciowe RNA (dsRNA), które są produkowane podczas replikacji wirusa. Badania nad funkcjami białek kodowanych przez luteowirusy wykazały, że białka o masie 28-34 kDa kodowane przez ORF0 są silnymi supresorami lokalnego i systemowego PTGS dla polero- i enamowirusów. W genomach luteowirusów brakuje ORF0, ale produkt ORF4 w luteowirusach funkcjonuje w celu tłumienia systemowego PTGS.
Białka kodowane przez ORF1 enamo- i polerowirusów zawierają VPg i proteazę serynową podobną do chymotrypsyny, która jest odpowiedzialna za proteolityczne przetwarzanie poliprotein kodowanych przez ORF1. Proteaza ta rozszczepia wewnętrznie białko ORF1, uwalniając VPg, które jest kowalencyjnie przyłączone do genomowego RNA. Białko wyrażane przez ORF8 PLRV jest wymagane do replikacji wirusa. ORF2 luteowirusów ma zdolność kodowania 59-67 kDa dla białek, które są bardzo podobne do znanych RdRps i stąd prawdopodobnie reprezentują część katalityczną wirusowej replikazy.
W przypadku luteo- i polerowirusów ORF3a produkuje wysoce konserwowane białka o masie 4,8-5,3 kDa, które są niezbędne do przemieszczania się na duże odległości. ORF3 koduje główny CP luteowirusów, którego wielkość waha się od 21 do 23 kDa. ORF5 ma zdolność kodowania 29-56 kDa. Jednakże ORF5 ulega ekspresji tylko w wyniku translacji z produktem ORF3, gdy w około 10% przypadków translacja nie zatrzymuje się na końcu ORF3 i jest kontynuowana do końca ORF5. Część ORF5 tego białka readthrough jest zaangażowana w przenoszenie mszyc i stabilność wirusa. Eksperymenty z PLRV i BYDV-PAV wykazały, że N-końcowy region ORF5 białka odczytu determinuje zdolność cząstek wirusa do wiązania się z białkami produkowanymi przez bakterie endosymbiotyczne wektorów mszyc. Interakcje cz±steczek wirusa z tymi białkami wydaj± się być niezbędne do przetrwania wirusów w mszycach. Zmiany sekwencji nukleotydów w obrębie ORF5 PEMV-1 znoszą zdolność przenoszenia wirusa przez mszyce. N-terminalne części białek ORF5 są wysoce konserwowane wśród luteowirusów, podczas gdy C-termini są znacznie bardziej zmienne.
Genomy luteo- i polerowirusów posiadają ORF4, który jest zawarty w ORF3 i koduje białka o masie 17-21 kDa. Wirusy zawierające mutacje w ORF4 są zdolne do replikacji w izolowanych protoplastach roślinnych, ale wykazują niedobór lub opóźnienie w przemieszczaniu się systemicznym w całych roślinach. Wydaje się więc, że produkt ORF4 jest niezbędny do przemieszczania się wirusa w obrębie zakażonych roślin. Hipoteza ta jest poparta obserwacją, że enamowirusy nie posiadają ORF4. Podczas gdy luteo- i polerowirusy są ograniczone do łyka i związanych z nim tkanek, enamowirus PEMV-1 jest w stanie przemieszczać się systemicznie przez inne tkanki roślinne w obecności PEMV-2, który w warunkach naturalnych niezmiennie współistnieje z PEMV-1.
Niektóre genomy luteo- i polerowirusów zawierają małe ORF w obrębie i/lub za ORF5. W luteowirusach nie wykryto produktów białkowych z tych ORF w zakażonych komórkach. Genomy BYDV-PAV, które nie wykazują ekspresji ORF6 są nadal zdolne do replikacji w protoplastach. Przewidywane rozmiary białek ekspresjonowanych przez ORF-y 6 i 7 PLRV wynoszą odpowiednio 7,1 i 14 kDa. Na podstawie badań mutacyjnych zaproponowano, że te regiony genomu mogą regulować transkrypcję w późnym okresie infekcji.