Organizace a exprese genomu
Genomická RNA luteoviridů obsahuje pět až sedm konzervovaných ORF (obr. 3). ORF 1, 2, 3 a 5 jsou společné pro všechny členy čeledi Luteoviridae. Luteoviry postrádají ORF0. Enamovirům chybí ORF4. Genomy luteovirů a polerovirů obsahují malý ORF (ORF3a) před ORF3. Genomy luteovirů obsahují malý ORF (ORF6) za ORF5. Genom PLRV obsahuje ORF 6 a 7 v rámci ORF5 a ORF8 v rámci ORF1. U enamo- a polerovirů překrývá ORF0 ORF1 o více než 600 nt, který rovněž překrývá ORF2 o více než 600 nt. U luteovirů překrývá ORF1 ORF2 o méně než 50 nt. Ve většině sekvencí genomu luteovirů a polerovirů je ORF4 zcela obsažen v ORF3. Jediný, v rámci jantaru (UAG) umístěný terminační kodon odděluje ORF5 od ORF3.

Obr. 3. Mapy genomů virů rodů čeledi Luteoviridae. Jednotlivé ORF jsou znázorněny otevřenými rámečky. ORF jsou vertikálně odstupňovány, aby byly znázorněny různé čtecí rámce obsazené jednotlivými ORF. Žluté rámečky označují proteinové produkty s předpokládanými velikostmi uvedenými napravo od každého z nich. Polyproteiny kódované ORF1 enamo- a polerovirů obsahují proteázu a protein spojený s genomem (VPg). Předpokládané sekvence aminokyselin proteinů kódovaných ORF2 jsou podobné RNA-dependentním RNA polymerázám. ORF3, který kóduje hlavní plášťový protein, je od ORF5 oddělen jantarovým terminačním kodonem. ORF4, pokud je přítomen, je nejčastěji obsažen v ORF3 a kóduje protein potřebný pro pohyb viru mezi buňkami. Luteo- a poleroviry obsahují ORF3a, jehož translace je zahájena jiným kodonem než AUG. 3′ nekódující oblasti luteovirů obsahují translační enhancerové elementy (BTE). U PLRV je ORF7 v rámu s C-koncem ORF5 a translace ORF8 je zprostředkována vnitřním iniciačním vstupním místem ribozomu (IRES). Luteo- a poleroviry produkují tři subgenomové RNA (sgRNA), ale enamoviry produkují jedinou sgRNA.
Luteoviridy mají relativně krátké 5′ a intergenové nekódující sekvence. První ORF předchází 21 nt u RNA viru CABYV a 142 nt u RNA viru sójové zakrslosti (SbDV). ORF 2 a 3 jsou odděleny 112-200 nt nekódující RNA. Existují značné rozdíly v délce sekvence za ORF5, která se pohybuje od 167 nt u CYDV-RPV po 650 nt u SbDV.
Luteoviridy používají k expresi svých kompaktních genomů širokou škálu strategií. ORF 0, 1, 2 a 8 jsou exprimovány přímo z genomové RNA. Dolní ORF jsou exprimovány ze subgenomických RNA (sgRNA), které jsou přepisovány z vnitřních iniciačních míst RNA-dependentní RNA polymerázou (RdRps) kódovanou virem z RNA s negativním řetězcem a jsou 3′ ko-terminální s genomickou RNA. Vzhledem k tomu, že iniciační kodon pro ORF0 polero- a enamovirů je před kodonem ORF1, je translace ORF1 zahájena „děravým skenováním“, při němž ribozomy obcházejí AUG ORF0 a pokračují ve skenování genomické RNA, dokud nedosáhnou AUG ORF1. Proteinové produkty ORF2 jsou exprimovány jako translační fúze s produktem ORF1. V nízké, ale významné frekvenci během exprese ORF1 pokračuje translace do ORF2 prostřednictvím posunu -1 rámce, který produkuje velký protein obsahující sekvence kódované oběma ORF 1 a 2 v jednom polypeptidu. Posun rámce je zprostředkován „kluzkou hepta-nukleotidovou sekvencí“ (ve tvaru X XXY YYZ) a navazující sekundární strukturou RNA označovanou jako pseudoknot, která způsobí, že se ribozomy zastaví a poté se posunou o jeden nt zpět před pokračováním translace v novém čtecím rámci. ORF8, který byl identifikován pouze u PLRV, se nachází zcela uvnitř ORF1 v jiném čtecím rámci a kóduje 5 kDa protein asociovaný s replikací. Pro expresi ORF8 se sekvence uvnitř ORF skládají do struktury zvané vnitřní vstupní místo pro ribozomy (IRES), která rekrutuje ribozomy k zahájení translace asi 1600 nt za 5′ koncem PLRV RNA.
ORF 3a, 3, 4 a 5 jsou exprimovány mechanismem děravého skenování z 5′ zakončení sgRNA1, které se nachází asi 200 nt před ORF3 na konci ORF2 a zasahuje do 3′ zakončení genomu. Translace ORF3a je zahájena na kodonu, který není AUG. ORF4 většiny luteo- a polerovirů je obsažen v ORF3. U všech luteovirů je ORF5 exprimován pouze jako translační fúze s produkty ORF3 přečtením stop kodonu UAG na konci ORF3, čímž vzniká protein s produktem ORF3 na jeho N-konci a produktem ORF5 na jeho C-konci. Přečtení je regulováno lokálními a dálkovými interakcemi RNA-RNA a v případě luteovirů a některých polerovirů vyžaduje přítomnost opakování CCXXXX (kde X je libovolná báze) za stop kodonem ORF3. Luteo- a poleroviry produkují druhou menší sgRNA schopnou exprimovat ORF 6 a 7. Třetí sgRNA, které zřejmě nekódují proteiny, jsou produkovány ve velmi vysokých hladinách u luteovirů, ale pouze v nízkých hladinách u PLRV.
Zatímco enamo- a polerovirové RNA obsahují 5′ VPgs, které interagují s iniciačními faktory translace, luteovirové RNA obsahují pouze 5′ fosfát. Nemodifikované 5′ konce jsou špatně rozpoznávány pro iniciaci translace. Aby se tento problém obešel, obsahuje genom BYDV-PAV krátkou sekvenci (BYDV translační element; BTE) umístěnou v 3′ nekódující oblasti za ORF5, která interaguje se sekvencemi v blízkosti 5′ konců genomické RNA a sgRNA1 a podporuje iniciaci translace nezávislou na čepičce.
Posttranskripční umlčování genů (PTGS) je vrozená a vysoce adaptivní protivirová obrana, která se vyskytuje u všech eukaryot a je aktivována dvouřetězcovými RNA (dsRNA), které vznikají během replikace virů. Výzkum funkcí proteinů kódovaných luteoviroidy ukázal, že 28-34 kDa proteiny kódované ORF0 jsou silnými supresory lokální a systémové PTGS pro polero- a enamoviry. Genomy luteovirů postrádají ORF0, ale produkt ORF4 u luteovirů funguje tak, že potlačuje systémovou PTGS.
Bílkoviny kódované ORF1 enamo- a polerovirů obsahují VPg a serinovou proteázu podobnou chymotrypsinu, která je zodpovědná za proteolytické zpracování polyproteinů kódovaných ORF1. Proteáza štěpí protein ORF1 uvnitř a uvolňuje VPg, který je kovalentně připojen ke genomové RNA. Protein exprimovaný ORF8 PLRV je nezbytný pro replikaci viru. Luteovirové ORF2 mají kódovací kapacitu 59-67 kDa pro proteiny, které jsou velmi podobné známým RdRps, a proto pravděpodobně představují katalytickou část virové replikázy.
U luteovirů a polerovirů ORF3a produkuje vysoce konzervované 4,8-5,3 kDa proteiny, které jsou nezbytné pro pohyb na velké vzdálenosti. ORF3 kóduje hlavní CP luteoviridů, jejíž velikost se pohybuje od 21 do 23 kDa. ORF5 má kódovací kapacitu 29-56 kDa. ORF5 je však exprimován pouze jako translační fúze s produktem ORF3, kdy se přibližně v 10 % případů translace nezastaví na konci ORF3 a pokračuje až na konec ORF5. Část ORF5 tohoto readthrough proteinu se podílí na přenosu mšic a stabilitě viru. Pokusy s PLRV a BYDV-PAV ukázaly, že N-koncová oblast readthrough proteinu ORF5 určuje schopnost virových částic vázat se na proteiny produkované endosymbiotickými bakteriemi mšicových vektorů. Interakce virových částic s těmito proteiny se zdají být nezbytné pro perzistenci virů v mšicích. Změny sekvence nukleotidů v ORF5 viru PEMV-1 ruší přenosnost na mšice. N-koncové části proteinů ORF5 jsou mezi luteoviroidy vysoce konzervované, zatímco C-konce jsou mnohem variabilnější.
Genomy luteo- a polerovirů mají ORF4, který je obsažen v ORF3 a kóduje proteiny o velikosti 17-21 kDa. Viry, které obsahují mutace v ORF4, jsou schopny replikace v izolovaných rostlinných protoplastech, ale jsou nedostatečné nebo opožděné v systémovém pohybu v celých rostlinách. Zdá se tedy, že produkt ORF4 je nezbytný pro pohyb viru v infikovaných rostlinách. Tuto hypotézu podporuje pozorování, že enamoviry postrádají ORF4. Zatímco luteo- a poleroviry jsou omezeny na floém a přidružená pletiva, enamovirus PEMV-1 je schopen systémového pohybu v ostatních rostlinných pletivech v přítomnosti PEMV-2, který v přirozených podmínkách vždy koexistuje s PEMV-1.
Některé genomy luteo- a polerovirů obsahují malé ORF uvnitř a/nebo za ORF5. U luteovirů nebyly z těchto ORF v infikovaných buňkách zjištěny žádné proteinové produkty. Genomy BYDV-PAV, které neexprimují ORF6, jsou přesto schopny replikace v protoplastech. Předpokládaná velikost proteinů exprimovaných ORF 6 a 7 PLRV je 7,1 a 14 kDa. Na základě mutačních studií bylo navrženo, že tyto oblasti genomu mohou regulovat transkripci v pozdní fázi infekce
.