Geny kódující proteiny s AMP doménami v genomu B. germanica

K identifikaci anotovaných genů s AMP funkcemi v genomu B. germanica6 byly použity dvě strategie. První bylo vyhledávání názvů produktů zahrnujících termíny defense, drosomycin, tenecin, phormicin, attacin a coleoptericin. Druhou bylo vyhledávání anotovaných domén Pfam souvisejících s antimikrobiálními peptidy. Ty jsou zařazeny do tří klanových domén databáze Pfam: Knottin_1 (CL0054, superrodina knottinů podobná štířímu toxinu), Defensin (CL0075, superrodina podobná defensinu/myotoxinu) a Omega_toxin (CL0083, Omega toxin-like). Pět zjištěných domén Pfam bylo následujících: PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-thionin) a PF11415 (Toxin_37). Po odstranění genů C0J52_07645 (Giant-lens protein) a C0J52_08617 (putativní obranný protein 3), protože nekódují AMP, bylo zachováno 24 kódujících genů (doplňková tabulka 1). Ty byly původně rozděleny do následujících skupin: (i) proteiny Defensin_2 (dále jen Defensin) (10 CDS, včetně dvou s anotací partial = 5′), (ii) Drosomycin (doména gama-thionin) (10 CDS), (iii) Termicin (doména Toxin_37) (3 CDS) a (iv) CDS C0J52_26498. Poslední z nich, anotovaný jako hypotetický protein, byl dlouhý protein (541 aminokyselin) s doménou Attacin_C. Méně přísná doménová analýza však ukázala potenciální přítomnost dvou nebo tří dalších domén v tomto proteinu s podobností s Attacin_C a Coleoptericinem (PF06286).

Tabulka 1 Geny kódující proteiny s antimikrobiálními peptidovými doménami u B. germanica.

Za účelem revize anotovaných genů kódujících AMP bylo pomocí BLASTN a několika AMP CDS jako dotazů prověřeno několik RNA-Seq SRA experimentů B. germanica (PRJNA389591) na jejich expresi. Z běhů SRA s hojným počtem čtení AMP byl vybrán běh RNA-Seq SRR6784710 (celé tělo, dospělá samice). Běh SRR6784710 byl sestaven pomocí de novo Trinity25 a byla vytvořena databáze transkriptů.

Anotovaný genom byl porovnán s databází transkriptů s cílem identifikovat kompletní sady AMP genů pro každou třídu. Po pečlivé revizi jsme identifikovali 39 AMP genů (patřících do pěti typů: defensiny, termiciny, drosomyciny, attacins-like a blattelliciny), které budou popsány níže. Třicet čtyři z nich bylo rozděleno do deseti genomových skeletů a pět genů bylo neumístěných (tabulka 1; doplňková tabulka 2).

Defensinové AMP geny

Deset anotovaných AMP CDS s defensinovou doménou bylo použito jako dotaz proti databázi transkriptů SRR6784710 pomocí BLASTN (e-hodnota = 1,0E-20). Všechny z nich poskytly shody s alespoň jedním transkriptem. Celkem bylo identifikováno 16 různých transkriptů. Početnost transkriptů se pohybovala v rozmezí hodnot TPM (transkriptů na milion transkriptů) 323,64-0,00.

Byly porovnány informace o anotaci genomu a sestavených transkriptech (viz Materiály & Metody), přičemž bylo identifikováno 16 defensinových genů (doplňkové tabulky 2 a 3). Dostaly názvy defensin_g1 až defensin_g16, přičemž defensin_g1 a defensin_g16 zahrnují dvě alternativní izoformy, které neovlivňují kódující oblast. Izoformy defensinu_g1 i1 a i2 se lišily odstraněním nebo neodstraněním 3′-UTR intronu, zatímco obě izoformy defensinu_g16 se lišily použitím různých poly(A) signálů.

Geny defensinu (kromě defensinu_g1, který nebyl umístěn) byly seskupeny do čtyř scaffoldů. Neumístěný defensin_g1 byl zařazen, protože program identifikoval tři transkripty patřící do shluku TRINITY_DN1123_c0. Jeden z nich (odpovídající defensin_g2) by mohl souviset s genem C0J52_24001 (kódujícím hypotetický protein), ačkoli jsme po správném umístění začátku druhého exonu obnovili správný čtecí rámec. Další dva transkripty vykazovaly 100% identitu, ale lišily se v alternativním sestřihu 453-nt 3′-UTR intronu. Považovali jsme je za izoformy defensinu_g1, odlišného genu defensinu_g2, protože se lišily v sedmi nukleotidech (dva v CDS) a třech různě velkých indelech v 3′-UTR. Taková sekvence však nebyla zjištěna v žádné skeletové sekvenci.

Vysoce exprimovaný transkript (TRINITY_DN13842_c0_g1_i1) byl zřejmě odvozen z nesprávného sestavení čtení pomocí TRINITY ze čtyř různých lokusů v genomu s téměř identickými sekvencemi (defensin_g3 až g6). Tři z nich byly dříve anotovány s kvalifikátory locus_tag C0J52_27569, C0J52_22338 a C0J52_24004. Avšak C0J52_27569 (gen = DEFI_4 ve scaffoldu PYGN01003429) byl tandemem dvou genů (defensin_g3 a defensin_g4). Mezera v sestavě překrývající se s defensin_g3 je pravděpodobně důvodem vysvětlujícím, proč byla v genomu anotována jediná mRNA rozšiřující oba geny.

Geny defensin_g7 a defensin_g8 vykazovaly identické sekvence CDS, ale s několika rozdíly v segmentech UTR sekvencí mRNA. Byly zařazeny do scaffoldů PYGN01002380, respektive PYGN01001185. Pouze jeden z nich, defensin_g8, byl dříve anotován jako gen C0J52_22336.

Defensin_g9 odpovídá genu C0J52_24005 kódujícímu formicin, protein o 91 aminokyselinách. Analýza transkriptu odhalila, že kódovaný protein je kratší (71 aminokyselin) se signální peptidovou sekvencí 20 aminokyselin na jeho amino konci (viz níže). Defensin_g10 byl také Phormicin umístěný v jiném skeletu, ale v genomu byl přítomen pouze druhý exon, přičemž první exon byl pravděpodobně umístěn v přilehlé 1-kb montážní mezeře.

Defensin_g11, g12 a g13 odpovídají dříve anotovaným genům (doplňkové tabulky 2 a 3). Defensin_g14 je přítomen ve scaffoldu PYGN01001185, ale většina sekvence druhého exonu chybí kvůli montážní mezeře. Sekvence CDS defensinu_g15 a C0J52_20459 byly identické, ale analýza transkriptu defensinu_g15 naznačila, že se jedná o dvouexonovou mRNA namísto tříexonové C0J52_20459.

Všechny defensiny vykazovaly signální peptidy o 18 až 22 aminokyselinách na N-konci a doménu PF01097 (Defensin_2) na C-konci (viz příklady organizace domén na obr. 1). Délka aminokyselinového řetězce se pohybovala od 63 do 81 zbytků s průměrem 72 aminokyselin. Přestože některé proteiny Defensinu byly identické, průměrný počet párových rozdílů byl vysoký (29 aminokyselin). Odvozená fylogeneze s maximální věrohodností ukázala jejich rozložení v sedmi shlucích (obr. 2a). Logo zarovnání proteinů Defensin ukazuje hydrofobní sekvenci na N-konci a také doménu Defensin_2 (C-konec) se šesti konzervovanými cysteinovými zbytky (doplňkový obr. 1).

Obrázek 1
obrázek1

Uspořádání domén v pěti typech AMP B. germanica. Z každé třídy je zobrazen jeden protein. Oranžové čtverce jsou signální peptidy. Červený ovál odpovídá oblasti bohaté na glutamin/kyselinu glutamovou. Zelené ovály jsou domény Pfam-A PF03769 (Attacin_C). Modré ovály (shora dolů) jsou domény Pfam-A PF01097 (Defensin_2), PF11415 (Toxin_37) a PF00304 (Gamma-thionin).

Obrázek 2
obrázek2

Fylogeneze proteinů B. germanica Defensin a Drosomycin. (a) Fylogeneze 18 proteinů defensinu s maximální pravděpodobností (odvozená z transkriptů 16 genů). Model WAG + I s úplnou delecí. Délka zarovnání 57 míst. Bootstrapových replikátů 100. Střední bod zakořenění. (b) Maximálně pravděpodobná fylogeneze proteinů Drosomycinu. Model Dayhoff + G s úplnou delecí. Délka zarovnání 66 míst. Bootstrap replikátů 100. Střední bod zakořenění. Hodnoty Bootstrapu menší než 50 jsou skryté.

Srovnání mezi úrovněmi transkripce 16 defensinových genů bylo odhadnuto pomocí strategie BLASTN založené na vyhledávání BLASTN s nukleotidy 41-190 každého CDS. Všechny 150-nt sekvence se lišily alespoň v jednom nukleotidu, s výjimkou defensin_g3 a g5, které byly identické a úroveň transkripce nebylo možné přiřadit ke konkrétnímu genu (doplňková tabulka 3). Na základě hodnot TPM odhadnutých pomocí TRINITY a úrovní transkripce odhadnutých touto strategií BLAST jsme zjistili, že v tomto běhu dospělých samic jsou defensin_g15 a g16 (kódující defensinu podobné proteiny), g9 a g10 (kódující formicin) a g1, g2, g3 a g5 (kódující proteiny tenecin-1) nejvíce exprimované defensinové geny (doplňková tabulka 3).

Pomocí strategie TBLASTN byly vyhledány transkripty defensinů u 45 druhů zahrnujících řád Blattodea26 (doplňková tabulka 4). Čtyřicet čtyři druhů obsahuje transkripty defensinů (rozsah 1 až 9).

Termicinové AMP geny

V genomu jsou anotovány tři geny kódující malé proteiny s doménou Pfam PF11415 (doplňková tabulka 1). Vyhledávání BLASTN proti databázi transkriptů SRR6784710 poskytlo shody pouze se dvěma velmi podobnými transkripty. První transkript, TRINITY_DN10017_c0_g1_i1, vykazoval jeden jediný rozdíl s C0J52_00758 nebo C0J52_26761 v sekvenci CDS, ale několik ve zbývající sekvenci mRNA, což naznačuje dva nezávislé geny v genomu. Druhý transkript, TRINITY_DN10017_c0_g2_i1, byl 100% identický s CDS i mRNA z C0J52_26762, což naznačuje třetí gen pro termicin. Tři kódované proteiny jsou téměř identické s jediným rozdílem S/A v místě 13 (doplňkový obr. 1). Mezi aminokyselinami 1 a 19 je předpovězen signální hydrofobní peptid a mezi aminokyselinami 30 a 63 doména Toxin_37 (PF11415) (obr. 1). Na základě hodnot TPM odhadnutých pomocí TRINITY a úrovní transkripce odhadnutých pomocí BLASTN (150-bp úsek pokrývající čtyři polymorfní místa v CDS termicinu) lze usuzovat, že termicin_g3 (C0J52_26762) je nejvíce exprimovaný gen termicinu (Doplňková tabulka 5).

Termicinové mRNA byly detekovány u 29 druhů rodu Blattodea patřících do různých taxonomických čeledí (Doplňková tabulka 4). Jejich nepřítomnost byla častá u druhů z Corydioidea, což naznačuje možnou ztrátu tohoto typu genu, i když nedostatečnou expresi v těchto vzorcích nelze vyloučit.

Drosomycin AMP geny

Deset genů kódujících proteiny s doménou gama-thionin (PF00304) je anotováno ve třech scaffoldech genomu B. germanica. Tyto antifungální proteiny dostávají název drosomyciny. BLASTN vyhledávání anotovaných CDS vůči databázi transkriptů SRR6784710 identifikovalo pouze šest transkriptů zahrnujících kompletní CDS a dva nevýznamné transkripty pokrývající pouze segment CDS.

Srovnání anotovaných CDS a genů odvozených z těchto transkriptů ukázalo, že pouze tři anotované geny (C0J52_03170, C0J52_03171 a C0J52_12810) jsou ekvivalentní třem z těchto transkriptů (první s rozdílem 2 nukleotidů). Byly anotovány jako drosomycin_g2, g3 a g5 (doplňkové tabulky 2 a 6). Jeden ze tří zbývajících transkriptů, odpovídající drosomycin_g6, mohl být umístěn v genomu, s několika nukleotidovými rozdíly, v neanotovaném segmentu. Konečně sekvence dalších dvou transkriptů nebyly v genomu zjištěny, ačkoli jejich sekvence CDS byly velmi podobné C0J52_03170 (s rozdíly 6 a 8 nukleotidů). Tyto rozdíly naznačují, že se nejedná o alely, ale o nezávislé geny, a proto jsme je anotovali jako drosomycin_g1 a g4 (doplňkové tabulky 2 a 6).

Na druhé straně šest anotovaných genů s lokusovými_značkami, C0J52_12811-13 a C0J52_23105-08, nebylo v transkriptomu dospělých samic detekováno, ale zdá se, že jsou exprimovány v jiných vývojových stadiích. Byly anotovány jako drosomycin_g7 až g13.

Fylogeneze 13 drosomycinových proteinů ukázala, že nejvzdálenějším genem je defensin_g6, zatímco ostatních 12 genů tvoří dva shluky po šesti genech. Geny drosomycin_g1 až g5, exprimované u dospělých samic, plus neexprimovaný drosomycin_g9 tvořily jeden dobře podporovaný klastr, zatímco ostatních šest neexprimovaných genů tvořilo druhý (obr. 2b).

Odhad úrovně transkripce ukázal, že drosomycin_g5 (C0J52_12810) byl genem s nejvyšší expresí, přičemž 86,1 % čtení drosomycinu pro tento segment pocházelo z něj (Doplňková tabulka 6).

Dvanáct ze 13 kódovaných proteinů mělo délku 66 aminokyselin. Drosomycin_g6 byl dlouhý 71 aminokyselin v důsledku přítomnosti dalších aminokyselin uprostřed proteinu odvozených ze dvou indelů (místa 25-26 a 36-38 zarovnání). Ze sledovaných zbytků je u kódovaných proteinů nejpozoruhodnější přítomnost osmi konzervovaných cysteinů27 (doplňkový obr. 1). Všechny drosomyciny vykazují na N-konci signální hydrofobní peptid a na C-konci doménu PF00304 (gama-thionin) (obr. 1).

Drosomycinové mRNA byly zjištěny u 24 druhů rodu Blattodea, ale chyběly u druhů rodu Isoptera a jejich blízkého příbuzného Cryptocercus wrighti (doplňková tabulka 4). Stejná skutečnost byla zjištěna u klanu Corydioidea, což naznačuje, že termiti a ostatní Blattodea mohli tento typ AMP genu ztratit.

Attacinové AMP geny: attacin-like a blattelliciny

V 47-kb oblasti zahrnující gen C0J52_26498 umístěný v kontigu PYGN01001824 byly zjištěny až čtyři oblasti s určitou podobností s doménou Attacin_C (PF03769). Po předběžné analýze sestaveného transkriptomu bylo identifikováno více než deset sekvencí mRNA. Podobají se úplným nebo částečným sekvencím mRNA náležejícím ke dvěma typům atacinových genů. První typ zahrnuje geny kódující typické attacinové proteiny (přibližně 120 aminokyselin) se signálním peptidem na N-konci a doménou Attacin_C na C-konci, které byly pojmenovány jako attacin-like geny. Druhý typ byl velmi odlišný, protože obsahoval dlouhý úsek zbytků glutaminu/kyseliny glutamové. Protože se zdály být zjevnou evoluční novinkou u B. germanica, nazvali jsme je blattelliciny.

V transkriptomu byly zjištěny tři attacin-like transkripty (doplňkové tabulky 2 a 7). Obsahovaly kódující sekvence o délce 357-360 nukleotidů (118-119 kódovaných aminokyselin). Dostaly názvy attacin-like_g1 až attacin-like_g3. Extrakce a sestavení čtení pro tyto mRNA potvrdily jejich existenci, ale naznačily možnost existence čtvrtého genu. Attacin-like_g3A a attacin-like_g3B vykazují pouze dva rozdíly, a to deleci 9-nukleotidového úseku v 5′UTR attacinu_g3B a synonymní rozdíl na pozici 288 CDS (zahrnutí míst pro tyto dva rozdíly do čtení bylo velmi řídké vzhledem k tomu, že délka čtení je 301 nukleotidů). Protože rozdíly byly pouze dva a v genomu nebyly umístěny, měli jsme za to, že se jedná o alely stejného genu.

CDS attacin-like_g1 byl relativně podobný CDS attacin-like_g3 s 9-10 rozdíly. Byly však dostatečně odlišné, aby mohly být považovány za nezávislé lokusy. Attacin-like_g2 byl nejodlišnějším genem s 85-88 rozdíly a jedním kodonem navíc proti ostatním. V genomu se nacházely pouze sekvence attacin-like_g1 a g2 (doplňkové tabulky 2 a 7).

Anotace blattellicinů byla mnohem složitější. Po předběžné analýze byl zjištěn dlouhý CDS (> 250 kodonů) se zvláštní strukturou. Začínala hydrofobním signálním peptidem na N-konci, následoval dlouhý úsek bohatý na Glx uprostřed (> 70 zbytků, převážně glutaminy a glutamové kyseliny) a C-koncová attacinová doména (obr. 1).

Bylo zjištěno až 13 transkriptů mRNA (všechny obsahovaly neúplné úseky CDS) zahrnujících tento typ sekvencí. Hlavním důvodem byla přítomnost několika blattellicinových genů a dlouhých oblastí bohatých na Glx, které drasticky ovlivnily sestavení transkriptomu. K této skutečnosti pravděpodobně došlo při sestavování a anotaci genomu B. germanica5,6.

Sekvence 5′ CDS blattellicinu byla použita jako dotaz k identifikaci pomocí BLASTN těch čtení, která pocházejí z exprese blattellicinových genů v běhu SRR6784710. Po extrakci a sestavení byly odhaleny čtyři různé začátky blattellicinových genů s rozsahem 7 až 18 párových nukleotidových rozdílů v 5′ mRNA. Tyto čtyři začátky mRNA byly použity k rekrutování zbývajících sekvencí genů až do dokončení CDS.

Většinu sekvence CDS pro blattellicin_g1 bylo možné v genomu identifikovat, ačkoli přibližně 200 bp chybělo kvůli dvěma mezerám v sestavení (doplňkové tabulky 2 a 7). U ostatních bylo možné jednoznačně přiřadit ke konkrétnímu kontigovému segmentu pouze první kódující exon blattellicin_g2 a g4, ačkoli byly zjištěny shody i pro další segmenty CDS, ale bez 100% identity. V genomu se nepodařilo identifikovat žádnou identickou sekvenci s prvním exonem blattellicin_g3. Nejpravděpodobnějším vysvětlením je, že čtyři geny pro blattellicin jsou v genomu přítomny v tandemových kopiích, ale jejich zvláštní struktura centrálních opakování brání správnému sestavení v genomu nebo transkriptomu, s výjimkou případů, kdy se provádí ruční kontrola zarovnání. Kromě toho nelze vyloučit rozdíly v počtu kopií Glx kodonů v populaci.

Zjistili jsme, že blattelliciny byly exprimovány na vyšší úrovni než attacin-like geny, přičemž blattellicin_g4 byl v tomto transkriptomu nejvíce exprimován (doplňková tabulka 7).

Loga zarovnání proteinů pro tři attacin-like a čtyři blattellicinové proteiny B. germanica odhalily malý segment záporně nabitých aminokyselin u Attacin-like proteinů a dlouhý segment u Blattellicinů (obr. 3).

Obrázek 3
obrázek3

Loga zarovnání a aminokyselinové složení Attacin-like a Blattellicin proteinů B. germanica. (a) Logo zarovnání tří proteinů podobných Attacinu. (b) Logo zarovnání čtyř Blattellicinů. (c) Průměrné aminokyselinové složení (%) proteinů Attacin-like a Blattellicin.

Attacinové mRNA byly zjištěny u většiny druhů rodu Blattodea (doplňková tabulka 4). Hity pro blattelliciny nepokrývaly Glx oblast, ale pouze attacin_C doménu. Abychom pochopili evoluční historii genů podobných attacinům a blattellicinů u B. germanica, extrahovali jsme transkripty attacinů ze sedmi TSA projektů Blattellinae26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Tyto transkriptomy pocházejí z celých těl dospělců s výjimkou I. deropeltiformis (bez informace o vývojovém stadiu). Potenciálně mohou pokrývat všechny atacinové geny pro každý genom, i když nelze vyloučit možnost genů bez exprese. Největší počet atacinových genů byl tři u E. sundaica. Dva geny byly pozorovány u L. decipiens, Symploce sp. AD-2014 a A. kyotensis, ačkoli u prvního z nich byla jedna z kopií neúplná a velmi divergentní, pravděpodobně pseudogen, zatímco u druhého byly obě kopie o několik kodonů neúplné na 5′-konci CDS. V rámci projektu SRA byla provedena kontrola čtení pokrývajících začátek CDS a na základě těchto získaných čtení byla jedna kopie kompletní a u druhé chyběly pouze čtyři kodony. Zbylý druh obsahoval jedinou kopii genu. Kromě toho byl za účelem použití jako výstupní skupiny extrahován jediný zjištěný u P. americana.

Byla provedena fylogeneze s ořezaným zarovnáním (103 míst) (obr. 4). Krátká délka zarovnání sekvencí znemožnila získat vysoké hodnoty bootstrapu ve většině uzlů a bránila určit s úplnou jistotou evoluční historii této genové rodiny. Z fylogeneze však vyplývá několik skutečností. Zaprvé, geny podobné atacinu jsou ancestrálním typem genu. Některé druhy čeledi Blattellinae obsahují pouze jeden nebo dva geny. V případě kladů B. germanica, E. sundaica, L. decipiens a Symploce sp. AD-2014 došlo před jejich divergencí k duplikaci ancestrálního genu podobného attacinu, což vedlo ke vzniku typů attacin-like_g1 a g2. Ačkoli L. decipiens attacin-like_g1 nebyl zahrnut do fylogeneze, byla zjištěna neúplná a divergentní kopie transkriptu tohoto typu (GDYK01026461.1), která pravděpodobně pochází z pseudogenizované kopie.

Obrázek 4
obrázek4

Fylogeneze proteinů podobných atacinu a blattellicinu u Blattellinae. (a) Maximum Likelihood fylogeneze proteinů obsahujících doménu Attacin_C v podčeledi Blattellinae. Model LG + G s úplnou delecí. Zarovnání bylo oříznuto tak, aby se spojil N-terminální signální peptid plus C-terminální attacin_C doména (délka 103 míst). Jako outgroup byla použita P. americana. Bootstrap replikátů 100. Hodnoty Bootstrapu menší než 50 jsou skryté. Všechny názvy druhů jsou zkrácené (viz kódy v pravé topologii), kromě Symploce sp. Ty bez zkratek jsou proteiny z B. germanica. (b) Taxonomické vztahy podle26.

Původ blattellicinů se zdá být velmi nedávný. Ačkoli to není podpořeno významnou hodnotou bootstrapu, potenciálně byl zdvojen ancestrální gen typu attacin-like_g2 a jedna z kopií po rychlé evoluci vytvořila blattelliciny. K duplikaci došlo před divergencí E. sundaica a B. germanica. Protein u prvního z nich je zřejmě pre-blattellicin, včetně některých nových vlastností blattellicinů, jako je velká velikost (182 zbytků) a několik aminokyselin navíc na C-konci (RK u B. germanica a GKGK u E. sundaica). Hlavní charakteristika blattellicinů, dlouhá poly-Glx oblast, však chybí, ačkoli pre-Blattellicin E. sundaica obsahuje stopu o sedmi glutamových kyselinách (s A uprostřed) poblíž začátku attacinové domény.

AMP exprese u B. germanica

Pro stanovení exprese genů AMP v tkáních, vývojových stadiích nebo pohlavích B. germanica jsme vybrali CDS 17 typů genů AMP (defensin_g2, g3, g7, g9, g11, g13 a g15; termicin_g1; drosomycin_g1, g5, g6, g11 a g12; attacin-like_g1 a g2; blattellicin_g1 a g4). Jsou dostatečně odlišné, aby se předešlo důležitým křížovým výsledkům mezi vybranými látkami ze stejné skupiny. Vzhledem k vysoké podobnosti CDS některých genů ze stejné rodiny však získané hodnoty ukázaly expresi souborů genů s téměř identickými sekvencemi (například tři termicinové geny nebo attacin-like_g1 a g3).

Hladiny exprese byly odhadnuty pomocí strategie BLASTN jako počet shod/Gb experimentu SR (doplňková tabulka 8). Analýza heatmap 28 celotělových SR experimentů odpovídajících vzorkům z různých vývojových stadií (obr. 5) odhalila několik závěrů. Za prvé, dospělé samice vykazovaly vysokou expresi většiny genů AMP, i když nejvýznamnější byla nejvyšší exprese blattellicin_g1 a g4. Některé drosomyciny byly rovněž vysoce exprimovány, zvláště drosomycin_g5. Exprese některých genů souvisela s vývojem (viz např. absence exprese drosomycinu g11 a g12 u dospělých samic, ale vysoká exprese u nymf). Z defensinů byly během většiny vývojových stadií nejvíce exprimovány defensin_g9 a g15. Exprese defensinu g2 a g3 byla vyšší u dospělých samic než u nymf. Termicin_g1 vykazoval nízkou expresi u nymf i dospělců. Geny podobné attacinu byly exprimovány i u dospělých samic, přičemž hodnoty attacin-like_g1 byly vyšší než hodnoty attacin-like_g2, což bylo v souladu s dříve popsanými výsledky (doplňková tabulka 7), a to i vzhledem k tomu, že zjištěné shody pro attacin-like_g1 pravděpodobně pocházejí z genů g1 a g3.

Obrázek 5
obrázek5

Exprese 17 genů AMP v celých tělech B. germanica. Heatmapová analýza znázorňující množství transkriptů pro 17 vybraných genů AMP ve 28 experimentech Sequence Read odpovídajících celým tělům z různých vývojových stadií B. germanica s uvedením, v některých případech, pohlaví vzorku. Hodnoty byly odhadnuty jako kvocient mezi počtem čtení poskytujících shodu s e-hodnotou menší než 1,0E-40 (při použití kompletních sekvencí CDS jako dotazů při vyhledávání BLASTN) a velikostí SR experimentu v Gb.

Obecně geny AMP vykazují nárůst exprese s postupem vývoje k dospělým formám. Bohužel v databázi SRA nebyl uložen žádný SR experiment pro výhradně dospělé samce, ačkoli jsou uvedeny některé smíšené vzorky samců a samic (Doplňková tabulka 8).

Expresi těchto 17 genů AMP jsme analyzovali také v některých transkriptomických SR experimentech, v nichž vzorky pocházejí z jedné tkáně, části těla nebo směsi několika tkání (Doplňková tabulka 8). Obecně se zdá, že drosomycin_g5 a defensin_g9 jsou exprimovány ve většině těchto vzorků. Ve dvou pokusech z hlav dospělých samců bylo na relevantní úrovni exprimováno několik genů AMP, včetně defensin_g7 a g9, drosomycin_g5 a attacin-like_g2. Obecně je úroveň exprese v těchto vzorcích mnohem nižší než u vzorků pocházejících z celých těl. To nás vede k domněnce, že za vysokou úroveň exprese pozorovanou v celých tělech dospělých samic jsou zodpovědné jiné části těla než tukové těleso, vaječníky nebo epidermis (obr. 5).

V žádném vzorku tkáně nebo části těla nebyla pozorována exprese blattellicinu_g1 a blattellicinu_g4, s výjimkou téměř nedetekovatelné exprese v jednom vzorku neoplozených vajíček, pravděpodobně v důsledku kontaminace tkáněmi samic.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.