Az AMP doménnel rendelkező fehérjéket kódoló gének a B. germanica genomjában

A B. germanica genomjában található AMP funkciójú gének azonosítására két stratégiát alkalmaztunk. Az első a defense, drosomycin, tenecin, phormicin, attacin és coleoptericin kifejezéseket tartalmazó terméknevek keresése volt. A második az antimikrobiális peptidekhez kapcsolódó, annotált Pfam-domének keresése volt. Ezek a Pfam adatbázis három klántartományában szerepelnek: Knottin_1 (CL0054, Skorpiótoxin-szerű knottin szupercsalád), Defensin (CL0075, Defensin/myotoxin-szerű szupercsalád) és Omega_toxin (CL0083, Omega toxinszerű). Az öt kimutatott Pfam-domén a következő volt: PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-tionin) és PF11415 (Toxin_37). A C0J52_07645 (Giant-lens protein) és a C0J52_08617 (putative defense protein 3) eltávolítása után, mivel ezek nem kódolnak AMP-ket, 24 kódoló gén maradt meg (1. kiegészítő táblázat). Ezeket kezdetben a következő csoportokba soroltuk: (i) Defensin_2 fehérjék (a továbbiakban Defensin) (10 CDS, köztük kettő részleges = 5′ annotációval), (ii) Drosomycin (gamma-thionin domén) (10 CDS), (iii) Termicin (Toxin_37 domén) (3 CDS) és (iv) a C0J52_26498 CDS. Ez utóbbi, hipotetikus fehérjeként annotált hosszú fehérje (541 aminosav) volt, Attacin_C doménnel. Egy kevésbé szigorú doménelemzés azonban két vagy három további domén lehetséges jelenlétét mutatta ki ebben a fehérjében, amelyek hasonlóságot mutatnak az Attacin_C és a Coleoptericin (PF06286) doménekkel.

Táblázat 1 Antimikrobiális peptiddoménnel rendelkező fehérjéket kódoló gének a B. germanica.

Az annotált AMP-kódoló gének felülvizsgálata érdekében több B. germanica RNA-Seq SRA kísérletet (PRJNA389591) vizsgáltunk meg a BLASTN és számos AMP CDS mint lekérdezés segítségével. Az AMP-olvasatok sokaságát tartalmazó SRA-futtatások közül az SRR6784710 RNS-Seq-futtatást (egész test, felnőtt nőstény) választottuk ki. Az SRR6784710 futást a de novo Trinity25 segítségével állítottuk össze, és létrehoztunk egy transzkript-adatbázist.

A annotált genomot összehasonlítottuk a transzkript-adatbázissal azzal a céllal, hogy azonosítsuk az AMP-gének teljes készleteit az egyes osztályokhoz. Alapos felülvizsgálat után 39 AMP-gént azonosítottunk (öt típusba tartoztak: defensinek, termicinek, drosomycinek, attacin-szerű és blattellicinek), amelyeket az alábbiakban ismertetünk. Harmincnégy közülük tíz genomszerkezetben oszlott meg, öt gén pedig nem volt elhelyezve (1. táblázat; 2. kiegészítő táblázat).

Defensin AMP-gének

Tíz annotált, defensin doménnel rendelkező AMP CDS-t használtunk BLASTN segítségével (e-érték = 1,0E-20) az SRR6784710 transzkript-adatbázissal való lekérdezéshez. Mindegyikük legalább egy transzkriptet tartalmazó találatot eredményezett. Összesen 16 különböző transzkriptet azonosítottak. A transzkriptek gyakorisága 323,64-0,00 TPM (transzkript per millió transzkript) értékek között mozgott.

A genom annotációra vonatkozó információkat és az összeállított transzkripteket összehasonlítottuk (lásd Anyagok & Módszerek), és 16 defensin gént azonosítottunk (2. és 3. kiegészítő táblázat). Ezek a defensin_g1-től defensin_g16-ig a defensin_g1 és defensin_g16 neveket kapták, a defensin_g1 és defensin_g16 két alternatív izoformát is tartalmaz, amelyek nem érintik a kódoló régiót. A defensin_g1 i1 és i2 izoformái a 3′-UTR intron eltávolításában vagy elhagyásában, míg a defensin_g16 két izoformája a különböző poli(A)-jelek használatában különbözött.

A defensin gének (kivéve a defensin_g1-et, amely nem volt elhelyezve) négy scaffoldba voltak klaszterezve. A nem elhelyezett defensin_g1 azért került bele, mert a program három, a TRINITY_DN1123_c0 klaszterhez tartozó transzkriptet azonosított. Ezek közül az egyik (a defensin_g2-nek megfelelő) a C0J52_24001 génnel (amely egy hipotetikus fehérjét kódol) állhatott kapcsolatban, bár a második exon kezdetének helyes elhelyezése után visszanyertük a helyes olvasási keretet. A másik két transzkript 100%-os azonosságot mutatott, de egy 453-nt-os 3′-UTR intron alternatív splicingjében különbözött. Ezeket a defensin_g1, a defensin_g2-től eltérő gén izoformáinak tekintettük, mivel hét nukleotidban (kettő a CDS-ben) és három különböző méretű indelben különböztek a 3′-UTR-ben. Ilyen szekvenciát azonban egyetlen vázszekvenciában sem észleltek.

A magasan expresszált transzkript (TRINITY_DN13842_c0_g1_i1) nyilvánvalóan a genom négy különböző, közel azonos szekvenciájú lókuszának (defensin_g3-tól g6-ig) olvasatainak TRINITY általi hibás összeállításából származik. Ezek közül hármat korábban a C0J52_27569, C0J52_22338 és C0J52_24004 locus_tag minősítővel annotáltak. A C0J52_27569 (gén = DEFI_4 a PYGN01003429 scaffoldban) azonban két gén (defensin_g3 és defensin_g4) tandemje volt. A defensin_g3-mal átfedő összeszerelési rés valószínűleg az oka annak, hogy a genomban egyetlen, mindkét gént bővítő mRNS-t annotáltak.

A defensin_g7 és a defensin_g8 gének azonos CDS-szekvenciákat mutattak, de az mRNS-szekvenciák UTR-szakaszaiban számos különbség volt. A PYGN01002380 és a PYGN0100001185 scaffoldokba kerültek. Csak az egyiket, a defensin_g8-at korábban a C0J52_22336 génként jegyezték be.

A defensin_g9 megfelel a C0J52_24005 génnek, amely a formicint, egy 91 aminosavból álló fehérjét kódolja. A transzkriptelemzés kimutatta, hogy a kódolt fehérje rövidebb (71 aminosav), amino-terminálisán 20 aminosavból álló jelző peptidszekvenciával (lásd alább). A Defensin_g10 szintén egy másik állványzatban elhelyezkedő Phormicin volt, de csak a második exon volt jelen a genomban, az első exon valószínűleg egy összefüggő 1 kb-os összeszerelési résben helyezkedett el.

A Defensin_g11, g12 és g13 megegyezik a korábban annotált génekkel (2. és 3. kiegészítő táblázat). A defensin_g14 jelen van a PYGN01001185 állványban, de a második exon szekvenciájának nagy része hiányzik egy összeszerelési rés miatt. A defensin_g15 és a C0J52_20459 CDS-szekvenciái azonosak voltak, de a defensin_g15 transzkriptaelemzése a háromexonos C0J52_20459 helyett kétexonos mRNS-t sugallt.

Minden defensin N-terminálisán 18-22 aminosavból álló szignálpeptideket, C-terminálisán pedig a PF01097 (Defensin_2) domént mutatott (lásd a doménszerveződések példáit az 1. ábrán). Az aminosavlánc hossza 63 és 81 maradék között mozgott, átlagosan 72 aminosavval. Bár néhány Defensin-fehérje azonos volt, a páros eltérések átlagos száma magas volt (29 aminosav). A levezetett maximális valószínűségű filogenezis hét klaszterben való eloszlást mutatott (2a. ábra). A Defensin-fehérjék fehérjeillesztésének logóján látható a hidrofób N-terminális szekvencia, valamint a Defensin_2 domén (C-terminus) a hat konzervált ciszteinmaradvánnyal (1. kiegészítő ábra).

1. ábra
1. ábra

Doménszerveződés a B. germanica ötféle AMP-jében. Minden osztályból egy-egy fehérje látható. A narancssárga négyzetek a szignálpeptideket jelölik. A piros ovális egy glutamin/glutaminsavban gazdag régiónak felel meg. A zöld oválisok Pfam-A domének PF03769 (Attacin_C). A kék oválisok (fentről lefelé) a Pfam-A domének PF01097 (Defensin_2), PF11415 (Toxin_37) és PF00304 (Gamma-tionin).

2. ábra
2. ábra

B. germanica Defensin és Drosomycin fehérjék filogeniája. (a) A 18 Defensin-fehérje maximális valószínűségű filogeniája (16 gén transzkriptumaiból származtatva). WAG + I modell teljes delécióval. Alignment hossza 57 hely. Bootstrap-replikációk 100. Középpontos gyökeresedés. (b) A Drosomycin fehérjék maximális valószínűségű filogeniája. Dayhoff + G modell teljes delécióval. Igazítás hossza 66 hely. Bootstrap-replikátumok 100. Középpontos gyökeresedés. Az 50-nél kisebb Bootstrap-értékek rejtve vannak.

A 16 defensin gén transzkripciós szintjeinek összehasonlítását BLASTN stratégiával becsültük meg, amely BLASTN-keresésen alapul az egyes CDS-ek 41-190-es nukleotidjain. Minden 150 nt-os szekvencia legalább egy nukleotidban különbözött, kivéve a defensin_g3 és g5 géneket, amelyek azonosak voltak, és a transzkripciós szintet nem lehetett konkrét génhez rendelni (3. kiegészítő táblázat). A TRINITY által becsült TPM-értékek és az ezzel a BLAST-stratégiával becsült transzkripciós szintek alapján megfigyeltük, hogy ebben a nőstény adult futásban a defensin_g15 és g16 (defensinszerű fehérjéket kódoló), g9 és g10 (formicint kódoló) és g1, g2, g3 és g5 (Tenecin-1 fehérjéket kódoló) defensin gének a legnagyobb mértékben kifejeződő gének (3. kiegészítő táblázat).

A TBLASTN stratégiát alkalmazva a Blattodea26 rendet lefedő 45 fajban kerestük a defenzinek transzkriptumait (4. kiegészítő táblázat). Negyvennégy faj tartalmaz defensin-transzkriptumokat (1 és 9 között).

Termicin AMP gének

A genomban három, a PF11415 Pfam-doménnel rendelkező kis fehérjéket kódoló gén van annotálva (1. kiegészítő táblázat). Az SRR6784710 transzkript-adatbázissal végzett BLASTN-keresés csak két nagyon hasonló transzkriptre adott találatot. Az első transzkript, a TRINITY_DN10017_c0_g1_i1 egyetlen eltérést mutatott a C0J52_00758 vagy a C0J52_26761 génnel a CDS-szekvenciában, de több eltérést a fennmaradó mRNS-szekvenciában, ami két független génre utal a genomban. A második transzkript, a TRINITY_DN10017_c0_g2_i1 100%-ban megegyezett a C0J52_26762 CDS-ével és mRNS-ével, ami egy harmadik termicin génre utal. A három kódolt fehérje szinte teljesen megegyezik, egyetlen S/A különbséggel a 13. helyen (1. kiegészítő ábra). Az 1. és 19. aminosav között egy jelző hidrofób peptidet, a 30. és 63. aminosav között pedig a Toxin_37 domént (PF11415) jelzik (1. ábra). A TRINITY által becsült TPM-értékek és a BLASTN által becsült transzkripciós szintek alapján (a termicin CDS négy polimorf helyét lefedő 150 bp hosszúságú szegmens) arra következtethetünk, hogy a termicin_g3 (C0J52_26762) a legjobban expresszálódó termicin gén (5. kiegészítő táblázat).

A különböző rendszertani családokhoz tartozó 29 Blattodea fajban mutattunk ki termicin mRNS-t (4. kiegészítő táblázat). Hiányuk gyakori volt a Corydioidea fajokban, ami az ilyen típusú gének esetleges elvesztésére utal, bár az expresszió hiánya ezekben a mintákban nem zárható ki.

Drosomycin AMP gének

A B. germanica genom három scaffoldjában tíz gént annotáltak, amelyek gamma-thionin (PF00304) doménnel rendelkező fehérjéket kódolnak. Ezek a gombaellenes fehérjék a drosomicinek nevet kapták. Az annotált CDS-ek BLASTN keresése az SRR6784710 transzkript-adatbázissal szemben csak hat, a teljes CDS-t tartalmazó transzkriptet és két jelentéktelen, csak egy CDS-szegmenst lefedő transzkriptet azonosított.

Az annotált CDS és az ezekből a transzkriptumokból származó CDS-ek összehasonlítása azt mutatta, hogy csak három annotált gén (C0J52_03170, C0J52_03171 és C0J52_12810) volt egyenértékű három ilyen transzkriptummal (az előbbiek 2 nukleotid különbséggel). Ezeket drosomycin_g2, g3 és g5 néven annotáltuk (2. és 6. kiegészítő táblázat). A fennmaradó három transzkript közül az egyik, amely a drosomycin_g6-nak felel meg, néhány nukleotid különbséggel, egy nem annotált szegmensben volt elhelyezhető a genomban. Végül a másik két transzkript szekvenciája nem volt kimutatható a genomban, bár CDS-szekvenciájuk nagymértékben hasonlított a C0J52_03170-hez (6 és 8 nukleotid különbséggel). Ezek a különbségek arra utalnak, hogy ezek nem allélek, hanem független gének, ezért drosomycin_g1 és g4 néven annotáltuk őket (2. és 6. kiegészítő táblázat).

Másrészt hat, locus_taggal annotált gént, a C0J52_12811-13 és a C0J52_23105-08 gént nem detektáltuk a felnőtt nőstény transzkriptomjában, de úgy tűnik, hogy más fejlődési szakaszokban kifejeződnek. Ezeket drosomycin_g7-től g13-ig annotálták.

A 13 drosomycin-fehérje filogeniája azt mutatta, hogy a defensin_g6 a legtávolabbi gén, míg a többi 12 gén két, egyenként hat génből álló klasztert alkotott. A kifejlett nőstényekben expresszálódó drosomicin_g1-g5 gének, valamint a nem expresszálódó drosomicin_g9 gének alkották az egyik jól alátámasztott kládot, míg a másik hat nem expresszálódó gén a másikat (2b. ábra).

A transzkripciós szint becslése azt mutatta, hogy a drosomycin_g5 (C0J52_12810) volt a legnagyobb expresszióval rendelkező gén, az erre a szegmensre vonatkozó drosomycin olvasatok 86,1%-a tőle származott (6. kiegészítő táblázat).

A 13 kódolt fehérje közül tizenkettő 66 aminosav hosszú volt. A drosomicin_g6 71 aminosav hosszú volt, mivel a fehérje közepén két indelből származó további aminosavak voltak jelen (az igazítás 25-26. és 36-38. helye). A megfigyelt maradékok közül a kódolt fehérjékben a nyolc konzervált cisztein27 jelenléte a legfigyelemreméltóbb (1. kiegészítő ábra). Valamennyi drosomicin N-terminálisán egy jelző hidrofób peptid, C-terminálisán pedig a PF00304 domén (gamma-thionin) található (1. ábra).

A drosomicin mRNS-eket 24 Blattodea fajban mutatták ki, de az Isoptera fajokból és közeli rokonukból, a Cryptocercus wrighti fajból hiányoztak (4. kiegészítő táblázat). Ugyanezt a tényt észlelték a Corydioidea kládban is, ami arra utal, hogy a termeszek és más Blattodea-félék elveszíthették ezt a fajta AMP-gént.

Attacin AMP-gének: attacinszerű és blattellicinek

A PYGN01001824 kontigban elhelyezett C0J52_26498 génen átívelő 47 kb-os régióban négy, az Attacin_C doménnel (PF03769) némi hasonlóságot mutató régiót észleltek. Az összeállított transzkriptom előzetes elemzését követően több mint tíz mRNS-szekvenciát azonosítottak. Ezek kétféle attacin-génhez tartozó mRNS teljes vagy részleges szekvenciáihoz hasonlítanak. Az első típusba tipikus Attacin-fehérjéket (kb. 120 aminosav) kódoló gének tartoznak, amelyek N-terminálisán szignálpeptid, C-terminálisán pedig az Attacin_C domén található, és amelyeket attacin-szerű géneknek neveztünk el. A második típus nagyon eltérő volt, mivel tartalmazott egy hosszú szakasznyi glutamin/glutaminsav-maradékot. Mivel ezek nyilvánvaló evolúciós újításnak tűntek a B. germanica-ban, blattellicineknek neveztük el őket.

A transzkriptomban három attacin-szerű transzkriptumot detektáltunk (2. és 7. kiegészítő táblázat). Ezek 357-360 nukleotidból álló kódoló szekvenciákat tartalmaztak (118-119 kódolt aminosav). Az attacin-like_g1-től az attacin-like_g3-ig kapták a neveket. Az ezen mRNS-ek leolvasásainak kivonása és összeszerelése megerősítette létezésüket, de egy negyedik gén lehetőségét is felvetette. Az attacin-like_g3A és az attacin-like_g3B csak két eltérést mutat, az attacin_g3B 5′UTR-ében egy 9 nukleotidból álló szakasz törlését és egy szinonim eltérést a 288-as CDS-pozícióban (a két eltérés helyeinek egy leolvasásban való szerepeltetése nagyon ritka volt, figyelembe véve, hogy egy leolvasás hossza 301 nukleotid). Mivel csak két különbség volt, és ezek nem voltak elhelyezve a genomban, úgy tekintettük, hogy ugyanannak a génnek az alléljairól van szó.

Az attacin-like_g1 CDS viszonylag hasonló volt az attacin-like_g3 CDS-hez, 9-10 különbséggel. Azonban kellően különbözőek voltak ahhoz, hogy független lókuszoknak tekintsük őket. Az attacin-like_g2 volt a leginkább eltérő gén 85-88 különbséggel és egy extra kodonnal a többivel szemben. A genomban csak az attacin-like_g1 és g2 szekvenciái voltak megtalálhatóak (2. és 7. kiegészítő táblázat).

A blattellicinek annotációja sokkal bonyolultabb volt. Az előzetes elemzés után egy hosszú CDS-t (> 250 kodon) figyeltünk meg, amely furcsa szerkezetű. Az N-terminálison a hidrofób szignálpeptiddel kezdődött, amelyet középen egy hosszú, Glx-ben gazdag szegmens (> 70 maradék, főként glutaminok és glutaminsavak) és egy C-terminális Attacin-domén követett (1. ábra).

Egyszerre 13 mRNS-átiratot (mindegyik hiányos CDS-szegmenseket tartalmazott) detektáltak, amelyekben ilyen típusú szekvenciák voltak. Ennek fő oka az volt, hogy több blattellicin gén jelenléte és a hosszú Glx-gazdag régiók drasztikusan befolyásolták a transzkriptom összeállítását. Ez a tény valószínűleg a B. germanica genom összeállítása és annotálása során következett be5,6.

A blattellicin CDS 5′ szekvenciáját használtuk lekérdezésként, hogy BLASTN segítségével azonosítsuk azokat az olvasatokat, amelyek a blattellicin gének expressziójából származnak az SRR6784710 futásban. Az extrakció és az összeszerelés után a blattellicin gének négy különböző kezdetét tártuk fel, 7 és 18 nukleotidpáros különbséggel az mRNS-ek 5′-ében. Ezt a négy mRNS-kezdetet használtuk a fennmaradó génszekvenciák toborzására a CDS kiegészítéséig.

A blattellicin_g1 CDS-szekvenciájának nagy része azonosítható volt a genomban, bár körülbelül 200 bp hiányzott két összeszerelési hiányosság miatt (2. és 7. kiegészítő táblázat). A többi blattellicin_g2 és g4 esetében csak az első kódoló exont lehetett egyértelműen egy adott kontig szegmenshez rendelni, bár a CDS más szegmenseire is találtak találatokat, de 100%-os azonosság nélkül. A blattellicin_g3 első exonjával azonos szekvenciát nem sikerült azonosítani a genomban. A legvalószínűbb magyarázat az, hogy a négy blattellicin gén tandemkópiákban van jelen a genomban, de különleges központi ismétlődő szerkezetük megakadályozza a helyes összerendelést akár a genomban, akár a transzkriptomban, kivéve, ha az illesztések kézi ellenőrzését végezzük. Továbbá nem zárható ki a Glx kodonok kópiaszámának eltérése a populációban.

Megállapítottuk, hogy a blattellicinek magasabb szinten fejeződtek ki, mint az attacin-szerű gének, a blattellicin_g4 volt a legnagyobb mértékben kifejezett ebben a transzkriptomban (7. kiegészítő táblázat).

A B. három attacin-szerű és a négy Blattellicin-fehérje fehérje összehangolásának logói. germanica fehérjéinél egy kis szegmens negatív töltésű aminosavakat mutatott ki az Attacin-szerű fehérjékben és egy hosszú szegmenst a Blattellicinekben (3. ábra).

3. ábra
3. ábra

A B. germanica Attacin-szerű és Blattellicin fehérjéinek illesztési logói és aminosavösszetétele. (a) Három Attacin-szerű fehérje igazításának logója. (b) Négy Blattellicin összehangolásának logója. (c) Az Attacin-szerű és a Blattellicin-fehérjék átlagos aminosavösszetétele (%).

A legtöbb Blattodea fajban kimutatták az Attacin mRNS-eket (4. kiegészítő táblázat). A blattellicinekre vonatkozó találatok nem fedték le a Glx régiót, hanem csak az attacin_C domént. Az attacin-szerű és blattellicin gének evolúciós történetének megértéséhez a B. germanica-ban, kivontuk az attacin transzkriptumokat hét Blattellinae TSA projektből26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Ezek a transzkriptomok kifejlett egész testekből származnak, kivéve az I. deropeltiformis-t (a fejlődési stádiumra vonatkozó információ nélkül). Potenciálisan minden egyes genom esetében lefedhetik az összes attacins gént, bár nem zárható ki az expresszió nélküli gének lehetősége sem. A legtöbb attacin gén az E. sundaica-ban volt három. Két gént figyeltek meg a L. decipiens, Symploce sp. AD-2014 és az A. kyotensis esetében, bár az előbbiben az egyik kópia hiányos és nagyon eltérő volt, valószínűleg egy pszeudogén, míg az utóbbiban a két kópia néhány kodonnal hiányos volt a CDS 5′-végén. Az SRA-projektben a CDS kezdetét lefedő leolvasásokat vizsgálták, és a visszanyert leolvasások alapján az egyik teljes volt, a másikban pedig csak négy kodon hiányzott. A megmaradt faj egyetlen génmásolatot tartalmazott. Ezen kívül, hogy outgroupként használhassuk, a P. americana-ban észlelt egyetlenegyet is kivontuk.

A filogenezist egy trimmelt igazítással (103 hely) végeztük el (4. ábra). A szekvenciaillesztés rövid hossza a legtöbb csomópontban megakadályozta a magas bootstrap-értékek elérését, és akadályozta e géncsalád evolúciós történetének teljes bizonyossággal történő meghatározását. A filogeniából azonban több tény is megfigyelhető. Először is, az attacin-szerű gének az ősi géntípus. Néhány Blattellinae faj csak egy vagy két gént tartalmaz. A B. germanica, E. sundaica, L. decipiens és Symploce sp. klád esetében a B. germanica, E. sundaica, L. decipiens és Symploce sp. AD-2014 kládjában egy ősi attacin-szerű gén duplikációja még az eltérésük előtt megtörtént, ami az attacin-szerű_g1 és g2 típusok megjelenését eredményezte. Bár a L. decipiens attacin-like_g1 nem szerepelt a filogeniában, egy ilyen típusú transzkriptum (GDYK01026461.1) hiányos és divergens példánya kimutatható, amely valószínűleg egy pszeudogenizált példányból származik.

4. ábra
4. ábra

Attacin-like és Blattellicin fehérjék filogeniája a Blattellinae-ben. (a) Az Attacin_C domént tartalmazó fehérjék Maximum Likelihood filogeniája a Blattellinae alcsaládban. LG + G modell teljes delécióval. Az illesztést úgy vágtuk le, hogy az N-terminális szignálpeptidet és a C-terminális attacin_C domént (hossza 103 hely) összekapcsolja. A P. americana-t használtuk outgroupként. Bootstrap-replikációk száma 100. Az 50-nél kisebb Bootstrap-értékek el vannak rejtve. Minden fajnév rövidítve van (lásd a kódokat a jobb oldali topológiában), kivéve a Symploce sp. A rövidítés nélküliek a B. germanica fehérjéi. (b) Taxonómiai kapcsolatok a26 szerint.

A blattellicinek eredete nagyon frissnek tűnik. Bár szignifikáns bootstrap-értékkel nem támasztják alá, potenciálisan egy ősi attacin-szerű_g2 típusú gén duplikálódott, és az egyik másolat gyors evolúciót követően hozta létre a blattellicineket. A duplikációra az E. sundaica és a B. germanica divergenciája előtt került sor. Az előbbi fehérje nyilvánvalóan egy pre-Blattellicin, amely tartalmazza a Blattellicinek néhány új jellemzőjét, mint például a nagy méret (182 maradék) és néhány extra aminosav a C-terminuson (RK a B. germanica-ban és GKGK az E. sundaica-ban). A Blattellicinek fő jellemzője, a hosszú poli-Glx régió azonban hiányzik, bár az E. sundaica pre-Blattellicin tartalmaz egy hét glutaminsavból álló sávot (A-val a közepén) az attacin domén kezdetéhez közel.

AMP expresszió a B. germanica

Az AMP gének B. germanica szövetekben, fejlődési stádiumokban vagy nemekben való expressziójának meghatározásához 17 AMP géntípus CDS-ét választottuk ki (defensin_g2, g3, g7, g9, g11, g13 és g15; termicin_g1; drosomycin_g1, g5, g6, g11 és g12; attacin-like_g1 és g2; blattellicin_g1 és g4). Ezek kellőképpen különböznek egymástól ahhoz, hogy az azonos csoportból kiválasztott szerek között ne legyenek jelentős keresztezési eredmények. Az azonos családba tartozó egyes gének CDS-ének nagyfokú hasonlósága miatt azonban a kapott értékek a közel azonos szekvenciájú géncsoportok (például a három termicin gén vagy az attacin-like_g1 és g3) expresszióját mutatták.

A BLASTN stratégiával az expressziós szinteket a találatok számaként becsültük meg/Gb SR kísérletben (8. kiegészítő táblázat). A különböző fejlődési szakaszokból származó mintáknak megfelelő 28 teljes test SR-kísérlet heatmap-elemzése (5. ábra) több következtetést is feltárt. Először is, a kifejlett nőstények a legtöbb AMP gén magas expresszióját mutatták, bár a legjelentősebb a blattellicin_g1 és a g4 legmagasabb expressziója volt. Néhány drozomicin is magasan kifejeződött, különösen a drozomicin_g5. Egyes gének kifejeződése a fejlődéssel függött össze (lásd például a drosomicin g11 és g12 kifejeződésének hiányát a kifejlett nőstényekben, de magas kifejeződését a nimfákban). A defenzinek közül a legtöbb fejlődési szakaszban a defensin_g9 és a g15 fejeződött ki a legnagyobb mértékben. A defensin g2 és g3 kifejeződése magasabb volt a kifejlett nőstényekben, mint a nimfákban. A termicin_g1 alacsony expressziót mutatott a nimfákban és a felnőttekben. Az attacin-szerű gének szintén kifejeződtek a kifejlett nőstényekben, az attacin-szerű_g1 értékei magasabbak voltak, mint az attacin-szerű_g2-é, ami összhangban volt a korábban leírt eredményekkel (7. kiegészítő táblázat), figyelembe véve azt is, hogy az attacin-szerű_g1 kimutatott találatai valószínűleg a g1 és g3 génekből származnak.

5. ábra
5. ábra

17 AMP gén kifejeződése a B. germanica egész testében. A 17 kiválasztott AMP gén transzkriptumainak gyakoriságát szemléltető hőtérkép-elemzés 28 szekvenciaolvasási kísérletben, amelyek a B. germanica különböző fejlődési stádiumaiból származó egész testeknek felelnek meg, néhány esetben a minta nemének feltüntetésével. Az értékeket az 1,0E-40-nél kisebb e-értékkel rendelkező találatot eredményező olvasatok számának (a teljes CDS-szekvenciákat a BLASTN-keresés során lekérdezésként használva) és az SR-kísérlet Gb-ban kifejezett méretének hányadosaként becsültük.

Az AMP-gének kifejeződése általában a fejlődés előrehaladtával a kifejlett formák felé haladva növekszik. Sajnos az SRA-adatbázisban nem került letétbe kizárólag kifejlett hímekre vonatkozó SR-kísérlet, bár néhány vegyes hím és nőstény mintáról beszámoltunk (8. kiegészítő táblázat).

Ezeknek a 17 AMP-génnek az expresszióját elemeztük néhány olyan transzkriptomikai SR-kísérletben is, amelyekben a minták egyetlen szövetből, a test egy részéből vagy több szövet keverékéből származnak (8. kiegészítő táblázat). Általában úgy tűnik, hogy a drosomycin_g5 és a defensin_g9 a legtöbb ilyen mintában kifejeződik. A hím felnőtt fejből származó két kísérletben több AMP-gén is releváns szinten kifejeződött, köztük a defensin_g7 és g9, a drosomycin_g5 és az attacin-like_g2. Általánosságban elmondható, hogy ezekben a mintákban az expresszió szintje sokkal kisebb, mint a teljes testből származó mintáké. Ez arra enged következtetni, hogy a zsírtesttől, a petefészektől vagy a felhámtól eltérő más testrészek felelősek az egész testből származó felnőtt nőstényekben megfigyelt magas expressziós szintekért (5. ábra).

A blattellicin_g1 és a blattellicin_g4 expresszióját egyetlen szövetben vagy testrész-mintában sem figyeltük meg, kivéve egy nem termékenyített petesejt-mintában megfigyelhető, szinte kimutathatatlan expressziót, ami valószínűleg a nőstény szövetekkel való szennyeződésnek köszönhető.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.