Gene care codifică proteine cu domenii AMP în genomul lui B. germanica

Pentru a identifica genele notate cu funcții AMP în genomul lui B. germanica6 au fost utilizate două strategii. Prima a fost căutarea de denumiri de produse care să includă termenii defense, drosomycin, tenecin, phormicin, attacin și coleoptericin. A doua a fost căutarea domeniilor Pfam adnotate legate de peptidele antimicrobiene. Acestea sunt incluse în trei domenii de clan din baza de date Pfam: Knottin_1 (CL0054, superfamilia knottin asemănătoare cu toxina scorpionului), Defensin (CL0075, superfamilia Defensin/miotoxină asemănătoare) și Omega_toxin (CL0083, Omega toxină asemănătoare). Cele cinci domenii Pfam detectate au fost: PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-thionin) și PF11415 (Toxin_37). După eliminarea C0J52_07645 (proteina Giant-lens) și C0J52_08617 (proteina de apărare putativă 3), deoarece acestea nu codifică AMP-uri, s-au păstrat 24 de gene codificatoare (tabelul suplimentar 1). Acestea au fost clasificate inițial în următoarele grupe: (i) Proteinele Defensin_2 (denumită în continuare Defensin) (10 CDS, inclusiv două cu adnotarea parțială = 5′), (ii) Drosomicina (domeniul Gamma-thionin) (10 CDS), (iii) Termicina (domeniul Toxin_37) (3 CDS) și (iv) CDS C0J52_26498. Aceasta din urmă, adnotată ca proteină ipotetică, a fost o proteină lungă (541 de aminoacizi) cu un domeniu Attacin_C. Cu toate acestea, o analiză mai puțin riguroasă a domeniilor a arătat prezența potențială a două sau trei domenii suplimentare în această proteină cu asemănări cu Attacin_C și Coleoptericina (PF06286).

Tabelul 1 Genele care codifică proteine cu domenii peptidice antimicrobiene în B. germanica.

Pentru a revizui genele codificatoare de AMP adnotate, mai multe experimente RNA-Seq SRA din B. germanica (PRJNA389591) au fost analizate pentru expresia acestora folosind BLASTN și mai multe CDS AMP ca interogări. Dintre experimentele SRA cu abundență de citiri AMP, a fost selectat experimentul RNA-Seq SRR6784710 (corp întreg, femelă adultă). Rulația SRR6784710 a fost asamblată cu de novo Trinity25 și a fost creată o bază de date de transcrieri.

Genomul adnotat a fost comparat cu baza de date de transcrieri cu scopul de a identifica seturile complete de gene AMP pentru fiecare clasă. După o revizuire atentă, am identificat 39 de gene AMP (aparținând la cinci tipuri: defensine, termicine, drosomicine, atașine-like și blattelicine), care vor fi descrise mai jos. Treizeci și patru dintre acestea au fost distribuite în zece schele de genom, iar cinci gene nu au fost plasate (tabelul 1; tabelul suplimentar 2).

Gene AMP defensine

Dece CDS AMP adnotate cu un domeniu Defensin au fost utilizate ca interogări față de baza de date de transcripte SRR6784710 cu BLASTN (e-valoare = 1,0E-20). Toate acestea au produs rezultate cu cel puțin un transcript. În total, au fost identificate 16 transcripte diferite. Abundența transcriptelor a variat de la valori TPM (transcripte pe milion de transcripte) de 323,64-0,00.

Informațiile privind adnotarea genomului și transcriptele asamblate au fost comparate (a se vedea Materiale & Metode) identificând 16 gene de defensină (Tabelele suplimentare 2 și 3). Acestea au primit denumirile de defensin_g1 până la defensin_g16, defensin_g1 și defensin_g16 incluzând două izoforme alternative care nu afectează regiunea de codificare. Izoformele defensin_g1 i1 și i2 diferă prin eliminarea sau nu a unui intron 3′-UTR, în timp ce cele două izoforme ale defensin_g16 diferă prin utilizarea unor semnale poli(A) diferite.

Genele defensin (cu excepția defensin_g1 care nu a fost plasată) au fost grupate în patru schele. Defensin_g1 neplasată a fost inclusă deoarece programul a identificat trei transcripte aparținând clusterului TRINITY_DN1123_c0. Unul dintre ei (corespunzător defensin_g2) ar putea fi înrudit cu gena C0J52_24001 (care codifică o proteină ipotetică), deși am recuperat cadrul de citire corect după plasarea corectă a începutului celui de-al doilea exon. Celelalte două transcripte au prezentat o identitate de 100 %, dar diferă în ceea ce privește splicarea alternativă a unui intron 3′-UTR de 453 nt. Le-am considerat izoforme ale defensin_g1, o genă diferită de defensin_g2, deoarece acestea diferă prin șapte nucleotide (două în CDS) plus trei indeli de dimensiuni diferite în 3′-UTR. Cu toate acestea, o astfel de secvență nu a fost detectată în nicio secvență scaffold.

Transcrisul foarte exprimat (TRINITY_DN13842_c0_g1_i1) a fost aparent derivat din asamblarea incorectă de către TRINITY a citirilor a patru loci diferiți din genom cu secvențe aproape identice (defensin_g3 până la g6). Trei dintre acestea au fost adnotate anterior cu calificativele locus_tag C0J52_27569, C0J52_22338 și C0J52_24004. Cu toate acestea, C0J52_27569 (gena = DEFI_4 în scheletul PYGN01003429) a fost un tandem de două gene (defensin_g3 și defensin_g4). Un decalaj de asamblare care se suprapune cu defensin_g3 este probabil motivul care explică de ce un singur ARNm care extinde ambele gene a fost notat în genom.

Genele defensin_g7 și defensin_g8 au prezentat secvențe CDS identice, dar cu mai multe diferențe în segmentele UTR ale secvențelor ARNm. Acestea au fost plasate în schelele PYGN01002380 și, respectiv, PYGN01001185. Doar una dintre ele, defensin_g8, a fost adnotată anterior ca fiind gena C0J52_22336.

Defensin_g9 corespunde genei C0J52_24005 care codifică Phormicina, o proteină de 91 aminoacizi. Analiza transcripției a arătat că proteina codificată este mai scurtă (71 de aminoacizi), cu o secvență peptidică semnal de 20 de aminoacizi la amino-terminalul său (a se vedea mai jos). Defensin_g10 a fost, de asemenea, o Phormicină localizată într-o schemă diferită, dar numai al doilea exon a fost prezent în genom, primul exon fiind cel mai probabil plasat într-un decalaj de asamblare contiguă de 1 kb.

Defensin_g11, g12 și g13 sunt echivalente cu genele adnotate anterior (tabelele suplimentare 2 și 3). Defensin_g14 este prezentă în scheletul PYGN0100111185, dar cea mai mare parte a secvenței celui de-al doilea exon este absentă din cauza unui decalaj de asamblare. Secvențele CDS ale defensin_g15 și C0J52_20459 au fost identice, dar analiza transcripției defensin_g15 a sugerat un ARNm cu doi exoni în loc de C0J52_20459 cu trei exoni.

Toate Defensinele au prezentat peptide semnal de 18 până la 22 de aminoacizi la N-terminal și domeniul PF01097 (Defensin_2) la C-terminal (a se vedea exemple de organizare a domeniilor la Fig. 1). Lungimea lanțului de aminoacizi a variat de la 63 la 81 de reziduuri, cu o medie de 72 de aminoacizi. Deși unele proteine Defensin au fost identice, numărul mediu de diferențe pe perechi a fost ridicat (29 de aminoacizi). O filogenie de maximă verosimilitate dedusă a arătat distribuția lor în șapte clustere (Fig. 2a). Un logo al alinierii proteice a proteinelor Defensin arată secvența hidrofobă N-terminală, precum și domeniul Defensin_2 (C-terminal) cu cele șase reziduuri de cisteină conservate (Fig. Suplimentară 1).

Figura 1
figura1

Organizarea domeniilor în cele cinci tipuri de AMP-uri de B. germanica. Este prezentată câte o proteină din fiecare clasă. Pătratele portocalii sunt peptide de semnal. Ovalul roșu corespunde unei regiuni bogate în glutamină/acid glutamic. Ovalurile verzi corespund domeniilor Pfam-A PF03769 (Attacin_C). Ovalurile albastre (de sus în jos) sunt domeniile Pfam-A PF01097 (Defensin_2), PF11415 (Toxin_37) și, respectiv, PF00304 (Gamma-thionin).

Figura 2
figura2

Filogeniile proteinelor Defensin și Drosomycin din B. germanica. (a) Filogenia de maximă verosimilitate a 18 proteine Defensin (derivate din transcrierile a 16 gene). Modelul WAG + I cu deleție completă. Lungimea alinierii 57 de situri. Repetiții bootstrap 100. Înrădăcinare în punctul median. (b) Filogenia de maximă verosimilitudine a proteinelor Drosomycin. Modelul Dayhoff + G cu ștergere completă. Lungimea alinierii 66 de situri. Repetiții Bootstrap 100. Înrădăcinare în punctul median. Valorile Bootstrap mai mici de 50 sunt ascunse.

O comparație între nivelurile de transcripție ale celor 16 gene de defensină a fost estimată folosind o strategie BLASTN bazată pe căutări BLASTN cu nucleotidele 41-190 din fiecare CDS. Toate secvențele de 150 nt au fost diferite în, cel puțin, un nucleotid, cu excepția defensin_g3 și g5 care au fost identice și nivelul de transcriere nu a putut fi atribuit unei gene specifice (tabelul suplimentar 3). Pe baza valorilor TPM estimate de TRINITY și a nivelurilor de transcripție estimate prin această strategie BLAST, am observat că, în această rasă adultă femelă, defensin_g15 și g16 (care codifică proteinele asemănătoare Defensin), g9 și g10 (care codifică Phormicin) și g1, g2, g3 și g5 (care codifică proteinele Tenecin-1) sunt genele de defensină cele mai puternic exprimate (tabelul suplimentar 3).

Utilizând o strategie TBLASTN, au fost căutate transcripțiile defensinelor în 45 de specii care acoperă ordinul Blattodea26 (Tabelul suplimentar 4). Patruzeci și patru de specii conțin transcripții de defensine (intervalul 1-9).

Gene AMP de termicină

Trei gene care codifică proteine mici cu domeniul Pfam PF11415 sunt adnotate în genom (tabelul suplimentar 1). Căutările BLASTN în baza de date de transcripte SRR6784710 au dat rezultate cu doar două transcripte foarte asemănătoare. Primul transcript, TRINITY_DN10017_c0_g1_i1, a prezentat o singură diferență fie cu C0J52_00758, fie cu C0J52_26761 la nivelul secvenței CDS, dar mai multe la nivelul secvenței ARNm rămase, sugerând două gene independente în genom. Al doilea transcript, TRINITY_DN10017_c0_g2_i1, a fost 100% identic atât cu CDS, cât și cu ARNm din C0J52_26762, indicând o a treia genă de termicină. Cele trei proteine codificate sunt aproape identice, cu o singură diferență S/A la locul 13 (Fig. Suplimentară 1). O peptidă hidrofobă de semnal este prezisă între aminoacizii 1 și 19, iar domeniul Toxin_37 (PF11415) între aminoacizii 30 și 63 (Fig. 1). Pe baza valorilor TPM estimate de TRINITY și a nivelurilor de transcripție estimate de BLASTN (un segment de 150-bp care acoperă patru situri polimorfe din CDS-ul termicinei), putem concluziona că termicin_g3 (C0J52_26762) este cea mai puternic exprimată genă a termicinei (tabelul suplimentar 5).

ARNm de termicină au fost detectate în 29 de specii de Blattodea aparținând diferitelor familii taxonomice (tabelul suplimentar 4). Absența lor a fost frecventă la speciile din Corydioidea, sugerând o potențială pierdere a acestui tip de genă, deși lipsa de expresie în aceste eșantioane nu poate fi exclusă.

Gene AMP de drosomicină

Două gene care codifică proteine cu domeniul Gamma-thionină (PF00304) sunt adnotate în trei schele din genomul B. germanica. Aceste proteine antifungice primesc denumirea de Drosomicine. Căutările BLASTN ale CDS adnotate în raport cu baza de date de transcripții SRR6784710 au identificat doar șase transcripții care includ CDS-ul complet și două transcripții nesemnificative care acoperă doar un segment de CDS.

Compararea CDS adnotate și a celor derivate din aceste transcripte a arătat că doar trei gene adnotate (C0J52_03170, C0J52_03171 și C0J52_12810) erau echivalente cu trei dintre aceste transcripte (primele cu 2 nucleotide diferențe). Acestea au fost adnotate ca drosomicină_g2, g3 și g5 (tabelele suplimentare 2 și 6). Unul dintre cei trei transcripți rămași, corespunzător drosomicinei_g6, a putut fi plasat în genom, cu câteva diferențe de nucleotide, într-un segment neanunțat. În cele din urmă, secvențele celorlalte două transcripte nu au fost detectate în genom, deși secvențele CDS ale acestora erau foarte asemănătoare cu C0J52_03170 (cu diferențe de 6 și 8 nucleotide). Aceste diferențe sugerează că nu sunt alele, ci gene independente și le-am notat ca fiind drosomicină_g1 și g4 (tabelele suplimentare 2 și 6).

Pe de altă parte, șase gene notate cu locus_tags, C0J52_12811-13 și C0J52_23105-08 nu au fost detectate în transcriptomul femelei adulte, dar se pare că acestea sunt exprimate în alte stadii de dezvoltare. Acestea au fost notate ca fiind drosomicina_g7 până la g13.

O filogenie a celor 13 proteine Drosomycin a arătat că defensin_g6 a fost cea mai îndepărtată genă, în timp ce celelalte 12 gene au format două grupuri de câte șase gene fiecare. Genele drosomycin_g1 până la g5, exprimate la femelele adulte, plus drosomycin_g9 neexprimată au format o cladă bine susținută, în timp ce celelalte șase gene neexprimate au format cealaltă cladă (Fig. 2b).

O estimare a nivelului de transcripție a arătat că drosomycin_g5 (C0J52_12810) a fost gena cu cea mai mare expresie, 86,1 % din citirile de drosomicină pentru acest segment derivând de la aceasta (tabelul suplimentar 6).

Douăsprezece din cele 13 proteine codificate aveau o lungime de 66 de aminoacizi. Drosomycin_g6 avea o lungime de 71 de aminoacizi datorită prezenței în mijlocul proteinei a unor aminoacizi suplimentari derivați din două indels (siturile 25-26 și 36-38 din aliniere). Dintre reziduurile observate, cea mai remarcabilă caracteristică a proteinelor codificate este prezența a opt cisteine conservate27 (Fig. suplimentară 1). Toate Drosomicinele prezintă o peptidă hidrofobă de semnal la extremitatea N-terminală și domeniul PF00304 (Gamma-thionină) la extremitatea C-terminală (Fig. 1).

ARNm de Drosomicină au fost detectate la 24 de specii de Blattodea, dar au fost absente la speciile de Isoptera și la ruda lor apropiată Cryptocercus wrighti (Tabelul suplimentar 4). Același fapt a fost detectat și în clada Corydioidea, ceea ce sugerează că termitele și alte Blattodea ar fi putut pierde acest tip de genă AMP.

Gene AMP de attacină: atacin-like și blattellicine

Până la patru regiuni cu o anumită similitudine cu domeniul Attacin_C (PF03769) au fost detectate în regiunea de 47-kb care cuprinde gena C0J52_26498 plasată în contig PYGN01001824. După o analiză preliminară a transcriptomului asamblat, au fost identificate mai mult de zece secvențe de ARNm. Acestea seamănă cu secvențe complete sau parțiale de ARNm aparținând la două tipuri de gene de atașină. Primul tip include genele care codifică proteine Attacin tipice (aproximativ 120 de aminoacizi) cu o peptidă semnal la extremitatea N-terminală și domeniul Attacin_C la extremitatea C-terminală, care au fost denumite gene Attacin-like. Al doilea tip era foarte diferit, deoarece includea o porțiune lungă de reziduuri de glutamină/acid glutamic. Deoarece păreau o aparentă inovație evolutivă la B. germanica, le-am numit blattellicine.

În transcriptom au fost detectate trei transcripte asemănătoare atașinei (tabelele suplimentare 2 și 7). Acestea conțineau secvențe codificatoare de 357-360 nucleotide (118-119 aminoacizi codificați). Aceștia au primit numele de attacin-like_g1 până la attacin-like_g3. Extragerea și asamblarea citirilor pentru aceste ARNm au confirmat existența lor, dar au sugerat posibilitatea existenței unei a patra gene. Attacin-like_g3A și attacin-like_g3B prezintă doar două diferențe, ștergerea unui segment de 9 nucleotide în 5′UTR al attacin_g3B și o diferență sinonimă la poziția CDS 288 (includerea site-urilor pentru cele două diferențe într-o citire a fost foarte puțin frecventă, având în vedere că lungimea unei citiri este de 301 nucleotide). Deoarece au existat doar două diferențe și nu au fost plasate în genom, am considerat că sunt alele ale aceleiași gene.

Attacin-like_g1 CDS a fost relativ asemănătoare cu attacin-like_g3 CDS cu 9-10 diferențe. Cu toate acestea, ele erau suficient de diferite pentru a fi considerate loci independenți. Attacin-like_g2 a fost cea mai divergentă genă cu 85-88 de diferențe și un codon în plus față de celelalte. Doar secvențele attacin-like_g1 și g2 au fost localizate în genom (tabelele suplimentare 2 și 7).

Anotarea blattelicinelor a fost mult mai complicată. După o analiză preliminară, a fost observată o CDS lungă (> 250 codoni) cu o structură curioasă. Aceasta începea cu peptida semnal hidrofobă la N-terminal, urmată de un segment lung bogat în Glx la mijloc (> 70 de reziduuri, în principal glutamine și acizi glutamici) și un domeniu Attacin C-terminal (Fig. 1).

Au fost detectate până la 13 transcripții de ARNm (toate conținând segmente CDS incomplete) care implică acest tip de secvențe. Principalele motive au fost că prezența mai multor gene de blattellicină și a regiunilor lungi bogate în Glx au afectat drastic asamblarea transcriptomului. Acest fapt a avut loc, probabil, în timpul asamblării și adnotării genomului B. germanica5,6.

Secvența 5′ a unei CDS de blattellicină a fost utilizată ca interogare pentru a identifica cu BLASTN acele lecturi derivate din expresia genelor de blattellicină în rulația SRR6784710. După extracție și asamblare, au fost evidențiate patru porniri diferite ale genelor de blattellicină, cu un interval de 7 până la 18 perechi de nucleotide în 5′ ale ARNm. Aceste patru porniri de ARNm au fost folosite pentru a recruta secvențele de gene rămase până la finalizarea CDS.

Principala secvență CDS pentru blattellicin_g1 a putut fi identificată în genom, deși aproximativ 200-bp au fost absenți din cauza a două lacune de asamblare (tabelele suplimentare 2 și 7). Pentru ceilalți, doar primul exon codificator al blattellicin_g2 și g4 a putut fi atribuit fără echivoc unui segment de contig specific, deși au fost detectate, de asemenea, rezultate pozitive pentru alte segmente de CDS, dar fără o identitate de 100 %. În genom nu a putut fi identificată nicio secvență identică cu primul exon al blattellicin_g3. Cea mai fezabilă explicație este că cele patru gene blattellicin sunt prezente în copii în tandem în genom, dar structura lor specială de repetiție centrală împiedică asamblări corecte în genom sau transcriptom, cu excepția cazului în care se efectuează o inspecție manuală a alinierilor. În plus, nu pot fi excluse variațiile în numărul de copii ale codonului Glx în populație.

Am detectat că blattellicinele au fost exprimate la un nivel mai ridicat decât genele asemănătoare atătării, blattellicina_g4 fiind cea mai puternic exprimată în acest transcriptom (tabelul suplimentar 7).

Logurile alinierilor proteice pentru cele trei proteine asemănătoare atătării și cele patru proteine blattellicine de la B. germanica au evidențiat un segment mic de aminoacizi încărcați negativ în proteinele Attacin-like și un segment lung în Blattellicine (Fig. 3).

Figura 3
figura3

Logosul alinierilor și compoziția aminoacizilor proteinelor Attacin-like și Blattellicin din B. germanica. (a) Logo-ul alinierii a trei proteine Attacin-like. (b) Logo-ul alinierii a patru Blattellicine. (c) Compoziția medie de aminoacizi (%) a proteinelor de tip Attacin și Blattellicin.

Actacin mRNAs au fost detectate în majoritatea speciilor de Blattodea (tabelul suplimentar 4). Rezultatele pentru blattelicine nu au acoperit regiunea Glx, ci doar domeniul attacin_C. Pentru a înțelege istoria evolutivă a genelor asemănătoare atașinei și blattellicinei la B. germanica, am extras transcriptele atașinei din șapte proiecte TSA din Blattellinae26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Acești transcriptomi provin din corpuri întregi de adulți, cu excepția I. deropeltiformis (fără informații despre stadiul de dezvoltare). Ele pot acoperi, potențial, toate genele attacins pentru fiecare genom, deși nu poate fi exclusă posibilitatea existenței unor gene fără expresie. Cel mai mare număr de gene de atașină a fost de trei la E. sundaica. Două gene au fost observate la L. decipiens, Symploce sp. AD-2014 și A. kyotensis, deși în primul caz una dintre copii era incompletă și foarte divergentă, probabil o pseudogena, în timp ce în cel de-al doilea, cele două copii erau incomplete cu câțiva codoni la capătul 5′ al CDS. Proiectul SRA a fost verificat pentru citirile care acoperă începutul CDS și, pe baza celor recuperate, una a fost completată și, în cealaltă, doar patru codoni au fost ratați. Specia rămasă conținea o singură copie a genei. În plus, pentru a fi folosită ca outgroup, a fost extrasă singura – una – detectată în P. americana.

A fost realizată o filogenie cu o aliniere tăiată (103 situri) (Fig. 4). Lungimea scurtă a alinierii secvenței a împiedicat valorile bootstrap ridicate în majoritatea nodurilor și a împiedicat determinarea cu încredere deplină a istoriei evolutive a acestei familii de gene. Cu toate acestea, se observă câteva fapte din filogenie. În primul rând, genele asemănătoare atașinei sunt tipul de gene ancestrale. Unele specii de Blattellinae conțin doar una sau două gene. În cazul cladei B. germanica, E. sundaica, L. decipiens și Symploce sp. AD-2014, duplicarea unei gene ancestrale asemănătoare atacinei a avut loc înainte de divergența lor, ceea ce a dus la apariția tipurilor Attacin-like_g1 și g2. Deși L. decipiens attacin-like_g1 nu a fost inclusă în filogenie, este detectată o copie incompletă și divergentă a unui transcript de acest tip (GDYK01026461.1), probabil derivată dintr-o copie pseudogenizată.

Figura 4
figura4

Filogenia proteinelor de tip attacină și blattellicină în Blattellinae. (a) Filogenia de maximă verosimilitate a proteinelor care conțin domeniul Attacin_C în subfamilia Blattellinae. Model LG + G cu deleție completă. Alinierea a fost tăiată pentru a uni peptida semnal N-terminală plus domeniul Attacin_C C-terminal (lungime 103 situri). P. americana a fost utilizată ca grup de referință. Repetiții bootstrap 100. Valorile bootstrap mai mici de 50 sunt ascunse. Toate numele speciilor sunt prescurtate (a se vedea codurile din topologia din dreapta), cu excepția Symploce sp. Cele fără abrevieri sunt proteine din B. germanica. (b) Relații taxonomice în conformitate cu26.

Originea blattelicinelor pare să fie foarte recentă. Deși nu este susținută de o valoare bootstrap semnificativă, este posibil ca o genă ancestrală de tip attacin-like_g2 să fi fost duplicată și una dintre copii, după o evoluție rapidă, să fi generat blattellicine. Duplicarea a avut loc înainte de divergența dintre E. sundaica și B. germanica. Proteina din prima este, aparent, o pre-Blattellicină, incluzând unele dintre noile caracteristici ale blattellicinelor, cum ar fi dimensiunea mare (182 de reziduuri) și câțiva aminoacizi în plus la extremitatea C-terminală (RK la B. germanica și GKGK la E. sundaica). Cu toate acestea, caracteristica principală a Blattellicinelor, regiunea lungă poliglx, este absentă, deși E. sundaica pre-Blattellicin include o pistă de șapte acizi glutamici (cu un A în mijloc) aproape de începutul domeniului atașinic.

Expresia AMP în B. germanica

Pentru a determina expresia genelor AMP în țesuturile, stadiile de dezvoltare sau sexele B. germanica, am selectat CDS a 17 tipuri de gene AMP (defensin_g2, g3, g7, g9, g11, g13 și g15; termicin_g1; drosomycin_g1, g5, g6, g11 și g12; attacin-like_g1 și g2; blattellicin_g1 și g4). Acestea sunt suficient de diferite pentru a evita rezultate încrucișate importante între cele selectate din același grup. Cu toate acestea, datorită similitudinii ridicate a CDS a unor gene din aceeași familie, valorile obținute au arătat expresia seturilor de gene cu secvențe aproape identice (de exemplu, cele trei gene de termicină sau attacin-like_g1 și g3).

Nivelurile de expresie au fost estimate cu o strategie BLASTN ca număr de rezultate/Gb de experiment SR (tabelul suplimentar 8). Analiza hărții termice a 28 de experimente SR ale corpului întreg, corespunzătoare unor eșantioane din diferite stadii de dezvoltare (Fig. 5), a relevat mai multe concluzii. În primul rând, femelele adulte au prezentat o expresie ridicată a majorității genelor AMP, deși cea mai relevantă a fost cea mai mare expresie a blattellicin_g1 și g4. Unele drosomicine au fost, de asemenea, foarte bine exprimate, în special drosomicina_g5. Expresia unor gene era legată de dezvoltare (a se vedea, de exemplu, absența expresiei drosomicinei g11 și g12 la femelele adulte, dar expresia ridicată la nimfe). Dintre defensine, cele mai puternic exprimate în majoritatea stadiilor de dezvoltare au fost defensin_g9 și g15. Expresia defensinei g2 și g3 a fost mai mare la femelele adulte decât la nimfe. Termicina_g1 a prezentat o expresie scăzută la nimfe și la adulți. Genele asemănătoare atașinei au fost, de asemenea, exprimate la femelele adulte, cu valori ale atașinei_g1 mai mari decât cele ale atașinei_g2, ceea ce a fost în concordanță cu rezultatele descrise anterior (tabelul suplimentar 7), având în vedere, de asemenea, că rezultatele detectate pentru atașina_g1 provin probabil din genele g1 și g3.

Figura 5
figura5

Expresia genică a 17 gene AMP în corpurile întregi de B. germanica. Analiză heatmap care ilustrează abundența transcripțiilor pentru 17 gene AMP selectate în 28 de experimente de citire a secvențelor corespunzătoare unor corpuri întregi din diverse stadii de dezvoltare ale B. germanica, cu indicarea, în unele cazuri, a sexului eșantionului. Valorile au fost estimate ca fiind coeficientul dintre numărul de citiri care au produs un rezultat pozitiv cu o valoare e- mai mică de 1,0E-40 (utilizând secvențele CDS complete ca interogări în căutările BLASTN) și dimensiunea în Gb a experimentului SR.

În general, genele AMP prezintă o creștere a expresiei pe măsură ce dezvoltarea avansează spre formele adulte. Din păcate, în baza de date SRA nu a fost depus niciun experiment SR pentru masculi adulți exclusiv, deși sunt raportate unele eșantioane mixte de masculi și femele (tabelul suplimentar 8).

Am analizat, de asemenea, expresia acestor 17 gene AMP în unele experimente SR transcriptomice în care eșantioanele provin dintr-un singur țesut, o parte a corpului sau un amestec de mai multe țesuturi (tabelul suplimentar 8). În general, drosomicina_g5 și defensina_g9 par a fi exprimate în majoritatea acestor probe. În două experimente din capetele adulților masculi, mai multe gene AMP au fost exprimate la un nivel relevant, inclusiv defensin_g7 și g9, drosomycin_g5 și attacin-like_g2. În general, nivelul de expresie din aceste probe este mult mai mic decât cele provenite din corpuri întregi. Acest lucru ne determină să propunem că alte părți ale corpului, diferite de corpul adipos, ovare sau epidermă, sunt responsabile pentru nivelurile ridicate de expresie observate la femelele adulte cu corpul întreg (Fig. 5).

Nicio expresie a blattellicin_g1 și blattellicin_g4 nu a fost observată în niciun țesut sau parte a probei de corp, cu excepția unei expresii aproape nedetectabile într-o probă de ouă nefecundate, probabil din cauza contaminării cu țesuturi de femele.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.