Gener, der koder for proteiner med AMP-domæner i genomet af B. germanica

For at identificere annoterede gener med AMP-funktioner i genomet af B. germanica6 blev der anvendt to strategier. Den første var søgning efter produktnavne, der omfattede udtrykkene forsvar, drosomycin, tenecin, phormicin, attacin og coleoptericin. Den anden var søgning efter annoterede Pfam-domæner relateret til antimikrobielle peptider. De er inkluderet i tre klan-domæner i Pfam-databasen: Knottin_1 (CL0054, Scorpion toxin-lignende knottin-superfamilie), Defensin (CL0075, Defensin/myotoxin-lignende superfamilie) og Omega_toxin (CL0083, Omega-toksin-lignende). De fem fundne Pfam-domæner var følgende: PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-thionin) og PF11415 (Toxin_37). Efter fjernelse af C0J52_07645 (Giant-lens-protein) og C0J52_08617 (formodet forsvarsprotein 3), fordi de ikke koder for AMP’er, blev der bevaret 24 kodende gener (Supplerende tabel 1). De blev oprindeligt inddelt i følgende grupper: (i) Defensin_2-proteiner (herefter Defensin) (10 CDS, herunder to med annotationen partial = 5′), (ii) Drosomycin (Gamma-thionin-domæne) (10 CDS), (iii) Termicin (Toxin_37-domæne) (3 CDS) og (iv) CDS C0J52_26498. Sidstnævnte, der er annoteret som hypotetisk protein, var et langt protein (541 aminosyrer) med et Attacin_C-domæne. En mindre stringent domæneanalyse viste imidlertid den potentielle tilstedeværelse af to eller tre yderligere domæner i dette protein med ligheder med Attacin_C og Coleoptericin (PF06286).

Tabel 1 Gener, der koder for proteiner med antimikrobielle peptiddomæner i B. germanica.

For at revidere de annoterede AMP-kodende gener blev flere B. germanica RNA-Seq SRA-eksperimenter (PRJNA389591) screenet for deres ekspression ved hjælp af BLASTN og flere AMP CDS som forespørgsler. Blandt de SRA-kørsler med mange AMP-reads blev RNA-Seq-kørslen SRR6784710 (hele kroppen, voksen hun) udvalgt. Kørsel SRR6784710 blev samlet med de novo Trinity25, og der blev oprettet en transkriptdatabase.

Det annoterede genom blev sammenlignet med transkriptdatabasen med det formål at identificere de komplette sæt AMP-gener for hver klasse. Efter omhyggelig revision identificerede vi 39 AMP-gener (tilhørende fem typer: defensiner, termiciner, drosomyciner, attacin-lignende og blattelliciner), som vil blive beskrevet nedenfor. Tredive-fire af dem var fordelt på ti genomstilladser, og fem gener var ikke placeret (tabel 1; supplerende tabel 2).

Defensin AMP-gener

Ten annoterede AMP CDS med et defensin-domæne blev brugt som forespørgsler mod SRR6784710-transkriptdatabasen med BLASTN (e-værdi = 1,0E-20). De gav alle hits med mindst ét transkript. I alt blev der identificeret 16 forskellige transkripter. Transkripthyppigheden varierede fra TPM-værdier (transkript pr. million transkript) på 323,64-0,00.

Informationer om genomannotation og de samlede transkript blev sammenlignet (se Materialer & Metoder) og identificerede 16 defensin-gener (Supplerende tabeller 2 og 3). De fik navnene defensin_g1 til defensin_g16, idet defensin_g1 og defensin_g16 omfatter to alternative isoformer, der ikke påvirker kodningsområdet. Defensin_g1-isoformerne i1 og i2 adskilte sig ved at fjerne eller ikke fjerne et 3′-UTR-intron, mens de to isoformer af defensin_g16 adskilte sig ved at anvende forskellige poly(A)-signaler.

Defensin-gener (undtagen defensin_g1, der ikke var placeret) blev grupperet i fire stilladser. Den ikke-placerede defensin_g1 blev medtaget, fordi programmet identificerede tre transkriptioner, der tilhørte klyngen TRINITY_DN1123_c0. Et af dem (svarende til defensin_g2) kunne relateres til genet C0J52_24001 (der koder for et hypotetisk protein), selv om vi genvandt den korrekte læseramme efter den korrekte placering af starten af det andet exon. De to andre transkripter viste 100 % identitet, men adskilte sig i den alternative splejsning af et 453-nt 3′-UTR intron. Vi betragtede dem som isoformer af defensin_g1, et andet gen end defensin_g2, fordi de adskilte sig i syv nukleotider (to i CDS’et) plus tre indels af forskellig størrelse i 3′-UTR’en. En sådan sekvens blev imidlertid ikke påvist i nogen stilladssekvens.

Det højt udtrykte transkript (TRINITY_DN13842_c0_g1_i1) blev tilsyneladende afledt af TRINITY’s ukorrekte samling af læsninger af fire forskellige loci i genomet med næsten identiske sekvenser (defensin_g3 til g6). Tre af dem var tidligere annoteret med locus_tag-kvalifikatorerne C0J52_27569, C0J52_22338 og C0J52_24004. C0J52_27569 (gen = DEFI_4 i scaffold PYGN01003429) var imidlertid et tandem af to gener (defensin_g3 og defensin_g4). En samlingskløft, der overlapper defensin_g3, er sandsynligvis årsagen til, at et enkelt mRNA, der udvider begge gener, blev annoteret i genomet.

Generne defensin_g7 og defensin_g8 viste identiske CDS-sekvenser, men med adskillige forskelle i UTR-segmenterne af mRNA-sekvenserne. De blev placeret i henholdsvis stilladserne PYGN01002380 og PYGN01001185. Kun en af dem, defensin_g8, blev tidligere annoteret som gen C0J52_22336.

Defensin_g9 svarer til gen C0J52_24005, der koder for Phormicin, et protein med 91 aminosyrer. Transkriptanalysen afslørede, at det kodede protein er kortere (71 aminosyrer) med en signalpeptidsekvens på 20 aminosyrer ved sin aminoterminus (se nedenfor). Defensin_g10 var også et Phormicin placeret i et andet stillads, men kun det andet exon var til stede i genomet, idet det første exon højst sandsynligt var placeret i et sammenhængende 1-kb-samlingshul.

Defensin_g11, g12 og g13 svarer til tidligere annoterede gener (Supplerende tabeller 2 og 3). Defensin_g14 er til stede i stilladset PYGN01001185, men det meste af sekvensen af det andet exon er fraværende på grund af en samlingskløft. CDS-sekvenserne af defensin_g15 og C0J52_20459 var identiske, men transkriptanalyse af defensin_g15 tydede på et to-exon mRNA i stedet for tre-exon C0J52_20459.

Alle defensiner viste signalpeptider på 18 til 22 aminosyrer ved N-terminus og PF01097 (Defensin_2)-domænet ved C-terminus (se eksempler på domæneorganisationer i Fig. 1). Længden af aminosyrekæden varierede fra 63 til 81 rester med et gennemsnit på 72 aminosyrer. Selv om nogle Defensin-proteiner var identiske, var det gennemsnitlige antal parvise forskelle højt (29 aminosyrer). En udledt maximum likelihood-fylogeni viste deres fordeling i syv klynger (fig. 2a). Et logo af proteinjusteringen af Defensin-proteinerne viser den hydrofobiske N-terminale sekvens samt Defensin_2-domænet (C-terminus) med de seks konserverede cysteinrester (Supplerende fig. 1).

Figur 1
figur1

Domæneorganisation i de fem typer AMP’er fra B. germanica. Et protein af hver klasse er vist. Orange firkanter er signalpeptider. Rød oval svarer til et glutamin/glutaminsyre-rigt område. Grønne ovaler er Pfam-A-domæner PF03769 (Attacin_C). Blå ovaler (fra top til bund) er henholdsvis Pfam-A-domænerne PF01097 (Defensin_2), PF11415 (Toxin_37) og PF00304 (Gamma-thionin).

Figur 2
figur2

B. germanica Defensin- og Drosomycin-protein-fylogenier. (a) Maximum likelihood-fylogeni af 18 defensinproteiner (afledt af transskriptioner af 16 gener). Model WAG + I med fuldstændig sletning. Sammenligningslængde 57 steder. Bootstrap replikater 100. Midtpunktsrodning. (b) Maximum likelihood-fylogeni af Drosomycin-proteiner. Model Dayhoff + G med fuldstændig sletning. Sammenligningslængde 66 steder. Bootstrap replikater 100. Midtpunktsrodning. Bootstrap-værdier mindre end 50 er skjult.

En sammenligning mellem transkriptionsniveauerne for de 16 defensingener blev vurderet ved hjælp af en BLASTN-strategi baseret på BLASTN-søgninger med nukleotiderne 41-190 i hvert CDS. Alle 150-nt-sekvenser var forskellige i mindst ét nukleotid, undtagen defensin_g3 og g5, som var identiske, og transkriptionsniveauet kunne ikke tildeles et specifikt gen (Supplerende tabel 3). På grundlag af de TPM-værdier, der er estimeret af TRINITY, og de transkriptionsniveauer, der er estimeret ved hjælp af denne BLAST-strategi, observerede vi, at i dette voksne hunløb er defensin_g15 og g16 (der koder for Defensin-lignende proteiner), g9 og g10 (der koder for Phormicin) og g1, g2, g3 og g5 (der koder for Tenecin-1-proteiner) de mest eksprimerede defensingener (Supplerende tabel 3).

Med en TBLASTN-strategi blev der søgt efter defensin-transkriptioner i 45 arter, der dækker ordenen Blattodea26 (Supplerende tabel 4). Fireogfyrre arter indeholder defensin-transkripter (interval 1 til 9).

Termicin AMP-gener

Tre gener, der koder for små proteiner med Pfam-domænet PF11415, er annoteret i genomet (Supplerende tabel 1). BLASTN-søgninger mod SRR6784710-transkriptdatabasen gav hits med kun to meget ensartede transkripter. Det første transkript, TRINITY_DN10017_c0_g1_i1, viste en enkelt forskel med enten C0J52_00758 eller C0J52_26761 ved CDS-sekvensen, men flere ved den resterende mRNA-sekvens, hvilket tyder på to uafhængige gener i genomet. Det andet transkript, TRINITY_DN10017_c0_g2_i1, var 100 % identisk med både CDS og mRNA fra C0J52_26762, hvilket indikerer et tredje termicin-gen. De tre kodede proteiner er næsten identiske med en enkelt S/A-forskel på sted 13 (Supplerende fig. 1). Der forudsiges et signalhydrofobt peptid mellem aminosyrerne 1 og 19 og Toxin_37-domænet (PF11415) mellem aminosyrerne 30 og 63 (fig. 1). På grundlag af TPM-værdierne estimeret af TRINITY og transkriptionsniveauerne estimeret af BLASTN (et 150-bp-segment, der dækker fire polymorfe steder i termicin-CDS’et), kan vi konkludere, at termicin_g3 (C0J52_26762) er det mest højest udtrykte termicin-gen (Supplerende tabel 5).

Termicin mRNA’er blev påvist i 29 Blattodea-arter, der tilhører de forskellige taksonomiske familier (Supplerende tabel 4). Deres fravær var hyppig i arter fra Corydioidea, hvilket tyder på et potentielt tab af denne type gen, selv om manglende ekspression i disse prøver ikke kan udelukkes.

Drosomycin AMP-gener

Ten gener, der koder for proteiner med domænet Gamma-thionin (PF00304), er annoteret i tre scaffolds af B. germanica-genomet. Disse svampedræbende proteiner får navnet drosomyciner. BLASTN-søgninger af det annoterede CDS mod SRR6784710-transkriptdatabasen identificerede kun seks transskriptioner, der omfatter det komplette CDS, og to ubetydelige transskriptioner, der kun dækker et CDS-segment.

Sammenligningen af de annoterede CDS og dem, der er afledt af disse transkripter, afslørede, at kun tre annoterede gener (C0J52_03170, C0J52_03171 og C0J52_12810) var ækvivalente med tre af disse transkripter (førstnævnte med 2 nukleotidforskelle). De blev annoteret som drosomycin_g2, g3 og g5 (supplerende tabeller 2 og 6). Et af de tre resterende transkripter, der svarer til drosomycin_g6, kunne placeres i genomet med nogle få nukleotidforskelle i et ikke-annoteret segment. Endelig blev sekvenserne af de to andre transkripter ikke påvist i genomet, selv om deres CDS-sekvenser lignede C0J52_03170 meget (med 6 og 8 nukleotidforskelle). Disse forskelle tyder på, at de ikke er alleler, men uafhængige gener, og vi annoterede dem som drosomycin_g1 og g4 (Supplerende tabeller 2 og 6).

På den anden side blev seks annoterede gener med locus_tags, C0J52_12811-13 og C0J52_23105-08 ikke påvist i transkriptomet hos den voksne hun, men de synes at blive udtrykt i andre udviklingsstadier. De blev annoteret som drosomycin_g7 til g13.

En fylogeni af de 13 drosomycinproteiner viste, at defensin_g6 var det mest fjerntliggende gen, mens de andre 12 gener dannede to klynger med seks gener hver. Generne drosomycin_g1 til g5, der udtrykkes i voksne hunner, plus det ikke-eksprimerede drosomycin_g9 dannede den ene velunderstøttede klade, mens de andre seks ikke-eksprimerede gener dannede den anden (Fig. 2b).

En vurdering af transkriptionsniveauet viste, at drosomycin_g5 (C0J52_12810) var det gen med den højeste ekspression, idet 86,1 % af drosomycin-reasserne for dette segment stammede fra det (Supplerende tabel 6).

Tolv ud af 13 kodede proteiner var 66 aminosyrer lange. Drosomycin_g6 var 71 aminosyrer lang på grund af tilstedeværelsen i midten af proteinet af yderligere aminosyrer, der stammer fra to indels (steder 25-26 og 36-38 i alignmentet). Blandt de observerede rester er det mest bemærkelsesværdige træk i de kodede proteiner tilstedeværelsen af otte konserverede cysteiner27 (Supplerende figur 1). Alle drosomyciner viser et signalhydrofobt peptid ved N-terminus og PF00304-domænet (Gamma-thionin) ved C-terminus (Fig. 1).

Drosomycin-mRNA’er blev påvist i 24 Blattodea-arter, men de var fraværende hos arter af Isoptera og deres nære slægtning Cryptocercus wrighti (Supplerende tabel 4). Det samme blev påvist i kladen Corydioidea, hvilket tyder på, at termitter og andre Blattodea kan have mistet denne type AMP-gen.

Attacin AMP-gener: Attacin-lignende og blattelliciner

Op til fire regioner med en vis lighed med Attacin_C-domænet (PF03769) blev påvist i den 47-kb-region, der spænder over C0J52_26498-genet, der er placeret i contig PYGN01001824. Efter en foreløbig analyse af det sammensatte transkriptom blev der identificeret mere end ti mRNA-sekvenser. De ligner fuldstændige eller delvise sekvenser af mRNA’er, der tilhører to typer af attacingener. Den første type omfatter gener, der koder for typiske Attacin-proteiner (ca. 120 aminosyrer) med et signalpeptid ved N-terminus og Attacin_C-domænet ved C-terminus, som blev kaldt attacin-lignende gener. Den anden type var meget anderledes, fordi den omfattede en lang strækning af glutamin/glutaminsyrerester. Da de syntes at være en tilsyneladende evolutionær nyskabelse i B. germanica, kaldte vi dem blattelliciner.

Tre attacinlignende transkripter blev påvist i transkriptomet (Supplerende tabeller 2 og 7). De indeholdt kodende sekvenser på 357-360 nukleotider (118-119 kodede aminosyrer). De fik navnene attacin-like_g1 til attacin-like_g3. Udtrækningen og samlingen af læsningerne for disse mRNA’er bekræftede deres eksistens, men antydede muligheden af et fjerde gen. Attacin-like_g3A og attacin-like_g3B viser kun to forskelle, nemlig sletningen af et 9-nukleotid-segment i 5′UTR af attacin_g3B og en synonym forskel ved CDS position 288 (det var meget sjældent, at stederne for de to forskelle blev inkluderet i en læsning, når man tager i betragtning, at længden af en læsning er 301 nukleotider). Da der kun var to forskelle, og de ikke var placeret i genomet, anså vi dem for at være alleler af det samme gen.

Attacin-like_g1 CDS var relativt ens med attacin-like_g3 CDS med 9-10 forskelle. De var dog tilstrækkeligt forskellige til at blive betragtet som uafhængige loci. Attacin-like_g2 var det mest divergerende gen med 85-88 forskelle og et ekstra kodon i forhold til de andre. Kun sekvenserne af attacin-like_g1 og g2 var placeret i genomet (Supplerende tabel 2 og 7).

Annoteringen af blattelliciner var meget mere kompliceret. Efter en indledende analyse blev der observeret en lang CDS (> 250 kodoner) med en mærkelig struktur. Den startede med det hydrofobiske signalpeptid ved N-terminus, efterfulgt af et langt Glx-rigt segment i midten (> 70 rester, hovedsagelig glutaminer og glutaminsyrer) og et C-terminalt Attacin-domæne (Fig. 1).

Op til 13 mRNA-transskriptioner (alle med ufuldstændige CDS-segmenter), der involverer denne type sekvenser, blev detekteret. Hovedårsagerne var, at tilstedeværelsen af flere blattellicingener og de lange Glx-rige regioner drastisk påvirkede samlingen af transkriptomet. Dette forhold fandt sandsynligvis sted under samling og annotering af B. germanica-genomet5,6.

Den 5′-sekvens af en blattellicin-CDS blev brugt som forespørgsel til at identificere de læsninger, der stammer fra ekspression af blattellicin-gener i kørslen SRR6784710, med BLASTN. Efter ekstraktion og samling blev der afsløret fire forskellige starter af blattellicingener med et interval på 7 til 18 parvise nukleotidforskelle i 5′ af mRNA’erne. Disse fire mRNA-starter blev brugt til at rekruttere de resterende gensekvenser, indtil CDS-komplettering.

De fleste af CDS-sekvensen for blattellicin_g1 kunne identificeres i genomet, selv om omkring 200 bp manglede på grund af to samlehuller (Supplerende tabeller 2 og 7). For de øvrige kunne kun det første kodende exon af blattellicin_g2 og g4 entydigt henføres til et specifikt contig-segment, selv om der også blev fundet hits for andre segmenter af CDS’en, men uden 100 % identitet. Der kunne ikke identificeres nogen identisk sekvens til blattellicin_g3’s første exon i genomet. Den mest sandsynlige forklaring er, at de fire blattellicingener findes i tandemkopier i genomet, men at deres særlige centrale gentagelsesstruktur forhindrer korrekte samlinger i enten genomet eller transkriptomerne, undtagen hvis der foretages en manuel inspektion af alignmenterne. Desuden kan variationer i Glx-kodon-kopiantalet i populationen ikke udelukkes.

Vi påviste, at blattelliciner blev udtrykt på et højere niveau end attacin-lignende gener, hvor blattellicin_g4 var det mest udtrykte i dette transkriptom (Supplerende tabel 7).

Logos af proteinudligningerne for de tre attacin-lignende og de fire blattellicin-proteiner fra B. germanica afslørede et lille segment af negativt ladede aminosyrer i Attacin-lignende proteiner og et langt segment i Blattelliciner (Fig. 3).

Figur 3
Figur3

Logoer af alignments og aminosyresammensætning af B. germanica Attacin-lignende og Blattellicin-proteiner. (a) Logo af alignment af tre Attacin-lignende proteiner. (b) Logo af tilpasningen af fire Blattelliciner. (c) Gennemsnitlig aminosyresammensætning (%) af Attacin-lignende og Blattellicin-proteiner.

Attacin-mRNA’er blev påvist i de fleste Blattodea-arter (Supplerende tabel 4). Hits for blattelliciner dækkede ikke Glx-regionen, men kun attacin_C-domænet. For at forstå den evolutionære historie for attacinlignende og blattellicin-gener i B. germanica ekstraherede vi attacin-transskriptionerne fra syv Blattellinae TSA-projekter26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Disse transkriptomer stammer fra voksne hele kroppe undtagen I. deropeltiformis (uden oplysninger om udviklingsstadiet). De kan potentielt dække alle attacinsgener for hvert genom, selv om man ikke kan udelukke muligheden for gener uden udtryk. Det største antal attacingener var tre i E. sundaica. Der blev observeret to gener hos L. decipiens, Symploce sp. AD-2014 og A. kyotensis, selv om den ene af kopierne i førstnævnte var ufuldstændig og meget divergerende, sandsynligvis et pseudogen, mens de to kopier i sidstnævnte var ufuldstændige med nogle få kodoner i 5′-enden af CDS’en. SRA-projektet blev screenet for læsninger, der dækker starten af CDS’et, og på grundlag af de genvundne læsninger var den ene komplet, og i den anden var der kun fire kodoner, der manglede. Den tilbageværende art indeholdt en enkelt genkopi. For at kunne bruges som outgroup blev der desuden ekstraheret den eneste-én-detekteret i P. americana.

Der blev udført en fylogeni med en trimmet alignment (103 steder) (Fig. 4). Den korte længde af sekvensalignementet forhindrede høje bootstrap-værdier i de fleste knudepunkter og vanskeliggjorde en fuldstændig sikker bestemmelse af denne genfamilies udviklingshistorie med fuld sikkerhed. Der kan dog observeres flere kendsgerninger fra fylogenien. For det første er attacinlignende gener den forfødte gentype. Nogle Blattellinae-arter indeholder kun et eller to gener. I tilfældet med kladen af B. germanica, E. sundaica, L. decipiens og Symploce sp. AD-2014 fandt duplikationen af et forfødt attacin-lignende gen sted før deres divergens, hvilket resulterede i forekomsten af attacin-like_g1- og g2-typerne. Selv om L. decipiens attacin-like_g1 ikke blev medtaget i fylogenien, er der påvist en ufuldstændig og divergent kopi af et transkript af denne type (GDYK01026461.1), der sandsynligvis stammer fra en pseudogeniseret kopi.

Figur 4
Figur4

Attacin-lignende og Blattellicin-protein-fylogeni i Blattellinae. (a) Maximum Likelihood-fylogeni af proteiner, der indeholder Attacin_C-domænet i underfamilien Blattellinae. Model LG + G med fuldstændig sletning. Alignmentet blev trimmet for at samle det N-terminale signalpeptid plus det C-terminale Attacin_C-domæne (længde 103 steder). P. americana blev anvendt som en outgroup. Bootstrap replikater 100. Bootstrap-værdier mindre end 50 er skjult. Alle artsnavne er forkortede (se koder i højre topologi), undtagen Symploce sp. De uden forkortelser er proteiner fra B. germanica. (b) Taxonomiske relationer i henhold til26.

Oprindelsen af blattelliciner synes at være meget ny. Selv om det ikke understøttes af en signifikant bootstrap-værdi, blev et forfadergen af typen attacin-like_g2 muligvis duplikeret, og en af kopierne genererede efter en hurtig udvikling blattelliciner. Duplikationen fandt sted før divergensen mellem E. sundaica og B. germanica. Proteinet i førstnævnte er tilsyneladende et præ-Blattellicin, der omfatter nogle af de nye kendetegn ved blattelliciner, såsom stor størrelse (182 rester) og et par ekstra aminosyrer ved C-terminus (RK i B. germanica og GKGK i E. sundaica). Det vigtigste kendetegn for Blattelliciner, den lange poly-Glx-region, er imidlertid fraværende, selv om E. sundaica præ-Blattellicin omfatter et spor med syv glutaminsyrer (med et A i midten) tæt på starten af attacin-domænet.

AMP-ekspression i B. germanica

For at bestemme ekspressionen af AMP-gener i B. germanica-væv, udviklingsstadier eller køn udvalgte vi CDS’en af 17 AMP-genstyper (defensin_g2, g3, g7, g9, g11, g13 og g15; termicin_g1; drosomycin_g1, g5, g6, g11 og g12; attacin-lignende_g1 og g2; blattellicin_g1 og g4). De er tilstrækkeligt forskellige til at undgå væsentlige krydsresultater blandt de udvalgte fra samme gruppe. På grund af den store lighed mellem CDS’erne i nogle gener fra samme familie viste de opnåede værdier imidlertid ekspressionen af sættene af gener med næsten identiske sekvenser (f.eks. de tre termicingener eller attacin-like_g1 og g3).

Ekspressionsniveauerne blev vurderet med en BLASTN-strategi som antal hits/Gb for SR-forsøg (Supplerende tabel 8). Heatmap-analysen af 28 SR-eksperimenter for hele kroppen svarende til prøver fra forskellige udviklingsstadier (Fig. 5) afslørede flere konklusioner. For det første udviste voksne hunner høj ekspression af de fleste AMP-gener, selv om den mest relevante var den højeste ekspression af blattellicin_g1 og g4. Nogle drosomyciner var også stærkt udtrykt, specielt drosomycin_g5. Ekspressionen af nogle gener var forbundet med udviklingen (se f.eks. fraværet af ekspression af drosomycin g11 og g12 hos voksne hunner, men den høje ekspression hos nymferne). Blandt defensinerne var defensin_g9 og g15 de højest udtrykte i de fleste udviklingsstadier. Ekspressionen af defensin g2 og g3 var højere hos voksne hunner end hos nymfer. Termicin_g1 udviste lav ekspression i nymfer og voksne dyr. Attacin-lignende gener blev også udtrykt i voksne hunner, hvor værdierne for attacin-like_g1 var højere end for attacin-like_g2, hvilket var i overensstemmelse med tidligere beskrevne resultater (Supplerende tabel 7), også i betragtning af, at de fundne hits for attacin-like_g1 sandsynligvis stammer fra g1- og g3-gener.

Figur 5
Figur5

Genekspression af 17 AMP-gener i hele legemer af B. germanica. Heatmap-analyse, der illustrerer hyppigheden af transkripter for 17 udvalgte AMP-gener i 28 Sequence Read-eksperimenter svarende til hele kroppe fra forskellige udviklingsstadier af B. germanica med angivelse, i nogle tilfælde, af prøvens køn. Værdierne blev estimeret som kvotienten mellem antallet af læsninger, der producerede et hit med en e-værdi mindre end 1,0E-40 (ved hjælp af de komplette CDS-sekvenser som forespørgsler i BLASTN-søgninger) og SR-eksperimentets størrelse i Gb.

Generelt viser AMP-generne en stigning i ekspression, efterhånden som udviklingen skrider frem til voksne former. Desværre blev der ikke deponeret noget SR-eksperiment for udelukkende voksne hanner i SRA-databasen, selv om der er rapporteret om nogle blandede prøver af hanner og hunner (Supplerende tabel 8).

Vi analyserede også ekspressionen af disse 17 AMP-gener i nogle transkriptomiske SR-eksperimenter, hvor prøverne kommer fra et enkelt væv, en del af kroppen eller en blanding af flere væv (Supplerende tabel 8). Generelt synes drosomycin_g5 og defensin_g9 at blive udtrykt i de fleste af disse prøver. I to forsøg fra voksne hanhoveder blev flere AMP-gener udtrykt på et relevant niveau, herunder defensin_g7 og g9, drosomycin_g5 og attacin-like_g2. Generelt er udtryksniveauet i disse prøver meget mindre end i prøverne fra hele kroppe. Dette får os til at foreslå, at andre dele af kroppen end fedtlegeme, æggestokke eller epidermis er ansvarlige for de høje ekspressionsniveauer, der er observeret i voksne hunner med helkrop (fig. 5).

Ingen ekspression af blattellicin_g1 og blattellicin_g4 blev observeret i noget væv eller nogen del af kropsprøven, bortset fra en næsten ikke påviselig ekspression i en prøve af ikke-befrugtede æg, sandsynligvis på grund af kontaminering med hunvæv.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.