Gener som kodar för proteiner med AMP-domäner i genomet hos B. germanica

För att identifiera annoterade gener med AMP-funktioner i genomet hos B. germanica6 användes två strategier. Den första var sökning efter produktnamn som innehöll termerna defense, drosomycin, tenecin, phormicin, attacin och coleoptericin. Den andra var sökning av annoterade Pfam-domäner som är relaterade till antimikrobiella peptider. De ingår i tre klanområden i Pfam-databasen: Knottin_1 (CL0054, Scorpion toxin-like knottin superfamily), Defensin (CL0075, Defensin/myotoxin-like superfamily) och Omega_toxin (CL0083, Omega toxin-like). De fem upptäckta Pfam-domänerna var: PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-thionin) och PF11415 (Toxin_37). Efter avlägsnande av C0J52_07645 (Giant-lens-protein) och C0J52_08617 (putativt försvarsprotein 3), eftersom de inte kodar för AMP, återstod 24 kodande gener (kompletterande tabell 1). De klassificerades inledningsvis i följande grupper: (i) Defensin_2-proteiner (nedan Defensin) (10 CDS, inklusive två med annotationen partial = 5′), (ii) Drosomycin (Gamma-thionin-domän) (10 CDS), (iii) Termicin (Toxin_37-domän) (3 CDS) och (iv) CDS C0J52_26498. Det sistnämnda, som antecknats som hypotetiskt protein, var ett långt protein (541 aminosyror) med en Attacin_C-domän. En mindre stringent domänanalys visade dock den potentiella förekomsten av två eller tre ytterligare domäner i detta protein med likheter med Attacin_C och Coleoptericin (PF06286).

Tabell 1 Gener som kodar för proteiner med antimikrobiella peptiddomäner i B. germanica.

För att revidera de annoterade AMP-kodande generna undersöktes flera B. germanica RNA-Seq SRA-experiment (PRJNA389591) för deras uttryck med hjälp av BLASTN och flera AMP CDS som förfrågningar. Bland de SRA-körningar med många AMP-läsningar valdes RNA-Seq-körningen SRR6784710 (hela kroppen, vuxen kvinna) ut. Körning SRR6784710 sammanställdes med de novo Trinity25 och en transkriptdatabas skapades.

Det annoterade genomet jämfördes med transkriptdatabasen i syfte att identifiera de kompletta uppsättningarna av AMP-gener för varje klass. Efter noggrann granskning identifierade vi 39 AMP-gener (tillhörande fem typer: defensiner, termiciner, drosomyciner, attacinliknande och blattelliciner), som kommer att beskrivas nedan. Trettiofyra av dem var fördelade på tio genomställningar och fem gener var oplacerade (tabell 1; kompletterande tabell 2).

Defensin AMP-gener

Tio annoterade AMP-CDS med en defensin-domän användes som förfrågningar mot transkriptdatabasen SRR6784710 med BLASTN (e-värde = 1,0E-20). Alla gav träffar med minst ett transkript. Totalt identifierades 16 olika transkript. Transkriptets abundans varierade från TPM-värden (transkript per miljon transkript) på 323,64-0,00.

Informationen om genomannotationen och de sammanställda transkriptionerna jämfördes (se Material & Metoder) och identifierade 16 defensingener (kompletterande tabeller 2 och 3). De fick namnen defensin_g1 till defensin_g16, där defensin_g1 och defensin_g16 innehåller två alternativa isoformer som inte påverkar kodningsregionen. Defensin_g1 isoformerna i1 och i2 skiljde sig åt genom att ta bort eller inte ta bort ett 3′-UTR-intron, medan de två isoformerna av defensin_g16 skiljde sig åt genom att använda olika poly(A)-signaler.

Defensingenerna (utom defensin_g1 som var oplacerad) var klustrade i fyra scaffolds. Den oplacerade defensin_g1 inkluderades eftersom programmet identifierade tre transkript som tillhörde klustret TRINITY_DN1123_c0. Ett av dem (som motsvarar defensin_g2) skulle kunna relateras till genen C0J52_24001 (som kodar för ett hypotetiskt protein), även om vi återfick den korrekta läsramen efter den korrekta placeringen av starten på det andra exonet. De andra två transkriptionerna uppvisade 100 % identitet men skiljde sig åt genom alternativ splicing av ett 453-nt 3′-UTR-intron. Vi betraktade dem som isoformer av defensin_g1, en annan gen än defensin_g2, eftersom de skilde sig åt i sju nukleotider (två i CDS) plus tre indels av olika storlek i 3′-UTR. En sådan sekvens upptäcktes dock inte i någon scaffoldsekvens.

Den högt uttryckta transkriptet (TRINITY_DN13842_c0_g1_i1) härstammade uppenbarligen från TRINITY:s felaktiga sammansättning av läsningar från fyra olika loci i genomet med nästan identiska sekvenser (defensin_g3 till g6). Tre av dem har tidigare annoterats med locus_tag-kvalificeringarna C0J52_27569, C0J52_22338 och C0J52_24004. C0J52_27569 (gen = DEFI_4 i scaffold PYGN01003429) var dock ett tandem av två gener (defensin_g3 och defensin_g4). En monteringslucka som överlappar defensin_g3 är troligen orsaken till att ett enda mRNA som expanderar båda generna annoterades i genomet.

Generna defensin_g7 och defensin_g8 uppvisade identiska CDS-sekvenser men med flera skillnader i UTR-segmenten av mRNA-sekvenserna. De placerades i scaffolds PYGN01002380 respektive PYGN01001185. Endast en av dem, defensin_g8, har tidigare annoterats som gen C0J52_22336.

Defensin_g9 motsvarar genen C0J52_24005 som kodar för Phormicin, ett protein med 91 aminosyror. Transkriptanalysen visade att det kodade proteinet är kortare (71 aminosyror) med en signalpeptidsekvens på 20 aminosyror vid sin aminoterminus (se nedan). Defensin_g10 var också ett Phormicin beläget i en annan scaffold, men endast det andra exonet fanns i genomet, med det första exonet sannolikt placerat i en sammanhängande 1-kb assembleringslucka.

Defensin_g11, g12 och g13 är likvärdiga med tidigare annoterade gener (kompletterande tabeller 2 och 3). Defensin_g14 finns i scaffold PYGN01001185, men större delen av sekvensen i det andra exonet saknas på grund av ett monteringsgap. CDS-sekvenserna för defensin_g15 och C0J52_20459 var identiska, men transkriptanalys av defensin_g15 tydde på ett mRNA med två exoner i stället för tre exoner i C0J52_20459.

Alla defensiner uppvisade signalpeptider på 18 till 22 aminosyror vid N-terminus och PF01097-domänen (Defensin_2) vid C-terminus (se exempel på domänorganisationer i fig. 1). Aminosyrakedjans längd varierade från 63 till 81 rester med ett genomsnitt på 72 aminosyror. Även om vissa Defensinproteiner var identiska var det genomsnittliga antalet parvisa skillnader högt (29 aminosyror). En härledd maximum likelihood-fylogeni visade att de var fördelade på sju kluster (fig. 2a). En logotyp av proteinjusteringen av Defensinproteinerna visar den hydrofoba N-terminala sekvensen samt Defensin_2-domänen (C-terminus) med de sex bevarade cysteinresterna (Supplementary Fig. 1).

Figur 1
figur1

Domänorganisation i de fem typerna av AMP:er från B. germanica. Ett protein av varje klass visas. Orangefärgade fyrkanter är signalpeptider. Röd oval motsvarar en glutamin/glutaminsyrarik region. Gröna ovaler är Pfam-A-domäner PF03769 (Attacin_C). Blå ovaler (från toppen till botten) är Pfam-A-domänerna PF01097 (Defensin_2), PF11415 (Toxin_37) respektive PF00304 (Gamma-thionin).

Figur 2
figur2

B. germanica Defensin- och Drosomycinproteinfylogenier. (a) Fylogeni med maximal sannolikhet för 18 defensinproteiner (härledd från transkriptioner av 16 gener). Modell WAG + I med fullständig borttagning. Längden på anpassningen är 57 platser. Bootstrap replikat 100. Mittpunktsrötter. (b) Fylogeni med maximal sannolikhet för Drosomycinproteiner. Modell Dayhoff + G med fullständig borttagning. Längden på sammanlänkningen är 66 platser. Bootstrap replikat 100. Mittpunktsrötter. Bootstrapvärden som är mindre än 50 är dolda.

En jämförelse mellan transkriptionsnivåerna för de 16 defensingenerna uppskattades med hjälp av en BLASTN-strategi baserad på BLASTN-sökningar med nukleotiderna 41-190 i varje CDS. Alla 150-nt-sekvenser skilde sig åt i minst en nukleotid, utom defensin_g3 och g5 som var identiska och transkriptionsnivån kunde inte tilldelas en specifik gen (kompletterande tabell 3). Baserat på TPM-värdena uppskattade av TRINITY och transkriptionsnivåerna uppskattade av denna BLAST-strategi, observerade vi att i denna vuxna honkörning är defensin_g15 och g16 (som kodar för defensinliknande proteiner), g9 och g10 (som kodar för formicin) och g1, g2, g3 och g5 (som kodar för tenecin-1-proteiner) de mest höguttryckta defensingenerna (kompletterande tabell 3).

Med hjälp av en TBLASTN-strategi söktes defensintranskriptioner i 45 arter som täcker ordningen Blattodea26 (kompletterande tabell 4). Fyrtiofyra arter innehåller defensintranskriptioner (intervall 1 till 9).

Termicin AMP-gener

Tre gener som kodar för små proteiner med Pfam-domänen PF11415 är annoterade i genomet (kompletterande tabell 1). BLASTN-sökningar mot transkriptdatabasen SRR6784710 gav träffar med endast två mycket likartade transkript. Det första transkriptet, TRINITY_DN10017_c0_g1_i1, uppvisade en enda skillnad med antingen C0J52_00758 eller C0J52_26761 vid CDS-sekvensen men flera vid den återstående mRNA-sekvensen, vilket tyder på två oberoende gener i genomet. Det andra transkriptet, TRINITY_DN10017_c0_g2_i1, var 100 % identiskt med både CDS och mRNA från C0J52_26762, vilket tyder på en tredje termicin-gen. De tre kodade proteinerna är nästan identiska med en enda S/A-skillnad vid plats 13 (kompletterande figur 1). En hydrofob signalpeptid förutses mellan aminosyrorna 1 och 19 och Toxin_37-domänen (PF11415) mellan aminosyrorna 30 och 63 (fig. 1). Baserat på TPM-värdena uppskattade av TRINITY och transkriptionsnivåerna uppskattade av BLASTN (ett 150-bp-segment som täcker fyra polymorfa platser i termicin-CDS) kan vi dra slutsatsen att termicin_g3 (C0J52_26762) är den mest höguttryckta termicin-genen (Kompletterande tabell 5).

Termicin mRNA:er upptäcktes i 29 Blattodea-arter som tillhör de olika taxonomiska familjerna (Kompletterande tabell 4). Deras frånvaro var frekvent hos arter från Corydioidea, vilket tyder på en potentiell förlust av denna typ av gen, även om avsaknaden av uttryck i dessa prover inte kan uteslutas.

Drosomycin AMP-gener

Tio gener som kodar för proteiner med domänen Gamma-thionin (PF00304) är annoterade i tre scaffolds av B. germanica-genomet. Dessa svampdödande proteiner får namnet drosomyciner. BLASTN-sökningar av det annoterade CDS mot transkriptdatabasen SRR6784710 identifierade endast sex transkript som omfattar hela CDS och två obetydliga transkript som endast omfattar ett CDS-segment.

Vid jämförelsen av de annoterade CDS och de som härrör från dessa transkript visade det sig att endast tre annoterade gener (C0J52_03170, C0J52_03171 och C0J52_12810) var likvärdiga med tre av dessa transkript (de förstnämnda med 2 nukleotidskillnader). De annoterades som drosomycin_g2, g3 och g5 (kompletterande tabeller 2 och 6). Ett av de tre återstående transkriptionerna, som motsvarar drosomycin_g6, kunde placeras i genomet, med några få nukleotidskillnader, i ett icke-annoterat segment. Slutligen upptäcktes inte sekvenserna för de andra två transkriptionerna i genomet, även om deras CDS-sekvenser var mycket lika C0J52_03170 (med 6 och 8 nukleotidskillnader). Dessa skillnader tyder på att de inte är alleler utan oberoende gener och vi annoterade dem som drosomycin_g1 och g4 (kompletterande tabeller 2 och 6).

Å andra sidan upptäcktes inte sex annoterade gener med locus_taggar, C0J52_12811-13 och C0J52_23105-08 i transkriptomet från den vuxna honan, men de verkar uttryckas i andra utvecklingsstadier. De annoterades som drosomycin_g7 till g13.

En fylogeni av de 13 drosomycinproteinerna visade att defensin_g6 var den mest avlägsna genen, medan de andra 12 generna bildade två kluster med sex gener vardera. Generna drosomycin_g1 till g5, som uttrycks i vuxna honor, plus den icke-expressiva drosomycin_g9 bildade en väl understödd klunga medan de övriga sex icke-expressiva generna bildade den andra (fig. 2b).

En uppskattning av transkriptionsnivån visade att drosomycin_g5 (C0J52_12810) var genen med det högsta uttrycket, med 86,1 % av drosomycinläsningarna för detta segment som härrörde från den (kompletterande tabell 6).

Tolv av de 13 kodade proteinerna var 66 aminosyror långa. Drosomycin_g6 var 71 aminosyror lång på grund av att det i mitten av proteinet fanns ytterligare aminosyror som härrörde från två indels (platserna 25-26 och 36-38 i anpassningen). Bland de observerade resterna är det mest anmärkningsvärda draget i de kodade proteinerna förekomsten av åtta bevarade cysteiner27 (kompletterande figur 1). Alla drosomyciner uppvisar en hydrofob signalpeptid vid N-terminus och PF00304-domänen (Gamma-thionin) vid C-terminus (fig. 1).

Drosomycin mRNA:er upptäcktes hos 24 Blattodea-arter, men de saknades hos arter av Isoptera och deras nära släkting Cryptocercus wrighti (kompletterande tabell 4). Samma faktum upptäcktes i kladen Corydioidea, vilket tyder på att termiter och andra Blattodea kan ha förlorat denna typ av AMP-gen.

Attacin AMP-gener: attacin-liknande och blattelliciner

Upp till fyra regioner med viss likhet med Attacin_C-domänen (PF03769) upptäcktes i den 47-kb-region som sträcker sig över genen C0J52_26498 som placerats i contig PYGN01001824. Efter en preliminär analys av det sammansatta transkriptomet identifierades mer än tio mRNA-sekvenser. De liknar fullständiga eller partiella sekvenser av mRNA som tillhör två typer av attacingener. Den första typen omfattar gener som kodar för typiska attacinproteiner (cirka 120 aminosyror) med en signalpeptid vid N-terminus och Attacin_C-domänen vid C-terminus, vilka benämndes som attacin-liknande gener. Den andra typen var mycket annorlunda, eftersom den innehöll en lång sträcka av glutamin/glutaminsyrarester. Eftersom de verkade vara en uppenbar evolutionär innovation hos B. germanica kallade vi dem för blattelliciner.

Tre attacinliknande transkript upptäcktes i transkriptomet (kompletterande tabeller 2 och 7). De innehöll kodande sekvenser på 357-360 nukleotider (118-119 kodade aminosyror). De fick namnen attacin-like_g1 till attacin-like_g3. Extraktionen och sammansättningen av läsningar för dessa mRNA:er bekräftade deras existens, men antydde möjligheten av en fjärde gen. Attacin-like_g3A och attacin-like_g3B uppvisar endast två skillnader, borttagningen av ett 9-nukleotidssegment i 5′UTR för attacin_g3B och en synonym skillnad vid CDS-position 288 (det var mycket ovanligt att platserna för de två skillnaderna inkluderades i en avläsning med tanke på att längden på en avläsning är 301 nukleotider). Eftersom det bara fanns två skillnader och de inte var placerade i genomet ansåg vi att de var alleler av samma gen.

Attacin-like_g1 CDS var relativt lik attacin-like_g3 CDS med 9-10 skillnader. De var dock tillräckligt olika för att betraktas som oberoende loci. Attacin-like_g2 var den mest avvikande genen med 85-88 skillnader och ett extra kodon mot de andra. Endast sekvenserna av attacin-like_g1 och g2 fanns i genomet (kompletterande tabeller 2 och 7).

Annoteringen av blattelliciner var mycket mer komplicerad. Efter en preliminär analys observerades en lång CDS (> 250 kodoner) med en märklig struktur. Den började med den hydrofoba signalpeptiden vid N-terminus, följt av ett långt Glx-rikt segment i mitten (> 70 rester, huvudsakligen glutaminer och glutaminsyror) och en C-terminal Attacin-domän (fig. 1).

Upp till 13 mRNA-transkriptioner (som alla innehöll ofullständiga CDS-segment) som innehöll denna typ av sekvenser upptäcktes. De viktigaste orsakerna var att närvaron av flera blattellicingener och de långa Glx-rika regionerna drastiskt påverkade transkriptomets sammansättning. Detta skedde troligen under sammanställningen och annoteringen av B. germanica-genomet5,6.

Den 5′-sekvensen av en blattellicin-CDS användes som fråga för att med BLASTN identifiera de läsningar som härrörde från uttrycket av blattellicin-gener i körningen SRR6784710. Efter extraktion och sammansättning avslöjades fyra olika starter av blattellicingener, med ett intervall på 7 till 18 parvisa nukleotidskillnader i 5′ av mRNA. Dessa fyra mRNA-starter användes för att rekrytera de återstående gensekvenserna tills CDS-kompletteringen var klar.

Det mesta av CDS-sekvensen för blattellicin_g1 kunde identifieras i genomet, även om cirka 200 bp saknades på grund av två monteringsluckor (kompletterande tabeller 2 och 7). För de övriga kunde endast det första kodande exonet för blattellicin_g2 och g4 entydigt hänföras till ett specifikt contig-segment, även om träffar för andra segment av CDS också upptäcktes, men utan 100 % identitet. Ingen identisk sekvens till blattellicin_g3:s första exon kunde identifieras i genomet. Den mest troliga förklaringen är att de fyra blattellicingenerna finns i tandemkopior i genomet, men att deras speciella centrala upprepningsstruktur förhindrar korrekta sammansättningar i vare sig genomet eller transkriptomen, utom om man gör en manuell granskning av anpassningarna. Dessutom kan variationer i antalet kopior av Glx-kodoner i populationen inte uteslutas.

Vi upptäckte att blattelliciner uttrycktes på en högre nivå än attacinliknande gener, där blattellicin_g4 var det mest uttryckta i detta transkriptom (kompletterande tabell 7).

Logotyper för proteinjusteringarna för de tre attacinliknande och de fyra blattellicinproteinerna hos B. germanica avslöjade ett litet segment av negativt laddade aminosyror i Attacin-liknande proteiner och ett långt segment i Blattelliciner (fig. 3).

Figur 3
figure3

Logon av anpassningar och aminosyrasammansättning av Attacin-liknande och Blattellicinproteiner från B. germanica. (a) Logotyp för anpassningen av tre Attacin-liknande proteiner. (b) Logotyp för anpassningen av fyra Blattelliciner. (c) Genomsnittlig aminosyrasammansättning (%) av Attacin-liknande och Blattellicinproteiner.

Attacin mRNA:er upptäcktes hos de flesta Blattodea-arter (kompletterande tabell 4). Träffarna för blattelliciner omfattade inte Glx-regionen utan endast attacin_C-domänen. För att förstå den evolutionära historien för attacinliknande och blattellicin-gener i B. germanica extraherade vi attacin-transkriptioner från sju Blattellinae TSA-projekt26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Dessa transkriptomer kommer från vuxna hela kroppar utom I. deropeltiformis (utan information om utvecklingsstadium). De kan potentiellt täcka alla attacinsgener för varje genom, även om möjligheten att det finns gener utan uttryck inte kan uteslutas. Det största antalet attacingener var tre i E. sundaica. Två gener observerades i L. decipiens, Symploce sp. AD-2014 och A. kyotensis, även om en av kopiorna hos den förstnämnda var ofullständig och mycket divergent, troligen en pseudogen, medan de två kopiorna hos den sistnämnda var några kodoner ofullständiga i 5′-slutet av CDS. SRA-projektet granskades för läsningar som täcker CDS:s början, och på grundval av de läsningar som återfanns var en av dem komplett och i den andra saknades endast fyra kodoner. Den kvarvarande arten innehöll en enda genkopia. För att kunna användas som en outgroup extraherades dessutom den enda som upptäcktes i P. americana.

En fylogeni utfördes med en trimmad alignment (103 platser) (fig. 4). Den korta längden på sekvensanpassningen förhindrade höga bootstrapvärden i de flesta noder och försvårade att med fullständig säkerhet fastställa den evolutionära historien för denna genfamilj. Flera fakta kan dock observeras från fylogenin. För det första är attacinliknande gener den förfädrade gentypen. Vissa Blattellinae-arter innehåller endast en eller två gener. I fallet med kladen av B. germanica, E. sundaica, L. decipiens och Symploce sp. AD-2014, skedde dupliceringen av en anfäktande attacinliknande gen före deras divergens, vilket resulterade i uppkomsten av attacinliknande_g1- och g2-typerna. Även om L. decipiens attacin-like_g1 inte ingick i fylogenin, upptäcks en ofullständig och avvikande kopia av ett transkript av denna typ (GDYK01026461.1), som troligen härrör från en pseudogeniserad kopia.

Figur 4
figur4

Attacin-liknande och Blattellicin-protein-fylogeni i Blattellinae. (a) Maximum Likelihood-fylogeni av proteiner som innehåller Attacin_C-domänen i underfamiljen Blattellinae. Modell LG + G med fullständig borttagning. Anpassningen trimmades för att sammanfoga den N-terminala signalpeptiden plus den C-terminala Attacin_C-domänen (längd 103 platser). P. americana användes som outgroup. Bootstrap replikat 100. Bootstrap-värden som är mindre än 50 är dolda. Alla artnamn är förkortade (se koder i den högra topologin), utom Symploce sp. De utan förkortningar är proteiner från B. germanica. (b) Taxonomiska relationer enligt26.

Ursprunget av blattelliciner verkar vara mycket nytt. Även om det inte stöds av ett signifikant bootstrap-värde kan det tänkas att en förfäders gen av typen attacin-like_g2 duplicerades och att en av kopiorna, efter en snabb utveckling, genererade blattelliciner. Duplikationen ägde rum före divergensen mellan E. sundaica och B. germanica. Proteinet i den förstnämnda är uppenbarligen ett preblattellicin, med några av de nya egenskaperna hos blattellicinerna, såsom stor storlek (182 rester) och några extra aminosyror vid C-terminalen (RK i B. germanica och GKGK i E. sundaica). Det viktigaste kännetecknet för Blattelliciner, den långa poly-Glx-regionen, saknas dock, även om E. sundaicas pre-Blatellicin innehåller ett spår med sju glutaminsyror (med ett A i mitten) nära attacindomänens början.

AMP-uttryck i B. germanica

För att bestämma uttrycket av AMP-gener i B. germanica-vävnader, utvecklingsstadier eller kön, valde vi ut CDS för 17 AMP-genstyper (defensin_g2, g3, g7, g9, g11, g13 och g15; termicin_g1; drosomycin_g1, g5, g6, g11 och g12; attacin-liknande_g1 och g2; blattellicin_g1 och g4). De är tillräckligt olika för att undvika viktiga korsresultat bland de utvalda i samma grupp. På grund av den stora likheten i CDS för vissa gener från samma familj visade de erhållna värdena dock uttrycket för uppsättningar av gener med nästan identiska sekvenser (t.ex. de tre termicingenerna eller attacin-like_g1 och g3).

Expressionsnivåerna uppskattades med en BLASTN-strategi som antal träffar/Gb för SR-experimentet (kompletterande tabell 8). Värmekartanalysen av 28 helkropps SR-experiment som motsvarar prover från olika utvecklingsstadier (fig. 5) avslöjade flera slutsatser. För det första uppvisade vuxna honor ett högt uttryck av de flesta AMP-gener, även om det mest relevanta var det högsta uttrycket av blattellicin_g1 och g4. Vissa drosomyciner hade också ett högt uttryck, särskilt drosomycin_g5. Uttrycket av vissa gener var kopplat till utvecklingen (se t.ex. avsaknaden av uttryck av drosomycin g11 och g12 hos vuxna honor men högt uttryck hos nymfer). Bland defensinerna var defensin_g9 och g15 de mest uttryckta under de flesta utvecklingsstadier. Uttrycket av defensin g2 och g3 var högre hos vuxna honor än hos nymfer. Termicin_g1 uppvisade ett lågt uttryck hos nymfer och vuxna djur. Attacin-liknande gener uttrycktes också hos vuxna honor, med värden för attacin-liknande_g1 högre än för attacin-liknande_g2, vilket stämde överens med tidigare beskrivna resultat (kompletterande tabell 7), även med tanke på att de upptäckta träffarna för attacin-liknande_g1 troligen kommer från g1- och g3-gener.

Figur 5
figur5

Genuttryck av 17 AMP-gener i hela kroppar av B. germanica. Heatmap-analys som illustrerar förekomsten av transkript för 17 utvalda AMP-gener i 28 Sequence Read-experiment som motsvarar hela kroppar från olika utvecklingsstadier av B. germanica med angivande, i vissa fall, av provets kön. Värdena uppskattades som kvoten mellan antalet läsningar som ger en träff med ett e-värde som är mindre än 1,0E-40 (genom att använda de fullständiga CDS-sekvenserna som frågor i BLASTN-sökningar) och SR-experimentets storlek i Gb.

I allmänhet uppvisar AMP-gener en ökning av uttrycket när utvecklingen fortskrider mot vuxna former. Tyvärr har inget SR-experiment för uteslutande vuxna hanar deponerats i SRA-databasen, även om några prover från blandade hanar och honor rapporteras (kompletterande tabell 8).

Vi analyserade också uttrycket av dessa 17 AMP-gener i några transkriptomiska SR-experiment där proverna kommer från en enda vävnad, en del av kroppen eller en blandning av flera vävnader (kompletterande tabell 8). I allmänhet verkar drosomycin_g5 och defensin_g9 uttryckas i de flesta av dessa prover. I två experiment från vuxna manliga huvuden uttrycktes flera AMP-gener på en relevant nivå, däribland defensin_g7 och g9, drosomycin_g5 och attacin-like_g2. Generellt sett är uttrycksnivån i dessa prover mycket lägre än de som kommer från hela kroppar. Detta får oss att föreslå att andra delar av kroppen än fettkropp, äggstockar eller epidermis är ansvariga för de höga uttrycksnivåer som observerats i helkroppslevande vuxna honor (fig. 5).

Inget uttryck av blattellicin_g1 och blattellicin_g4 observerades i någon vävnad eller del av kroppsprovet, med undantag för ett nästan odetekterbart uttryck i ett prov av icke befruktade ägg, vilket troligen berodde på kontaminering med kvinnliga vävnader.

Lämna ett svar

Din e-postadress kommer inte publiceras.