Geni che codificano proteine con domini AMP nel genoma di B. germanica

Per identificare i geni annotati con funzioni AMP nel genoma di B. germanica6 sono state usate due strategie. La prima è stata la ricerca di nomi di prodotti che includono i termini difesa, drosomicina, tenecina, formicina, attacina e coleoptericina. La seconda è stata la ricerca dei domini Pfam annotati relativi ai peptidi antimicrobici. Essi sono inclusi in tre domini di clan del database Pfam: Knottin_1 (CL0054, superfamiglia knottin-like Scorpion toxin), Defensin (CL0075, superfamiglia Defensin/myotoxin-like) e Omega_toxin (CL0083, Omega toxin-like). I cinque domini Pfam rilevati erano: PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-thionin) e PF11415 (Toxin_37). Dopo la rimozione di C0J52_07645 (proteina Giant-lens) e C0J52_08617 (proteina putativa di difesa 3), perché non codificano AMPs, 24 geni codificanti sono stati mantenuti (Tabella supplementare 1). Sono stati inizialmente classificati nei seguenti gruppi: (i) proteine Defensin_2 (di seguito Defensin) (10 CDS, di cui due con l’annotazione parziale = 5′), (ii) Drosomicina (dominio gamma-thionin) (10 CDS), (iii) Termicina (dominio Toxin_37) (3 CDS) e (iv) il CDS C0J52_26498. Quest’ultimo, annotato come proteina ipotetica, era una proteina lunga (541 aminoacidi) con un dominio Attacin_C. Tuttavia, un’analisi dei domini meno rigorosa ha mostrato la potenziale presenza di due o tre domini aggiuntivi in questa proteina con somiglianze con Attacin_C e Coleoptericina (PF06286).

Tabella 1 Geni che codificano proteine con domini peptidici antimicrobici in B. germanica.

Al fine di rivedere i geni codificanti AMP annotati, diversi esperimenti RNA-Seq SRA di B. germanica (PRJNA389591) sono stati vagliati per la loro espressione usando BLASTN e diversi CDS AMP come query. Tra le corse SRA con abbondanza di letture AMP, la corsa RNA-Seq SRR6784710 (corpo intero, femmina adulta) è stato selezionato. La corsa SRR6784710 è stata assemblata con Trinity25 de novo ed è stato creato un database di trascrizioni.

Il genoma annotato è stato confrontato con il database di trascrizioni allo scopo di identificare i set completi di geni AMP per ogni classe. Dopo un’attenta revisione, abbiamo identificato 39 geni AMP (appartenenti a cinque tipi: defensine, termicine, drosomicine, attacins-like e blattellicine), che saranno descritti di seguito. Trentaquattro di loro erano distribuiti in dieci impalcature del genoma e cinque geni non erano posizionati (Tabella 1; Tabella supplementare 2).

Geni AMP defensine

Dieci CDS AMP annotati con un dominio Defensin sono stati utilizzati come query contro il database dei trascritti SRR6784710 con BLASTN (e-value = 1.0E-20). Tutti hanno prodotto risultati con almeno una trascrizione. In totale, sono stati identificati 16 diversi trascritti. L’abbondanza di trascrizione variava da valori TPM (trascrizioni per milione di trascrizioni) di 323,64-0,00.

Le informazioni sull’annotazione del genoma e le trascrizioni assemblate sono state confrontate (vedi Materiali & Metodi) identificando 16 geni di defensina (Tabelle supplementari 2 e 3). Hanno ricevuto i nomi di defensin_g1 a defensin_g16, con defensin_g1 e defensin_g16 compreso due isoforme alternative che non riguardano la regione codificante. Le isoforme di defensin_g1 i1 e i2 differivano per la rimozione o meno di un introne 3′-UTR, mentre le due isoforme di defensin_g16 differivano per l’uso di diversi segnali poly(A).

I geni della defensina (tranne defensin_g1 che era non posizionato) erano raggruppati in quattro scaffold. Il defensin_g1 non posizionato è stato incluso perché il programma ha identificato tre trascrizioni appartenenti al cluster TRINITY_DN1123_c0. Uno di loro (corrispondente a defensin_g2) potrebbe essere correlato con il gene C0J52_24001 (che codifica una proteina ipotetica), anche se abbiamo recuperato il frame di lettura corretto dopo il corretto posizionamento dell’inizio del secondo esone. Gli altri due trascritti hanno mostrato il 100% di identità ma differivano nello splicing alternativo di un introne 3′-UTR di 453-nt. Li abbiamo considerati isoforme di defensin_g1, un gene diverso di defensin_g2, perché differivano in sette nucleotidi (due nel CDS) più tre indel di dimensioni diverse nel 3′-UTR. Tuttavia, tale sequenza non è stata rilevata in nessuna sequenza scaffold.

Il trascritto altamente espresso (TRINITY_DN13842_c0_g1_i1) è stato apparentemente derivato dall’assemblaggio errato da TRINITY delle letture di quattro diversi loci nel genoma con sequenze quasi identiche (defensina_g3 a g6). Tre di loro sono stati precedentemente annotati con i qualificatori locus_tag C0J52_27569, C0J52_22338 e C0J52_24004. Tuttavia C0J52_27569 (gene = DEFI_4 nello scaffold PYGN01003429) era un tandem di due geni (defensina_g3 e defensina_g4). Una lacuna di assemblaggio che si sovrappone a defensin_g3 è probabilmente la ragione che spiega perché un singolo mRNA che espande entrambi i geni è stato annotato nel genoma.

I geni defensin_g7 e defensin_g8 mostravano sequenze CDS identiche ma con diverse differenze nei segmenti UTR delle sequenze di mRNA. Sono stati inseriti negli scaffold PYGN01002380 e PYGN01001185, rispettivamente. Solo uno di loro, defensin_g8, è stato precedentemente annotato come gene C0J52_22336.

Defensin_g9 corrisponde al gene C0J52_24005 che codifica la Phormicin, una proteina di 91 aminoacidi. L’analisi della trascrizione ha rivelato che la proteina codificata è più corta (71 aminoacidi) con una sequenza di peptide segnale di 20 aminoacidi al suo amino-terminale (vedi sotto). Defensin_g10 era anche un Phormicin situato in un diverso scaffold, ma solo il secondo esone era presente nel genoma, con il primo esone molto probabilmente posto in un gap di assemblaggio contiguo 1-kb.

Defensin_g11, g12 e g13 sono equivalenti ai geni precedentemente annotati (tabelle supplementari 2 e 3). Defensin_g14 è presente nello scaffold PYGN01001185, ma la maggior parte della sequenza del secondo esone è assente a causa di un gap di assemblaggio. Le sequenze CDS di defensin_g15 e C0J52_20459 erano identiche, ma l’analisi della trascrizione di defensin_g15 ha suggerito un mRNA a due esoni invece di quello a tre esoni di C0J52_20459.

Tutte le defensine hanno mostrato peptidi di segnale da 18 a 22 aminoacidi al N-terminale e il dominio PF01097 (Defensin_2) al C-terminale (vedi esempi di organizzazione del dominio in Fig. 1). La lunghezza della catena di aminoacidi variava da 63 a 81 residui con una media di 72 aminoacidi. Anche se alcune proteine Defensin erano identiche, il numero medio di differenze a coppie era alto (29 aminoacidi). Una filogenesi di massima verosimiglianza dedotta ha mostrato la loro distribuzione in sette cluster (Fig. 2a). Un logo dell’allineamento proteico delle proteine Defensin mostra la sequenza idrofobica N-terminale così come il dominio Defensin_2 (C-terminus) con i sei residui di cisteina conservati (Fig. 1 supplementare).

Figura 1
figura1

Organizzazione dei domini nei cinque tipi di AMPs di B. germanica. È mostrata una proteina di ogni classe. I quadrati arancioni sono peptidi di segnale. L’ovale rosso corrisponde ad una regione ricca di glutamina/acido glutammico. Gli ovali verdi sono domini Pfam-A PF03769 (Attacin_C). Gli ovali blu (dall’alto in basso) sono i domini Pfam-A PF01097 (Defensin_2), PF11415 (Toxin_37) e PF00304 (Gamma-thionin), rispettivamente.

Figura 2
figura2

Filogenie delle proteine Defensina e Drosomicina di B. germanica. (a) filogenesi di massima verosimiglianza di 18 proteine Defensin (derivato da trascrizioni di 16 geni). Modello WAG + I con delezione completa. Lunghezza di allineamento 57 siti. Bootstrap replica 100. Radicamento del punto medio. (b) filogenesi di massima verosimiglianza delle proteine Drosomycin. Modello Dayhoff + G con delezione completa. Lunghezza di allineamento 66 siti. Bootstrap replica 100. Radicamento del punto medio. I valori di bootstrap inferiori a 50 sono nascosti.

Un confronto tra i livelli di trascrizione dei 16 geni della defensina è stato stimato utilizzando una strategia BLASTN basata su ricerche BLASTN con nucleotidi 41-190 di ogni CDS. Tutte le sequenze 150-nt erano diverse in almeno un nucleotide, tranne defensin_g3 e g5 che erano identiche e il livello di trascrizione non poteva essere assegnato a un gene specifico (tabella 3 supplementare). Sulla base dei valori TPM stimati da TRINITY e i livelli di trascrizione stimati da questa strategia BLAST, abbiamo osservato che in questa corsa femminile adulta, defensin_g15 e g16 (che codificano le proteine Defensin-like), g9 e g10 (che codificano la Phormicin) e g1, g2, g3 e g5 (che codificano le proteine Tenecin-1) sono i geni di defensina più altamente espressi (Tabella supplementare 3).

Utilizzando una strategia TBLASTN, i trascritti delle defensine sono stati cercati in 45 specie che coprono l’ordine Blattodea26 (Tabella supplementare 4). Quarantaquattro specie contengono trascrizioni di defensine (da 1 a 9).

Geni della Termicina AMP

Tre geni che codificano piccole proteine con il dominio Pfam PF11415 sono annotati nel genoma (Tabella supplementare 1). Le ricerche BLASTN contro il database dei trascritti SRR6784710 hanno dato risultati con solo due trascrizioni molto simili. Il primo trascritto, TRINITY_DN10017_c0_g1_i1, ha mostrato una singola differenza con C0J52_00758 o C0J52_26761 nella sequenza CDS, ma diversi nella sequenza mRNA rimanente, suggerendo due geni indipendenti nel genoma. Il secondo trascritto, TRINITY_DN10017_c0_g2_i1, era identico al 100% sia al CDS che all’mRNA di C0J52_26762, indicando un terzo gene della termicina. Le tre proteine codificate sono quasi identiche con una singola differenza S/A al sito 13 (Fig. 1 supplementare). Un peptide idrofobico di segnale è previsto tra gli aminoacidi 1 e 19 e il dominio Toxin_37 (PF11415) tra gli aminoacidi 30 e 63 (Fig. 1). Sulla base dei valori TPM stimati da TRINITY e dei livelli di trascrizione stimati da BLASTN (un segmento di 150 bp che copre quattro siti polimorfici nel CDS della termicina), possiamo concludere che termicin_g3 (C0J52_26762) è il gene della termicina più altamente espresso (Tabella supplementare 5).

Gli mRNA della termicina sono stati rilevati in 29 specie di Blattodea appartenenti alle diverse famiglie tassonomiche (Tabella supplementare 4). La loro assenza era frequente nelle specie di Corydioidea, suggerendo la potenziale perdita di questo tipo di gene, anche se la mancanza di espressione in questi campioni non può essere esclusa.

Geni della dirosomicina AMP

Dieci geni che codificano proteine con il dominio Gamma-tionina (PF00304) sono annotati in tre scaffold del genoma di B. germanica. Queste proteine antifungine ricevono il nome di Drosomicine. Le ricerche BLASTN del CDS annotato contro il database dei trascritti SRR6784710 hanno identificato solo sei trascrizioni che includono il CDS completo e due trascrizioni insignificanti che coprono solo un segmento del CDS.

Il confronto tra il CDS annotato e quelli derivati da questi trascritti ha rivelato che solo tre geni annotati (C0J52_03170, C0J52_03171 e C0J52_12810) erano equivalenti a tre di questi trascritti (il primo con 2 differenze nucleotidiche). Sono stati annotati come drosomicina_g2, g3 e g5 (tabelle supplementari 2 e 6). Uno dei tre trascritti rimanenti, corrispondente a drosomycin_g6, potrebbe essere collocato nel genoma, con alcune differenze nucleotidiche, in un segmento non annotato. Infine, le sequenze degli altri due trascritti non sono state rilevate nel genoma, anche se le loro sequenze CDS erano molto simili a C0J52_03170 (con 6 e 8 differenze nucleotidiche). Queste differenze suggeriscono che non sono alleli ma geni indipendenti e li abbiamo annotati come drosomycin_g1 e g4 (tabelle supplementari 2 e 6).

D’altra parte, sei geni annotati con locus_tags, C0J52_12811-13 e C0J52_23105-08 non sono stati rilevati nel trascrittoma femminile adulto, ma sembrano essere espressi in altre fasi di sviluppo. Sono stati annotati come drosomicina_g7 a g13.

Una filogenesi delle 13 proteine della drosomicina ha mostrato che defensin_g6 era il gene più lontano, mentre gli altri 12 geni formavano due gruppi di sei geni ciascuno. I geni da drosomicina_g1 a g5, espressi nelle femmine adulte, più la drosomicina_g9 non espressa formavano un clade ben supportato mentre gli altri sei geni non espressi formavano l’altro (Fig. 2b).

Una stima del livello di trascrizione ha rivelato che drosomycin_g5 (C0J52_12810) era il gene con la più alta espressione, con l’86,1% delle letture di drosomycin per questo segmento derivate da esso (Tabella supplementare 6).

Dodici delle 13 proteine codificate erano lunghe 66 aminoacidi. Drosomycin_g6 era lunga 71 aminoacidi a causa della presenza al centro della proteina di aminoacidi aggiuntivi derivati da due indel (siti 25-26 e 36-38 dell’allineamento). Tra i residui osservati, la caratteristica più notevole nelle proteine codificate è la presenza di otto cisteine conservate27 (Fig. 1 supplementare). Tutte le Drosomicine mostrano un peptide idrofobico di segnale al N-terminale e il dominio PF00304 (Gamma-tionina) al C-terminale (Fig. 1).

Gli mRNA della Drosomicina sono stati rilevati in 24 specie di Blattodea ma erano assenti nelle specie di Isoptera e nel loro parente stretto Cryptocercus wrighti (Tabella supplementare 4). Lo stesso fatto è stato rilevato nel clade Corydioidea, suggerendo che le termiti e altri Blattodea possono aver perso questo tipo di gene AMP.

Geni AMP dell’attacina: attacin-like e blattellicins

Fino a quattro regioni con una certa somiglianza con il dominio Attacin_C (PF03769) sono stati rilevati nella regione di 47-kb che abbraccia il gene C0J52_26498 posto nel contig PYGN01001824. Dopo un’analisi preliminare del trascrittoma assemblato, sono state identificate più di dieci sequenze di mRNA. Esse assomigliano a sequenze complete o parziali di mRNA appartenenti a due tipi di geni di attacina. Il primo tipo comprende i geni che codificano le tipiche proteine Attacin (circa 120 aminoacidi) con un peptide segnale al N-terminale e il dominio Attacin_C al C-terminale, che sono stati chiamati geni attacin-like. Il secondo tipo era molto diverso, perché includeva un lungo tratto di residui di glutamina/acido glutammico. Poiché sembravano un’apparente innovazione evolutiva in B. germanica, li abbiamo chiamati blattellicins.

Tre trascrizioni attacin-like sono state rilevate nel trascrittoma (tabelle supplementari 2 e 7). Contenevano sequenze codificanti di 357-360 nucleotidi (118-119 aminoacidi codificati). Hanno ricevuto i nomi di attacin-like_g1 a attacin-like_g3. L’estrazione e l’assemblaggio delle letture per questi mRNA ha confermato la loro esistenza, ma ha suggerito la possibilità di un quarto gene. Attacin-like_g3A e attacin-like_g3B mostrano solo due differenze, la cancellazione di un segmento di 9 nucleotidi nel 5′UTR di attacin_g3B e una differenza sinonima in posizione CDS 288 (l’inclusione dei siti per le due differenze in una lettura era molto infrequente considerando che la lunghezza di una lettura è 301 nucleotidi). Poiché c’erano solo due differenze e non erano collocate nel genoma, abbiamo considerato che erano alleli dello stesso gene.

Il CDS di attacin-like_g1 era relativamente simile al CDS di attacin-like_g3 con 9-10 differenze. Tuttavia, erano sufficientemente diversi per essere considerati loci indipendenti. Attacin-like_g2 era il gene più divergente con 85-88 differenze e un codone extra rispetto agli altri. Solo le sequenze di attacin-like_g1 e g2 sono state localizzate nel genoma (tabelle supplementari 2 e 7).

L’annotazione delle blattellicine era molto più complicata. Dopo un’analisi preliminare, è stato osservato un lungo CDS (> 250 codoni) con una struttura curiosa. Iniziava con il peptide segnale idrofobico al N-terminale, seguito da un lungo segmento ricco di Glx nel mezzo (> 70 residui, principalmente glutamine e acidi glutammici) e un dominio Attacin C-terminale (Fig. 1).

Sono stati individuati fino a 13 trascritti di mRNA (tutti contenenti segmenti CDS incompleti) che coinvolgono questo tipo di sequenze. Le ragioni principali erano che la presenza di diversi geni della blattellicina e le lunghe regioni ricche di Glx hanno influenzato drasticamente l’assemblaggio del trascrittoma. Questo fatto è avvenuto probabilmente durante l’assemblaggio e l’annotazione del genoma di B. germanica5,6.

La sequenza 5′ di un CDS della blattellicina è stata usata come query per identificare con BLASTN le letture derivate dall’espressione dei geni della blattellicina nella corsa SRR6784710. Dopo l’estrazione e l’assemblaggio, sono stati rivelati quattro diversi inizi di geni della blattellicina, con una gamma di 7-18 differenze nucleotidiche a coppie nel 5′ degli mRNA. Questi quattro mRNA inizia sono stati utilizzati per reclutare le sequenze geniche rimanenti fino CDS completamento.

La maggior parte della sequenza CDS per blattellicin_g1 potrebbe essere identificato nel genoma, anche se circa 200-bp erano assenti a causa di due lacune di montaggio (tabelle supplementari 2 e 7). Per gli altri, solo il primo esone codificante di blattellicin_g2 e g4 potrebbe essere inequivocabilmente assegnato a un segmento specifico contig, anche se i successi per altri segmenti del CDS sono stati rilevati, ma senza 100% di identità. Nessuna sequenza identica al primo esone di blattellicin_g3 potrebbe essere identificata nel genoma. La spiegazione più fattibile è che i quattro geni della blattellicina sono presenti in copie in tandem nel genoma, ma la loro particolare struttura di ripetizione centrale impedisce assemblaggi corretti sia nel genoma che nei trascrittomi, tranne se viene eseguita l’ispezione manuale degli allineamenti. Inoltre, non si possono escludere variazioni nel numero di copie del codone Glx nella popolazione.

Abbiamo rilevato che le blattellicine sono state espresse ad un livello più alto dei geni attacin-like, con blattellicin_g4 che è il più altamente espresso in questo trascrittoma (Tabella supplementare 7).

I loghi degli allineamenti delle proteine per le tre Attacin-like e le quattro proteine Blattellicin di B. germanica ha rivelato un piccolo segmento di aminoacidi caricati negativamente nelle proteine Attacin-like e un lungo segmento nelle Blattellicine (Fig. 3).

Figura 3
figura3

Loghi degli allineamenti e composizione aminoacidica delle proteine Attacin-like e Blattellicin di B. germanica. (a) Logo dell’allineamento di tre proteine Attacin-like. (b) Logo dell’allineamento di quattro Blattellicins. (c) Composizione media degli amminoacidi (%) delle proteine Attacin-like e Blattellicin.

Attacin mRNA sono stati rilevati nella maggior parte delle specie Blattodea (Tabella 4 supplementare). Hits per blattellicins non ha coperto la regione Glx ma solo il dominio attacin_C. Per capire la storia evolutiva di attacin-come e geni blattellicin in B. germanica, abbiamo estratto i trascritti attacin da sette progetti TSA Blattellinae26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Questi trascrittomi provengono da corpi interi adulti tranne I. deropeltiformis (senza informazioni sullo stadio di sviluppo). Essi possono potenzialmente coprire tutti i geni di attacine per ogni genoma, anche se la possibilità di geni senza espressione non può essere scartata. Il maggior numero di geni di attacine era tre in E. sundaica. Due geni sono stati osservati in L. decipiens, Symploce sp. AD-2014 e A. kyotensis, anche se nel primo una delle copie era incompleta e molto divergente, probabilmente uno pseudogene, mentre nel secondo, le due copie erano pochi codoni incompleti a 5′-end del CDS. Il progetto SRA è stato vagliato per le letture che coprono l’inizio del CDS e, in base a quelle recuperate, una era completa e, nell’altra, mancavano solo quattro codoni. La specie rimanente conteneva una sola copia del gene. Inoltre, al fine di utilizzare come outgroup, è stato estratto l’unico individuato in P. americana.

È stata eseguita una filogenesi con un allineamento tagliato (103 siti) (Fig. 4). La breve lunghezza dell’allineamento di sequenza ha impedito alti valori di bootstrap nella maggior parte dei nodi e ha ostacolato la determinazione con completa fiducia della storia evolutiva di questa famiglia di geni. Tuttavia, diversi fatti sono osservati dalla filogenesi. In primo luogo, i geni attacin-like sono il tipo di gene ancestrale. Alcune specie di Blattellinae contengono solo uno o due geni. Nel caso del clade di B. germanica, E. sundaica, L. decipiens e Symploce sp. AD-2014, la duplicazione di un gene ancestrale attacin-like ha avuto luogo prima della loro divergenza, con conseguente comparsa dei tipi attacin-like_g1 e g2. Sebbene L. decipiens attacin-like_g1 non sia stato incluso nella filogenesi, viene rilevata una copia incompleta e divergente di un trascritto di questo tipo (GDYK01026461.1), probabilmente derivata da una copia pseudogenizzata.

Figura 4
figura4

Filogenia della proteina Attacin-like e Blattellicin nei Blattellinae. (a) Maximum Likelihood filogenesi delle proteine contenenti Attacin_C dominio nella sottofamiglia Blattellinae. Modello LG + G con delezione completa. Allineamento è stato tagliato per unire il peptide segnale N-terminale più il C-terminale attacin_C dominio (lunghezza 103 siti). P. americana è stato utilizzato come outgroup. Bootstrap replica 100. Valori di bootstrap inferiori a 50 sono nascosti. Tutti i nomi delle specie sono abbreviati (vedi codici nella topologia di destra), tranne Symploce sp. Quelli senza abbreviazioni sono proteine di B. germanica. (b) Relazioni tassonomiche secondo26.

L’origine delle blattellicine sembra essere molto recente. Anche se non supportato da un significativo valore di bootstrap, potenzialmente un gene ancestrale di tipo attacin-like_g2 è stato duplicato e una delle copie, dopo una rapida evoluzione, ha generato le blattellicine. La duplicazione ha avuto luogo prima della divergenza di E. sundaica e B. germanica. La proteina nella prima è apparentemente una pre-Blattellicina, includendo alcune delle nuove caratteristiche delle Blattellicine, come le grandi dimensioni (182 residui) e alcuni aminoacidi extra al C-terminale (RK in B. germanica e GKGK in E. sundaica). Tuttavia, la caratteristica principale delle Blattellicine, la lunga regione poly-Glx, è assente, anche se la pre-Blattellicina di E. sundaica include una traccia di sette acidi glutammici (con una A al centro) vicino all’inizio del dominio dell’attacina.

espressioneAMP in B. germanica

Per determinare l’espressione dei geni AMP nei tessuti, stadi di sviluppo o sessi di B. germanica, abbiamo selezionato il CDS di 17 tipi di geni AMP (defensina_g2, g3, g7, g9, g11, g13 e g15; termicina_g1; drosomicina_g1, g5, g6, g11 e g12; attacin-like_g1 e g2; blattellicina_g1 e g4). Sono sufficientemente diversi per evitare importanti risultati incrociati tra quelli selezionati dello stesso gruppo. Tuttavia, a causa dell’alta somiglianza del CDS di alcuni geni della stessa famiglia, i valori ottenuti hanno mostrato l’espressione dei gruppi di geni con sequenze quasi identiche (per esempio, i tre geni della termicina o attacin-like_g1 e g3).

I livelli di espressione sono stati stimati con una strategia BLASTN come numero di hit/Gb dell’esperimento SR (tabella 8 supplementare). L’analisi heatmap di 28 esperimenti SR corpo intero corrispondente a campioni da diversi stadi di sviluppo (Fig. 5) ha rivelato diverse conclusioni. In primo luogo, le femmine adulte visualizzato alta espressione della maggior parte dei geni AMP, anche se il più rilevante è stata la più alta espressione di blattellicin_g1 e g4. Anche alcune drosomicine erano altamente espresse, specialmente la drosomicina_g5. L’espressione di alcuni geni era legata allo sviluppo (vedi, per esempio, l’assenza di espressione della drosomicina g11 e g12 nelle femmine adulte ma l’alta espressione nelle ninfe). Tra le defensine, le più altamente espresse durante la maggior parte delle fasi di sviluppo erano defensin_g9 e g15. L’espressione della defensina g2 e g3 era più alta nelle femmine adulte che nelle ninfe. La termicina_g1 ha mostrato una bassa espressione nelle ninfe e negli adulti. I geni simili all’attacina erano espressi anche nelle femmine adulte, con valori di attacin-like_g1 superiori a quelli di attacin-like_g2, il che era in accordo con i risultati precedentemente descritti (Tabella 7 supplementare), considerando anche che gli hit rilevati per attacin-like_g1 probabilmente provengono dai geni g1 e g3.

Figura 5
figura5

Espressione genica di 17 geni AMP in corpi interi di B. germanica. Analisi Heatmap che illustra l’abbondanza di trascrizioni per 17 geni AMP selezionati in 28 esperimenti Sequence Read corrispondenti a corpi interi da diversi stadi di sviluppo di B. germanica con indicazione, in alcuni casi, del sesso del campione. I valori sono stati stimati come il quoziente tra il numero di letture che producono un hit con un e-value inferiore a 1.0E-40 (utilizzando le sequenze CDS complete come query nelle ricerche BLASTN) e la dimensione in Gb dell’esperimento SR.

In generale, i geni AMP mostrano un aumento dell’espressione man mano che lo sviluppo procede verso forme adulte. Sfortunatamente, nessun esperimento SR per maschi esclusivamente adulti è stato depositato nel database SRA, anche se alcuni campioni misti di maschi e femmine sono riportati (Tabella supplementare 8).

Abbiamo anche analizzato l’espressione di questi 17 geni AMP in alcuni esperimenti SR trascrittomici in cui i campioni provengono da un singolo tessuto, una parte del corpo o una miscela di diversi tessuti (Tabella supplementare 8). In generale, drosomicina_g5 e defensina_g9 sembrano essere espressi nella maggior parte di questi campioni. In due esperimenti da teste di maschi adulti, diversi geni AMP sono stati espressi ad un livello rilevante, tra cui defensin_g7 e g9, drosomycin_g5 e attacin-like_g2. In generale, il livello di espressione in questi campioni è molto inferiore a quelli provenienti dai corpi interi. Questo ci porta a proporre che altre parti del corpo diverse dal corpo grasso, dalle ovaie o dall’epidermide siano responsabili degli alti livelli di espressione osservati nelle femmine adulte del corpo intero (Fig. 5).

Nessuna espressione di blattellicina_g1 e blattellicina_g4 è stata osservata in nessun tessuto o parte del campione del corpo, tranne un’espressione quasi impercettibile in un campione di uova non fecondate, probabilmente a causa della contaminazione con tessuti femminili.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.