Genes que codifican proteínas con dominios AMP en el genoma de B. germanica

Para identificar los genes anotados con funciones AMP en el genoma de B. germanica6 se utilizaron dos estrategias. La primera fue la búsqueda de nombres de productos que incluyeran los términos defensa, drosomicina, tenecina, formicina, attacina y coleoptericina. La segunda fue la búsqueda de dominios Pfam anotados relacionados con péptidos antimicrobianos. Se incluyen en tres dominios del clan de la base de datos Pfam: Knottin_1 (CL0054, superfamilia Knottin similar a la toxina del escorpión), Defensin (CL0075, superfamilia Defensin/myotoxin-like) y Omega_toxin (CL0083, Omega toxin-like). Los cinco dominios Pfam detectados fueron PF11581 (Argos), PF03769 (Attacin_C), PF01097 (Defensin_2), PF00304 (Gamma-thionin) y PF11415 (Toxin_37). Tras eliminar C0J52_07645 (proteína Giant-lens) y C0J52_08617 (proteína putativa de defensa 3), porque no codifican AMPs, se conservaron 24 genes codificantes (Tabla suplementaria 1). Se clasificaron inicialmente en los siguientes grupos (i) Proteínas Defensin_2 (en adelante Defensin) (10 CDS, incluyendo dos con la anotación parcial = 5′), (ii) Drosomicina (dominio Gamma-thionin) (10 CDS), (iii) Termicina (dominio Toxin_37) (3 CDS) y (iv) el CDS C0J52_26498. Esta última, anotada como proteína hipotética, era una proteína larga (541 aminoácidos) con un dominio Attacin_C. Sin embargo, un análisis de dominios menos estricto mostró la posible presencia de dos o tres dominios adicionales en esta proteína con similitudes con Attacin_C y Coleoptericin (PF06286).

Tabla 1 Genes que codifican proteínas con dominios de péptidos antimicrobianos en B. germanica.

Para revisar los genes codificantes de AMP anotados, se examinaron varios experimentos de SRA de RNA-Seq de B. germanica (PRJNA389591) en busca de su expresión utilizando BLASTN y varios CDS de AMP como consultas. Entre las ejecuciones de SRA con abundancia de lecturas de AMP, se seleccionó la ejecución de RNA-Seq SRR6784710 (cuerpo entero, hembra adulta). El experimento SRR6784710 se ensambló con Trinity25 de novo y se creó una base de datos de transcripciones.

El genoma anotado se comparó con la base de datos de transcripciones con el objetivo de identificar los conjuntos completos de genes AMP para cada clase. Tras una cuidadosa revisión, se identificaron 39 genes de AMP (pertenecientes a cinco tipos: defensinas, termicinas, drosomicinas, attacinas y blattellicinas), que se describirán a continuación. Treinta y cuatro de ellos estaban distribuidos en diez andamios genómicos y cinco genes no estaban colocados (Tabla 1; Tabla Suplementaria 2).

Genes de AMP de defensinas

Diez CDS de AMP anotados con un dominio de defensinas se utilizaron como consultas contra la base de datos de transcritos SRR6784710 con BLASTN (valor e = 1,0E-20). Todos ellos produjeron coincidencias con al menos un transcrito. En total, se identificaron 16 transcritos diferentes. La abundancia de los transcritos osciló entre los valores de TPM (transcritos por millón de transcritos) de 323,64-0,00.

Se comparó la información sobre la anotación del genoma y los transcritos ensamblados (véase Materiales & Métodos) identificando 16 genes de defensina (Tablas suplementarias 2 y 3). Recibieron los nombres de defensin_g1 a defensin_g16, con defensin_g1 y defensin_g16 incluyendo dos isoformas alternativas que no afectan a la región de codificación. Las isoformas i1 e i2 de defensin_g1 diferían en la eliminación o no de un intrón 3′-UTR, mientras que las dos isoformas de defensin_g16 diferían en el uso de diferentes señales de poli(A).

Los genes de defensin_g1 (excepto defensin_g1 que estaba sin colocar) se agruparon en cuatro andamios. El defensin_g1 no colocado se incluyó porque el programa identificó tres transcritos pertenecientes al cluster TRINITY_DN1123_c0. Uno de ellos (correspondiente a defensin_g2) podría estar relacionado con el gen C0J52_24001 (que codifica una proteína hipotética), aunque recuperamos el marco de lectura correcto tras la colocación correcta del inicio del segundo exón. Los otros dos transcritos mostraban un 100% de identidad, pero diferían en el empalme alternativo de un intrón 3′-UTR de 453 nts. Los consideramos isoformas de la defensina_g1, un gen diferente de la defensina_g2, porque diferían en siete nucleótidos (dos en el CDS) más tres indels de diferente tamaño en el 3′-UTR. Sin embargo, dicha secuencia no se detectó en ninguna secuencia del andamio.

El transcrito de alta expresión (TRINITY_DN13842_c0_g1_i1) se derivó aparentemente del ensamblaje incorrecto por parte de TRINITY de las lecturas de cuatro loci diferentes en el genoma con secuencias casi idénticas (defensina_g3 a g6). Tres de ellos estaban previamente anotados con los calificadores locus_tag C0J52_27569, C0J52_22338 y C0J52_24004. Sin embargo, C0J52_27569 (gen = DEFI_4 en el andamio PYGN01003429) era un tándem de dos genes (defensin_g3 y defensin_g4). Una brecha de ensamblaje que se solapa con defensin_g3 es probablemente la razón que explica por qué un único ARNm que expande ambos genes fue anotado en el genoma.

Los genes defensin_g7 y defensin_g8 mostraron secuencias CDS idénticas pero con varias diferencias en los segmentos UTR de las secuencias del ARNm. Se colocaron en los andamios PYGN01002380 y PYGN01001185, respectivamente. Sólo uno de ellos, defensin_g8, fue anotado previamente como gen C0J52_22336.

Defensin_g9 corresponde al gen C0J52_24005 que codifica Phormicin, una proteína de 91 aminoácidos. El análisis de la transcripción reveló que la proteína codificada es más corta (71 aminoácidos) con una secuencia de péptido señal de 20 aminoácidos en su amino-terminal (véase más abajo). Defensin_g10 era también un Phormicin localizado en un andamio diferente, pero sólo el segundo exón estaba presente en el genoma, con el primer exón muy probablemente colocado en un hueco de ensamblaje contiguo de 1kb.

Defensin_g11, g12 y g13 son equivalentes a los genes previamente anotados (Tablas Suplementarias 2 y 3). Defensin_g14 está presente en el andamio PYGN01001185, pero la mayor parte de la secuencia del segundo exón está ausente debido a una brecha de ensamblaje. Las secuencias CDS de defensin_g15 y C0J52_20459 eran idénticas, pero el análisis de la transcripción de defensin_g15 sugería un ARNm de dos exones en lugar del C0J52_20459 de tres exones.

Todas las Defensinas mostraban péptidos señal de 18 a 22 aminoácidos en el N-terminal y el dominio PF01097 (Defensin_2) en el C-terminal (véanse ejemplos de organizaciones de dominios en la Fig. 1). La longitud de la cadena de aminoácidos oscilaba entre 63 y 81 residuos, con una media de 72 aminoácidos. Aunque algunas proteínas Defensin eran idénticas, el número medio de diferencias entre pares era elevado (29 aminoácidos). Una filogenia de máxima verosimilitud inferida mostró su distribución en siete clusters (Fig. 2a). Un logotipo del alineamiento proteico de las proteínas Defensin muestra la secuencia hidrofóbica N-terminal así como el dominio Defensin_2 (C-terminal) con los seis residuos de cisteína conservados (Supplementary Fig. 1).

Figura 1
figura1

Organización de los dominios en los cinco tipos de AMPs de B. germanica. Se muestra una proteína de cada clase. Los cuadrados naranjas son péptidos señal. El óvalo rojo corresponde a una región rica en glutamina/ácido glutámico. Los óvalos verdes son los dominios Pfam-A PF03769 (Attacin_C). Los óvalos azules (de arriba a abajo) son los dominios Pfam-A PF01097 (Defensin_2), PF11415 (Toxin_37) y PF00304 (Gamma-thionin), respectivamente.

Figura 2
figura2

Filogenias de las proteínas Defensina y Drosomicina de B. germanica. (a) Filogenia de máxima verosimilitud de 18 proteínas de Defensina (derivadas de los transcritos de 16 genes). Modelo WAG + I con deleción completa. Longitud de la alineación 57 sitios. Repeticiones Bootstrap 100. Punto medio de enraizamiento. (b) Filogenia de máxima verosimilitud de las proteínas de la Drosomicina. Modelo Dayhoff + G con deleción completa. Longitud de la alineación 66 sitios. Repeticiones Bootstrap 100. Enraizamiento en el punto medio. Los valores de Bootstrap menores de 50 están ocultos.

Se estimó una comparación entre los niveles de transcripción de los 16 genes de defensina utilizando una estrategia BLASTN basada en búsquedas BLASTN con los nucleótidos 41-190 de cada CDS. Todas las secuencias de 150 nt eran diferentes en, al menos, un nucleótido, excepto defensin_g3 y g5 que eran idénticas y el nivel de transcripción no pudo ser asignado a un gen específico (Tabla Suplementaria 3). Basándonos en los valores de TPM estimados por TRINITY y en los niveles de transcripción estimados por esta estrategia BLAST, observamos que en esta corrida de hembras adultas, defensin_g15 y g16 (que codifican proteínas tipo Defensin), g9 y g10 (que codifican Phormicin) y g1, g2, g3 y g5 (que codifican proteínas Tenecin-1) son los genes de defensina más expresados (Tabla Suplementaria 3).

Usando una estrategia TBLASTN, se buscaron transcritos de defensinas en 45 especies que cubren el orden Blattodea26 (Tabla Suplementaria 4). Cuarenta y cuatro especies contienen transcritos de defensinas (rango de 1 a 9).

Genes AMP de la Termicina

Tres genes que codifican pequeñas proteínas con el dominio Pfam PF11415 están anotados en el genoma (Tabla Suplementaria 1). Las búsquedas BLASTN contra la base de datos de transcripciones SRR6784710 dieron resultados con sólo dos transcripciones muy similares. El primer transcrito, TRINITY_DN10017_c0_g1_i1, presentaba una única diferencia con C0J52_00758 o C0J52_26761 en la secuencia CDS, pero varias en el resto de la secuencia de ARNm, lo que sugiere la existencia de dos genes independientes en el genoma. El segundo transcrito, TRINITY_DN10017_c0_g2_i1, era 100% idéntico tanto al CDS como al mRNA de C0J52_26762, lo que indica un tercer gen de termicina. Las tres proteínas codificadas son casi idénticas con una única diferencia S/A en el sitio 13 (Fig. Suplementaria 1). Se predice un péptido hidrofóbico señal entre los aminoácidos 1 y 19 y el dominio Toxin_37 (PF11415) entre los aminoácidos 30 y 63 (Fig. 1). Basándonos en los valores de TPM estimados por TRINITY y en los niveles de transcripción estimados por BLASTN (un segmento de 150 pb que cubre cuatro sitios polimórficos en el CDS de la termicina), podemos concluir que termicin_g3 (C0J52_26762) es el gen de la termicina más expresado (Tabla suplementaria 5).

Se detectaron ARNm de termicina en 29 especies de Blattodea pertenecientes a las diferentes familias taxonómicas (Tabla suplementaria 4). Su ausencia fue frecuente en especies de Corydioidea, lo que sugiere la posible pérdida de este tipo de genes, aunque no se puede descartar la falta de expresión en estas muestras.

Genes AMP de la drosomicina

Diez genes que codifican proteínas con el dominio Gamma-thionin (PF00304) están anotados en tres andamios del genoma de B. germanica. Estas proteínas antifúngicas reciben el nombre de Drosomicinas. Las búsquedas BLASTN del CDS anotado contra la base de datos de transcripciones SRR6784710 identificaron sólo seis transcripciones que incluyen el CDS completo y dos transcripciones insignificantes que cubren sólo un segmento del CDS.

La comparación de los CDS anotados y los derivados de estos transcritos reveló que sólo tres genes anotados (C0J52_03170, C0J52_03171 y C0J52_12810) eran equivalentes a tres de estos transcritos (el primero con 2 diferencias de nucleótidos). Se anotaron como drosomicina_g2, g3 y g5 (Tablas suplementarias 2 y 6). Uno de los tres transcritos restantes, correspondiente a drosomycin_g6, pudo situarse en el genoma, con algunas diferencias de nucleótidos, en un segmento no anotado. Por último, las secuencias de los otros dos transcritos no se detectaron en el genoma, aunque sus secuencias CDS eran muy similares a C0J52_03170 (con 6 y 8 nucleótidos de diferencia). Estas diferencias sugieren que no son alelos sino genes independientes y los anotamos como drosomicina_g1 y g4 (Tablas Suplementarias 2 y 6).

Por otro lado, seis genes anotados con locus_tags, C0J52_12811-13 y C0J52_23105-08 no se detectaron en el transcriptoma de la hembra adulta, pero parecen expresarse en otras etapas de desarrollo. Se anotaron como drosomycin_g7 a g13.

Una filogenia de las 13 proteínas de Drosomycin mostró que defensin_g6 era el gen más distante, mientras que los otros 12 genes formaban dos grupos de seis genes cada uno. Los genes drosomycin_g1 a g5, expresados en las hembras adultas, más el no expresado drosomycin_g9 formaron un clado bien soportado mientras que los otros seis genes no expresados formaron el otro (Fig. 2b).

Una estimación del nivel de transcripción reveló que drosomycin_g5 (C0J52_12810) era el gen con mayor expresión, con el 86,1% de las lecturas de drosomycin para este segmento derivadas de él (Tabla suplementaria 6).

Doce de las 13 proteínas codificadas tenían una longitud de 66 aminoácidos. Drosomycin_g6 tenía una longitud de 71 aminoácidos debido a la presencia en el centro de la proteína de aminoácidos adicionales derivados de dos indels (sitios 25-26 y 36-38 de la alineación). Entre los residuos observados, la característica más notable en las proteínas codificadas es la presencia de ocho cisteínas conservadas27 (Fig. Suplementaria 1). Todas las Drosomicinas muestran un péptido hidrofóbico de señal en el N-terminal y el dominio PF00304 (Gamma-tionina) en el C-terminal (Fig. 1).

Se detectaron ARNm de Drosomicina en 24 especies de Blattodea pero estuvieron ausentes en especies de Isoptera y su pariente cercano Cryptocercus wrighti (Tabla Suplementaria 4). El mismo hecho se detectó en el clado Corydioidea, lo que sugiere que las termitas y otros Blattodea pueden haber perdido este tipo de gen AMP.

Genes AMP de la atacina: attacin-like y blattellicins

Se detectaron hasta cuatro regiones con cierta similitud con el dominio Attacin_C (PF03769) en la región de 47 kb que abarca el gen C0J52_26498 situado en el contig PYGN01001824. Tras un análisis preliminar del transcriptoma ensamblado, se identificaron más de diez secuencias de ARNm. Se trata de secuencias completas o parciales de ARNm pertenecientes a dos tipos de genes de attacina. El primer tipo incluye genes que codifican proteínas Attacin típicas (alrededor de 120 aminoácidos) con un péptido señal en el N-terminal y el dominio Attacin_C en el C-terminal, que se denominaron genes attacin-like. El segundo tipo era muy diferente, porque incluía un largo tramo de residuos de glutamina/ácido glutámico. Dado que parecían una aparente innovación evolutiva en B. germanica, los denominamos blattellicinas.

Se detectaron tres transcritos de tipo attacina en el transcriptoma (Tablas suplementarias 2 y 7). Contenían secuencias codificantes de 357-360 nucleótidos (118-119 aminoácidos codificados). Recibieron los nombres de attacin-like_g1 a attacin-like_g3. La extracción y el ensamblaje de las lecturas de estos ARNm confirmaron su existencia, pero sugirieron la posibilidad de un cuarto gen. Attacin-like_g3A y attacin-like_g3B presentan sólo dos diferencias, la supresión de un segmento de 9 nucleótidos en el 5′UTR de attacin_g3B y una diferencia sinónima en la posición 288 del CDS (la inclusión de los sitios de las dos diferencias en una lectura fue muy infrecuente teniendo en cuenta que la longitud de una lectura es de 301 nucleótidos). Debido a que sólo había dos diferencias y no estaban colocadas en el genoma, consideramos que eran alelos del mismo gen.

El CDS de attacin-like_g1 era relativamente similar al CDS de attacin-like_g3 con 9-10 diferencias. Sin embargo, eran lo suficientemente diferentes como para ser considerados loci independientes. Attacin-like_g2 fue el gen más divergente con 85-88 diferencias y un codón extra respecto a los demás. Sólo las secuencias de attacin-like_g1 y g2 se localizaron en el genoma (Tablas Suplementarias 2 y 7).

La anotación de las blattellicinas fue mucho más complicada. Tras un análisis preliminar, se observó un CDS largo (> 250 codones) con una curiosa estructura. Comenzaba con el péptido señal hidrofóbico en el N-terminal, seguido de un largo segmento rico en Glx en el centro (> 70 residuos, principalmente glutaminas y ácidos glutámicos) y un dominio Attacin en el C-terminal (Fig. 1).

Se detectaron hasta 13 transcritos de ARNm (todos ellos con segmentos de CDS incompletos) que incluían este tipo de secuencias. Las razones principales fueron que la presencia de varios genes de blattellicina y las largas regiones ricas en Glx afectaron drásticamente al ensamblaje del transcriptoma. Este hecho probablemente tuvo lugar durante el ensamblaje y la anotación del genoma de B. germanica5,6.

La secuencia 5′ de un CDS de blattellicina se utilizó como query para identificar con BLASTN aquellas lecturas derivadas de la expresión de los genes de blattellicina en el run SRR6784710. Tras la extracción y el ensamblaje, se revelaron cuatro inicios diferentes de genes de blattellicina, con un rango de 7 a 18 diferencias de nucleótidos por pares en los 5′ de los ARNm. Estos cuatro inicios de ARNm se utilizaron para reclutar las restantes secuencias génicas hasta completar la CDS.

La mayor parte de la secuencia CDS de blattellicin_g1 pudo identificarse en el genoma, aunque alrededor de 200 pb estaban ausentes debido a dos lagunas de ensamblaje (Tablas Suplementarias 2 y 7). Para los demás, sólo el primer exón codificante de blattellicin_g2 y g4 pudo asignarse inequívocamente a un segmento de contig específico, aunque también se detectaron coincidencias para otros segmentos de la CDS, pero sin una identidad del 100%. No se pudo identificar en el genoma ninguna secuencia idéntica al primer exón de blattellicin_g3. La explicación más factible es que los cuatro genes de blattellicina están presentes en copias en tándem en el genoma, pero su especial estructura de repetición central impide ensamblajes correctos tanto en el genoma como en los transcriptomas, excepto si se realiza una inspección manual de los alineamientos. Además, no se pueden descartar variaciones en el número de copias del codón Glx en la población.

Detectamos que las blattellicinas se expresaban a un nivel más alto que los genes similares a la attacina, siendo la blattellicina_g4 la más expresada en este transcriptoma (Tabla Suplementaria 7).

Los logos de los alineamientos de proteínas para las tres proteínas similares a la attacina y las cuatro blattellicinas de B. germanica revelaron un pequeño segmento de aminoácidos cargados negativamente en las proteínas similares a la Attacina y un largo segmento en las Blattellicinas (Fig. 3).

Figura 3
figura3

Logos de los alineamientos y composición de aminoácidos de las proteínas similares a la Attacina y Blattellicina de B. germanica. (a) Logotipo de la alineación de tres proteínas Attacin-like. (b) Logotipo de la alineación de cuatro Blattellicinas. (c) Composición media de aminoácidos (%) de las proteínas Attacin-like y Blattellicin.

Se detectaron ARNm de Attacin en la mayoría de las especies de Blattodea (Tabla Suplementaria 4). Los resultados de las blattellicinas no cubrieron la región Glx, sino sólo el dominio attacin_C. Para entender la historia evolutiva de los genes de attacina y blattellicina en B. germanica, extrajimos los transcritos de attacina de siete proyectos TSA de Blattellinae26 (Symploce sp. AD-2014, Loboptera decipiens, Episymploce sundaica, Ischnoptera deropeltiformis, Paratemnopteryx couloniana, Lobopterella dimidiatipes, Asiablatta kyotensis). Estos transcriptomas proceden de cuerpos enteros de adultos, excepto I. deropeltiformis (sin información sobre el estado de desarrollo). Pueden cubrir potencialmente todos los genes de attacinas para cada genoma, aunque no se puede descartar la posibilidad de que haya genes sin expresión. El mayor número de genes de attacinas fue de tres en E. sundaica. Se observaron dos genes en L. decipiens, Symploce sp. AD-2014 y A. kyotensis, aunque en el primero una de las copias era incompleta y muy divergente, probablemente un pseudogén, mientras que en el segundo, las dos copias eran unos pocos codones incompletos en el extremo 5′ de la CDS. En el proyecto SRA se buscaron lecturas que cubrieran el inicio de la CDS y, según las recuperadas, una estaba completa y, en la otra, sólo faltaban cuatro codones. La especie remanente contenía una sola copia del gen. Además, para utilizarlo como outgroup, se extrajo el único detectado en P. americana.

Se realizó una filogenia con un alineamiento recortado (103 sitios) (Fig. 4). La corta longitud del alineamiento de las secuencias impidió obtener altos valores de bootstrap en la mayoría de los nodos y dificultó determinar con total confianza la historia evolutiva de esta familia de genes. Sin embargo, se observan varios hechos a partir de la filogenia. En primer lugar, los genes tipo attacina son el tipo de gen ancestral. Algunas especies de Blattellinae contienen sólo uno o dos genes. En el caso del clado de B. germanica, E. sundaica, L. decipiens y Symploce sp. AD-2014, la duplicación de un gen ancestral similar a la attacina tuvo lugar antes de su divergencia, dando lugar a la aparición de los tipos attacina_g1 y g2. Aunque L. decipiens attacin-like_g1 no se incluyó en la filogenia, se detecta una copia incompleta y divergente de un transcrito de este tipo (GDYK01026461.1), probablemente derivado de una copia pseudogenizada.

Figura 4
figura4

Filogenia de las proteínas tipo attacina y blattellicina en Blattellinae. (a) Filogenia de máxima verosimilitud de las proteínas que contienen el dominio Attacin_C en la subfamilia Blattellinae. Modelo LG + G con deleción completa. El alineamiento se recortó para unir el péptido señal N-terminal más el dominio attacin_C C-terminal (longitud 103 sitios). Se utilizó P. americana como grupo externo. Repeticiones Bootstrap 100. Los valores de Bootstrap inferiores a 50 están ocultos. Todos los nombres de las especies están abreviados (véanse los códigos en la topología de la derecha), excepto Symploce sp. Las que no llevan abreviatura son proteínas de B. germanica. (b) Relaciones taxonómicas según26.

El origen de las blattellicinas parece ser muy reciente. Aunque no está apoyado por un valor bootstrap significativo, potencialmente un gen ancestral del tipo attacin_g2 se duplicó y una de las copias, tras una rápida evolución, generó las blattellicinas. La duplicación tuvo lugar antes de la divergencia de E. sundaica y B. germanica. La proteína de la primera es aparentemente una pre-Blattellicina, que incluye algunas de las nuevas características de las Blattellicinas, como su gran tamaño (182 residuos) y unos pocos aminoácidos extra en el C-terminal (RK en B. germanica y GKGK en E. sundaica). Sin embargo, la principal característica de las Blattellicinas, la larga región poli-Glx, está ausente, aunque la pre-Blattellicina de E. sundaica incluye una pista de siete ácidos glutámicos (con una A en el centro) cerca del comienzo del dominio de la attacina.

Expresión de AMP en B. germanica

Para determinar la expresión de los genes AMP en los tejidos, estadios de desarrollo o sexos de B. germanica, seleccionamos las CDS de 17 tipos de genes AMP (defensin_g2, g3, g7, g9, g11, g13 y g15; termicin_g1; drosomycin_g1, g5, g6, g11 y g12; attacin-like_g1 y g2; blattellicin_g1 y g4). Son lo suficientemente diferentes como para evitar resultados cruzados importantes entre los seleccionados del mismo grupo. Sin embargo, debido a la gran similitud de los CDS de algunos genes de la misma familia, los valores obtenidos mostraron la expresión de los conjuntos de genes con secuencias casi idénticas (por ejemplo, los tres genes de termicina o attacin-like_g1 y g3).

Los niveles de expresión se estimaron con una estrategia BLASTN como número de aciertos/Gb del experimento SR (Tabla suplementaria 8). El análisis del mapa de calor de 28 experimentos de SR de cuerpo entero correspondientes a muestras de diferentes etapas de desarrollo (Fig. 5) reveló varias conclusiones. En primer lugar, las hembras adultas mostraron una alta expresión de la mayoría de los genes AMP, aunque la más relevante fue la mayor expresión de blattellicin_g1 y g4. Algunas drosomicinas también fueron altamente expresadas, especialmente, la drosomicina_g5. La expresión de algunos genes estaba relacionada con el desarrollo (véase, por ejemplo, la ausencia de expresión de la drosomicina g11 y g12 en las hembras adultas, pero la alta expresión en las ninfas). Entre las defensinas, las más expresadas durante la mayoría de los estadios de desarrollo fueron la defensina_g9 y la g15. La expresión de las defensinas g2 y g3 fue mayor en las hembras adultas que en las ninfas. La termicina_g1 mostró una baja expresión en ninfas y adultos. Los genes similares a la atacina también se expresaron en las hembras adultas, siendo los valores de attacin-like_g1 más altos que los de attacin-like_g2, lo que concuerda con los resultados descritos anteriormente (Tabla Suplementaria 7), considerando también que las coincidencias detectadas para attacin-like_g1 provienen probablemente de los genes g1 y g3.

Figura 5
figura5

Expresión génica de 17 genes AMP en cuerpos enteros de B. germanica. Análisis de mapa de calor que ilustra la abundancia de transcritos para 17 genes AMP seleccionados en 28 experimentos de lectura de secuencias correspondientes a cuerpos enteros de diversas etapas de desarrollo de B. germanica con indicación, en algunos casos, del sexo de la muestra. Los valores se estimaron como el cociente entre el número de lecturas que produjeron una coincidencia con un valor e inferior a 1,0E-40 (utilizando las secuencias CDS completas como consultas en las búsquedas BLASTN) y el tamaño en Gb del experimento SR.

En general, los genes AMP muestran un aumento de la expresión a medida que el desarrollo progresa hacia las formas adultas. Desgraciadamente, no se ha depositado en la base de datos de la SRA ningún experimento de RS para machos exclusivamente adultos, aunque se informa de algunas muestras mixtas de machos y hembras (Tabla suplementaria 8).

También hemos analizado la expresión de estos 17 genes AMP en algunos experimentos transcriptómicos de RS en los que las muestras proceden de un solo tejido, de una parte del cuerpo o de una mezcla de varios tejidos (Tabla suplementaria 8). En general, drosomycin_g5 y defensin_g9 parecen expresarse en la mayoría de estas muestras. En dos experimentos de cabezas de machos adultos, varios genes AMP se expresaron a un nivel relevante, incluyendo defensin_g7 y g9, drosomycin_g5 y attacin-like_g2. En general, el nivel de expresión en estas muestras es mucho menor que el de las procedentes de cuerpos enteros. Esto nos lleva a proponer que otras partes del cuerpo distintas del cuerpo graso, los ovarios o la epidermis son responsables de los altos niveles de expresión observados en las hembras adultas de cuerpo entero (Fig. 5).

No se observó ninguna expresión de blattellicin_g1 y blattellicin_g4 en ningún tejido o parte de la muestra corporal, excepto una expresión casi indetectable en una muestra de huevos no fecundados, probablemente debido a la contaminación con tejidos femeninos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.