Queries

SNPper oferece várias formas diferentes de recuperação de SNPs, reflectindo as diferentes finalidades para as quais os SNPs podem ser usados. No caso mais simples, os SNPs podem ser recuperados especificando um ou mais identificadores rs ou ss, se conhecidos. Outra consulta comum recupera um conjunto de SNPs contíguos pertencentes a uma região específica de um cromossoma, especificada através de uma faixa de posição absoluta ou através do nome de uma banda citogenética. Para apoiar estudos orientados para o género, o SNPper pode gerar o conjunto de SNPs sobre ou em torno de um gene (até uma distância máxima especificada pelo utilizador), ou um conjunto de genes. Os genes podem ser especificados usando seu nome HUGO, ou através de seus identificadores Genbank, Locuslink, OMIM, ou Unigene. Um conjunto de genes de interesse, por sua vez, pode ser especificado por posição (ou seja, todos os genes em uma região cromossômica), ou através de uma classe GeneOntologia. Esta última característica permite estudar conjuntos de SNPs potencialmente associados a um processo biológico de interesse, ao invés de serem ligados por posição.

Em todos os casos, o resultado de uma consulta é um SNPset, uma estrutura de dados que contém uma coleção de SNPs. Existem diferentes tipos de SNPset, de acordo com o tipo de consulta que os produziu, e diferentes operações são definidas sobre eles. Por exemplo, para um SNPset contendo SNPs contíguos faz sentido medir a densidade do SNP, e SNPper fornece uma função para reduzir o número de SNPs que ele contém, mantendo um espaçamento uniforme. Para um SNPset gerado a partir de um conjunto de genes, esta operação não faria sentido (uma vez que os SNPs podem estar espalhados em diferentes cromossomas) e, portanto, não está disponível. Em geral, um SNPset representa um conjunto de SNPs que foi produzido por uma única consulta, e que pode ser manipulado e analisado como um todo. Os SNPsets só são visíveis para o usuário que os gerou, e são estruturas de dados persistentes: são armazenados no servidor enquanto são utilizados, e são automaticamente removidos após um período de tempo suficiente desde que foram acessados pela última vez. O usuário também pode escolher salvar um SNPset, neste caso ele estará disponível em sessões futuras.

Visualização de SNP

SNPper fornece múltiplas formas de exibição de SNPs através de sua interface web. Para começar, cada SNP é descrito individualmente em uma página que exibe dados gerais (identificadores SNP, posição, alelos, status de validação), sua lista de submetedores, a lista de genes aos quais pertence, sua freqüência em diferentes populações (consistindo do tamanho da amostra e das freqüências dos alelos maior e menor), se disponíveis, e a lista de domínios de proteínas em que o SNP se enquadra, se houver. Os SNPs que pertencem a um gene podem ser exibidos no contexto da sequência de DNA correspondente ou (para codificação de SNPs) sequência de aminoácidos. Em ambos os casos, a posição SNP é destacada e uma janela popup é usada para exibir informações sobre ela (nome, posição, alelos). A Figura 1 mostra uma sequência genética anotada contendo SNPs, e a Figura 2 mostra a página de informações detalhadas sobre um dos SNPs nessa sequência.

Figure 1

Uma sequência genética anotada contendo SNPs. Uma parte da sequência do gene F13B (no cromossoma 1) é mostrada. As áreas pretas representam exons, enquanto os introns estão em cinza. As posições dos nucleotídeos à esquerda são relativas ao conjunto do genoma humano fornecido por Goldenpath. Os SNPs são indicados por nucleotídeos em negrito, sublinhados, e o seu identificador dbSNP aparece à direita da sequência. Uma janela pop-up exibe informações adicionais sobre SNPs individuais: neste exemplo, SNP rs6003 é mostrado como um SNP validado, sem codificação sinônima.

Figure 2

Página de informações detalhadas de um SNP individual. A página é dividida em cinco seções. A primeira contém informações gerais sobre o SNP, incluindo seu identificador, seus alelos e sua posição no gene (ou genes) ao qual pertence. A segunda parte descreve os domínios protéicos aos quais este SNP pertence, de acordo com o SWISS-PROT. A próxima seção lista todas as submissões para este SNP, e fornece o identificador de submissão dbSNP, o nome do submetedor e o identificador privado do SNP. A seção “Ferramentas” contém links para vários programas de desenho de primer PCR, e para uma facilidade para exportar os dados mostrados nesta página em formato XML. Finalmente, a sequência de flanking para este SNP é mostrada, até um máximo de 10.000 nucleotídeos.

SNPsets são exibidos usando tabelas que listam o nome de cada SNP, sua posição, seus alelos e outras informações dependentes do tipo específico de SNPset. SNPsets que contêm um grande número de SNPs são opcionalmente exibidos de forma abreviada por razões de desempenho. A tabela também contém links para executar os diferentes comandos disponíveis em um SNPset, tais como salvá-lo, exportá-lo (ver próxima seção) e refiná-lo. A operação de refinamento do SNPset, em particular, permite ao usuário “filtrar” os SNPs que ele contém de acordo com vários critérios diferentes: propriedades gerais (por exemplo, validação), posição relativa a um gene (por exemplo, para selecionar apenas SNPs exônicos, ou SNPs promotores), freqüência ou heterozigosidade, submetedores (para selecionar apenas SNPs de submetedores especificados, ou com um número mínimo de submetedores distintos), ou distância média (para reduzir o número de SNPs mantendo um espaçamento uniforme). Em todos os casos, o resultado é ocultar os SNPs que não satisfazem os critérios do usuário: enquanto ainda fazem parte do SNPset, estes SNPs não são mais visíveis, e não serão considerados em nenhuma operação de análise, exibição ou exportação.

Finalmente, a Figura 3 mostra a saída de um applet Java que pode ser usado para exibir os SNPsets em forma gráfica. A estrutura do gene é mostrada usando barras de diferentes cores e espessuras; os SNPs são identificados por quadrados (se a informação de freqüência estiver disponível) ou círculos (caso contrário), e são coloridos em verde se validados, em preto caso contrário. O applet fornece comandos para rolar o display para a esquerda ou direita, e para aumentar ou diminuir o display.

>

Figure 3

Representação gráfica de um gene com os SNPs que ele contém. A figura mostra a saída de um applet Java mostrando a estrutura do gene (exons estão em azul, introns em cinza) e todos os SNPs na mesma região (representados por pontos ou quadrados). O usuário pode rolar ou ampliar a tela usando os botões fornecidos, ou mais recentemente a tela clicando na parte superior da figura. Clicando em um SNP abre uma janela pop-up contendo informações sobre ele.

Exportação de dados

Um dos objetivos mais importantes do design do SNPper é fornecer formas fáceis de exportar dados SNP em uma variedade de formatos comuns. A página de exportação do SNPset, mostrada na Figura 4, permite ao usuário escolher qualquer número de campos das anotações disponíveis (incluindo seqüências de flanco, informações de freqüência, status de validação, alteração de aminoácidos), e especificar o formato de saída desejado (XML, texto delimitado por tabulação, HTML ou BED) e destino (os dados podem ser exibidos na janela do navegador ou enviados por e-mail para um endereço fornecido pelo usuário). O XML está gradualmente se tornando um formato padrão para troca de dados em aplicações biomédicas, e é fornecido no SNPper para suportar a interoperabilidade com outros programas. O texto delimitado por tabulações representa o formato de dados estruturado mais simples e, portanto, é suportado pela maioria das aplicações, tais como folhas de cálculo ou programas de desenho de PCR primer. A saída HTML permite aos usuários exibir os dados em um website diferente, por exemplo, para fornecer informações suplementares para uma publicação. Finalmente, o formato BED é usado para explorar o recurso “faixas personalizadas” do Goldenpath: o arquivo resultante pode ser carregado no site Goldenpath, e os dados do SNPset serão exibidos pelo navegador do genoma em sua janela de exibição de faixas.

Figure 4

A página de exportação do SNPset. A primeira parte do formulário permite que o usuário selecione o conjunto de anotações a serem exportadas, dentre as oferecidas pelo SNPper. Todas as combinações de anotações podem ser selecionadas, embora alguns campos só sejam aplicáveis a um subconjunto de todos os SNPs (por exemplo, Amino acid change), e alguns campos podem conter múltiplos valores (por exemplo, Gene). A segunda seção é usada para determinar o formato dos dados exportados, e seu destino. O usuário pode escolher entre exportar os dados como uma tabela HTML, como um arquivo de texto delimitado por tabulações, como um documento XML, ou como um arquivo BED. Esta última opção é usada para carregar os dados exportados para o navegador de genoma Goldenpath, como uma faixa personalizada. Finalmente, o usuário pode optar por exibir o arquivo resultante na janela do navegador, ou tê-lo enviado por e-mail para um endereço especificado.

SNPper também fornece um método alternativo para recuperar informações SNP em formato XML. Nosso sistema implementa uma interface de Remote Procedure Call (RPC), que permite que outros programas enviem solicitações HTTP ad hoc e recebam em resposta um documento XML em vez de uma página HTML . Este recurso tem o objetivo de aumentar o valor e a utilidade do banco de dados SNPper, permitindo que sistemas alternativos usando diferentes interfaces de usuário sejam construídos sobre os mesmos dados subjacentes

Comparação com outros recursos SNP

Existem outros bancos de dados SNP públicos, cada um com seus próprios pontos fortes e limitações. Nesta seção revisamos brevemente as mais importantes, apontando suas características e comparando-as com o que é oferecido pelo SNPper.

O banco de dados HGVBASE está focado na curadoria manual muito precisa e na anotação dos dados SNP disponíveis. Portanto, ele é menor que o dbSNP em tamanho, mas seus dados são extremamente úteis para pesquisadores interessados em explorar o componente genético da variação fenotípica humana. Ele fornece anotações extensivas para seus SNPs, e várias opções de pesquisa incluindo a capacidade de procurar por SNPs em uma seqüência genômica fornecida pelo usuário que é automaticamente alinhada ao genoma humano.

ALFRED e JSNPs são duas bases de dados SNPs menores que visam fornecer informações precisas de freqüência. Os JSNPs focalizam-se na população japonesa, enquanto que o ALFRED fornece dados sobre um grande número de populações muito diversas de todo o mundo, a fim de melhorar as suas diferenças de frequência e facilitar o estudo de haplótipos . Ambos os locais oferecem um número relativamente pequeno de SNPs, mas os dados de frequência que fornecem para eles são extremamente importantes. Os JSNPs oferecem um útil navegador gráfico de cromossomas e a capacidade de exibir traços de sequenciadores para o seu SNPS. Por outro lado, as características de exportação de dados são um pouco limitadas em ambos os sistemas.

O site GeneSNPs integra dados genéticos, sequenciais e SNP em modelos genéticos altamente anotados. Ele fornece recursos de visualização extensiva e exportação de dados, incluindo uma forma de exibir SNPs dentro da seqüência genômica do gene ao qual pertencem, semelhante à disponível no SNPper. Comparado ao SNPper, sua principal limitação é que ele contém apenas SNPs sobre um pequeno número de genes relacionados com a susceptibilidade à exposição ambiental.

EnsMart é uma ferramenta de mineração de dados muito abrangente para extrair dados do banco de dados Ensembl. Ensembl é de longe a base de dados mais exaustiva e sofisticada de todas as aqui descritas. Ele fornece aproximadamente o mesmo conjunto de itens de dados sobre SNPs que o SNPper, com a principal diferença de que ele usa seu próprio banco de dados de genes ao invés de estar ligado ao Goldenpath. Embora sua interface seja muito poderosa e eficaz, não é especificamente adaptada para as necessidades da pesquisa baseada em SNP; por exemplo, não fornece maneiras de gerar conjuntos de SNPs com um espaçamento médio desejado, como é possível com SNPper.

As características que são exclusivas do SNPper estão principalmente relacionadas ao gerenciamento de SNPsets e às suas características de interoperabilidade. SNPper é o único recurso que dá aos usuários a habilidade de manipular, refinar, salvar e exportar SNPsets como um todo, e permitir criar conjuntos de SNPs através de consultas complexas (como a que usa as classes da GeneOntology descritas na seção 4.a). Além disso, para nosso conhecimento, SNPper é o único recurso SNPper que fornece acesso completo à sua base de dados como arquivos XML legíveis por máquina através de uma interface de Chamada de Procedimento Remota, e que permite ao usuário carregar um conjunto de SNPs privados para sua base de dados e analisá-los ou exibi-los através de sua interface padrão.

Deixe uma resposta

O seu endereço de email não será publicado.