Kérdések
A SNPper az SNP-k lekérdezésének többféle módját kínálja, tükrözve az SNP-k különböző céljait. A legegyszerűbb esetben az SNP-ket egy vagy több rs vagy ss azonosító megadásával lehet lekérdezni, ha ismertek. Egy másik gyakori lekérdezés a kromoszóma egy adott régiójához tartozó, egybefüggő SNP-k halmazát kéri le, amelyet vagy egy abszolút pozíciótartományon, vagy egy citogenetikai sáv nevén keresztül adnak meg. A génorientált vizsgálatok támogatása érdekében az SNPper képes egy génen vagy annak környékén található SNP-k halmazát (a felhasználó által megadott maximális távolságig) vagy egy génhalmazt generálni. A gének megadhatók HUGO nevükkel, vagy Genbank, Locuslink, OMIM vagy Unigene azonosítójukkal. Az érdeklődésre számot tartó gének halmaza viszont megadható pozíció alapján (azaz egy kromoszómarégió összes génje), vagy egy GeneOntology osztályon keresztül. Ez utóbbi tulajdonság lehetővé teszi az SNP-k olyan halmazainak vizsgálatát, amelyek potenciálisan összefüggésbe hozhatók egy adott biológiai folyamattal, ahelyett, hogy a pozíció alapján lennének összekapcsolva.
A lekérdezés eredménye minden esetben egy SNPset, egy adatstruktúra, amely az SNP-k gyűjteményét tartalmazza. Különböző típusú SNPsetek léteznek, az őket létrehozó lekérdezés típusának megfelelően, és különböző műveletek vannak rajtuk definiálva. Például egy összefüggő SNP-ket tartalmazó SNP-készlet esetében érdemes megmérni az SNP-sűrűséget, és az SNPper egy függvényt biztosít a benne lévő SNP-k számának csökkentésére az egységes távolság fenntartása mellett. Egy génkészletből generált SNPkészlet esetében ennek a műveletnek nem lenne értelme (mivel az SNP-k különböző kromoszómákon szóródhatnak szét), ezért nem áll rendelkezésre. Általában egy SNP-készlet olyan SNP-készletet jelent, amelyet egyetlen lekérdezéssel állítottak elő, és amely egészében manipulálható és elemezhető. Az SNPsetek csak az őket létrehozó felhasználó számára láthatók, és tartós adatszerkezetek: a szerveren mindaddig tárolódnak, amíg használják őket, és automatikusan eltávolításra kerülnek, miután elegendő idő telt el az utolsó hozzáférésük óta. A felhasználó dönthet úgy is, hogy elmenti az SNPkészletet, ebben az esetben az a későbbi munkamenetekben is elérhető lesz.
SNP vizualizáció
A SNPper többféleképpen is megjelenítheti az SNP-ket a webes felületen keresztül. Kezdetben minden SNP külön-külön egy olyan oldalon kerül leírásra, amely megjeleníti az általános adatokat (SNP azonosító, pozíció, allélok, validációs státusz), a benyújtók listáját, a gének listáját, amelyekhez tartozik, a különböző populációkban való gyakoriságát (amely a minta méretéből és a fő- és mellékallél gyakoriságából áll), ha rendelkezésre áll, és a fehérjetartományok listáját, amelyekbe az SNP tartozik, ha van ilyen. A génhez tartozó SNP-ket a megfelelő DNS-szekvencia vagy (kódoló SNP-k esetében) az aminosav-szekvencia összefüggésében lehet megjeleníteni. Mindkét esetben az SNP pozíciója ki van jelölve, és egy felugró ablakban megjelenik a róla szóló információ (név, pozíció, allélok). Az 1. ábra egy SNP-ket tartalmazó, annotált génszekvenciát mutat, a 2. ábra pedig a szekvencia egyik SNP-jéről szóló részletes információs oldalt.
A SNP-készletek táblázatok segítségével jelennek meg, amelyek felsorolják az egyes SNP-k nevét, pozícióját, alléljait és egyéb, az adott SNP-készlet típusától függő információkat. A nagyszámú SNP-t tartalmazó SNP-készletek a teljesítmény érdekében opcionálisan rövidített formában jelennek meg. A táblázat linkeket is tartalmaz az SNPseteken elérhető különböző parancsok végrehajtásához, mint például a mentés, az exportálás (lásd a következő szakaszt) és a finomítás. Az SNPkészlet finomítási művelet különösen lehetővé teszi a felhasználó számára, hogy a benne található SNP-ket több különböző kritérium szerint “szűrje”: általános tulajdonságok (pl. validáció), egy génhez viszonyított pozíció (pl. csak az exonikus SNP-k vagy promóter SNP-k kiválasztása), gyakoriság vagy heterozigozitás, benyújtók (csak a meghatározott benyújtókból származó SNP-k kiválasztása vagy egy minimális számú különböző benyújtó kiválasztása) vagy átlagos távolság (az SNP-k számának csökkentése érdekében, az egységes távolság fenntartása mellett). Az eredmény minden esetben az, hogy elrejti azokat az SNP-ket, amelyek nem felelnek meg a felhasználó kritériumainak: bár még mindig az SNPkészlet részei, ezek az SNP-k már nem láthatók, és nem lesznek figyelembe véve semmilyen elemzés, megjelenítési vagy exportálási művelet során.
Végül a 3. ábra egy Java applet kimenetét mutatja, amely az SNPkészletek grafikus megjelenítésére használható. A gén szerkezetét különböző színű és vastagságú sávok segítségével mutatjuk be; az SNP-ket négyzetekkel (ha a gyakorisági információ rendelkezésre áll) vagy körökkel (egyébként) azonosítjuk, és zöld színnel jelöljük, ha validáltak, egyébként feketével. Az applet parancsokat biztosít a megjelenítés balra vagy jobbra görgetésére, valamint a megjelenítés nagyítására vagy kicsinyítésére.
Adatok exportálása
Az SNPper egyik legfontosabb tervezési célja, hogy egyszerű módot biztosítson az SNP-adatok exportálására különböző elterjedt formátumokban. A 4. ábrán látható SNPset export oldal lehetővé teszi a felhasználó számára, hogy tetszőleges számú mezőt válasszon a rendelkezésre álló annotációk közül (beleértve a flanking szekvenciákat, gyakorisági információkat, validációs státuszt, aminosavváltozást), és meghatározza a kívánt kimeneti formátumot (XML, tabulátorral elválasztott szöveg, HTML vagy BED) és a célállomást (az adatok megjeleníthetők a böngésző ablakában vagy elküldhetők e-mailben a felhasználó által megadott címre). Az XML fokozatosan az orvosbiológiai alkalmazásokban az adatcsere szabványos formátumává válik, és az SNPper biztosítja az átjárhatóságot más programokkal. A tabulátorral elválasztott szöveg a legegyszerűbb strukturált adatformátum, ezért a legtöbb alkalmazás, például a táblázatkezelő vagy a PCR-primer tervező programok támogatják. A HTML kimenet lehetővé teszi a felhasználók számára, hogy az adatokat egy másik weboldalon jelenítsék meg, például egy publikációhoz kiegészítő információkat szolgáltassanak. Végül a BED formátumot a Goldenpath “egyéni pályák” funkciójának kihasználására használják: az így kapott fájl feltölthető a Goldenpath webhelyére, és az SNPset-adatokat a genomböngésző megjeleníti a pálya megjelenítő ablakában.
A SNPper egy alternatív módszert is kínál az SNP-információk XML formátumban történő lekérdezésére. A mi rendszerünk egy Remote Procedure Call (RPC) interfészt valósít meg, amely lehetővé teszi más programok számára, hogy ad hoc HTTP kéréseket küldjenek, és válaszként egy XML dokumentumot kapjanak egy HTML oldal helyett . Ennek a funkciónak az a célja, hogy növelje az SNPper adatbázis értékét és hasznosságát azáltal, hogy lehetővé teszi alternatív, különböző felhasználói felületeket használó rendszerek építését ugyanazon alapul szolgáló adatokra
Összehasonlítás más SNP forrásokkal
Más nyilvános SNP adatbázisok léteznek, mindegyiknek megvannak a maga erősségei és korlátai. Ebben a szakaszban röviden áttekintjük a legfontosabbakat, rámutatva jellemző tulajdonságaikra és összehasonlítva őket az SNPper által kínáltakkal.
A HGVBASE adatbázis a rendelkezésre álló SNP-adatok nagyon pontos kézi kurációjára és annotálására összpontosít . Ezért kisebb méretű, mint a dbSNP, de adatai rendkívül hasznosak az emberi fenotípusos variáció genetikai összetevőjének feltárása iránt érdeklődő kutatók számára. Kiterjedt annotációkat biztosít az SNP-jeihez, és számos keresési lehetőséget, beleértve azt a lehetőséget, hogy SNP-ket keressenek a felhasználó által megadott genomiális szekvenciában, amelyet automatikusan összehangolnak a humán genommal.
Az ALFRED és a JSNPs két kisebb SNP-adatbázis, amelyek célja, hogy pontos gyakorisági információkat nyújtsanak. A JSNPs a japán populációra összpontosít, míg az ALFRED az egész világ számos nagyon különböző populációjáról szolgáltat adatokat a gyakorisági különbségek fokozása és a haplotípusok tanulmányozásának megkönnyítése érdekében . Mindkét oldal viszonylag kevés SNP-t kínál, de a rájuk vonatkozó gyakorisági adatok rendkívül fontosak. A JSNPs hasznos grafikus kromoszómaböngészőt kínál, és az SNPS-eihez szekvenálási nyomvonalak megjelenítésének lehetőségét. Másrészt az adatexport funkciók mindkét rendszerben kissé korlátozottak.
A GeneSNPs oldal a gén-, szekvencia- és SNP-adatokat magasan annotált génmodellekbe integrálja. Kiterjedt vizualizációs és adatexport funkciókat biztosít, beleértve az SNP-k megjelenítésének módját annak a génnek a genomi szekvenciáján belül, amelyhez tartoznak, hasonlóan az SNPperben elérhetőhöz. Az SNPperhez képest fő korlátja, hogy csak kis számú, a környezeti expozícióra való fogékonysággal összefüggő gén SNP-it tartalmazza.
Az EnsMart egy nagyon átfogó adatbányászati eszköz az Ensembl adatbázisból történő adatnyerésre. Az Ensembl messze a legkimerítőbb és legkifinomultabb adatbázis az itt leírtak közül. Nagyjából ugyanazt az adatelemkészletet nyújtja az SNP-kről, mint az SNPper, azzal a fő különbséggel, hogy a Goldenpath-hoz való kapcsolódás helyett a saját génadatbázisát használja. Bár a kezelőfelülete nagyon erős és hatékony, nem kifejezetten az SNP-alapú kutatások igényeihez igazodik; például nem nyújt módot arra, hogy olyan SNP-készleteket hozzunk létre, amelyeknek a kívánt átlagos távolsága van, ahogyan az ehelyett az SNPperrel lehetséges.
Az SNPper egyedi jellemzői főként az SNPsets kezeléséhez és az interoperabilitási jellemzőihez kapcsolódnak. Az SNPper az egyetlen olyan erőforrás, amely lehetővé teszi a felhasználók számára az SNPsets egészének manipulálását, finomítását, mentését és exportálását, valamint SNP-készletek létrehozását összetett lekérdezéseken keresztül (mint például a 4.a. szakaszban leírt GeneOntology osztályok felhasználásával). Emellett tudomásunk szerint az SNPper az egyetlen olyan SNP-forrás, amely Remote Procedure Call interfészen keresztül teljes hozzáférést biztosít az adatbázisához gépileg olvasható XML-fájlok formájában, és amely lehetővé teszi a felhasználó számára, hogy privát SNP-készletet töltsön fel az adatbázisába, és a szabványos interfészen keresztül elemezze vagy megjelenítse azokat.