CCDS Report for Consensus CDS

Consensus CDS (CCDS) プロジェクトは、一貫してアノテーションされ、高品質なヒトおよびマウスタンパク質コーディング領域のコアセットを特定するための共同作業である。長期的な目標は、遺伝子アノテーションの標準セットへの収束をサポートすることである。

利用可能な情報は以下の通り。

お知らせ
概要
アクセスおよび利用可能性
共同研究者
CCDS 識別子およびトラッキング
プロセスフロー
Publications

Announcements

CCDS Release 23 – マウスの更新 10月24日 2019年

GRCm38のNCBIとEnsembl/Havanaのアノテーション。p6参照ゲノム（アセンブリ GCF_000001635.26、NCBIアノテーションリリース 108、Ensemblアノテーションリリース 98）を分析し、一貫してアノテーションされている追加のコーディング配列（CDS）を特定しました。 CCDSデータは、CCDSウェブサイトおよびFTPサイトで公開されており、各ブラウザの更新サイクルに従って、共同研究者のゲノムおよび/または遺伝子ブラウザのウェブサイトで利用可能になる。

今回の更新では、新たに1570のCCDS IDを追加し、175遺伝子をマウスCCDSセットに追加している。 CCDS Release 23では、20,486のGeneIDに対応する合計27,219のCCDS IDが含まれています。詳細はリリース&統計レポートをご覧ください

CCDS Release 22 – Update for Human June 14, 2018

GRCh38.p12 reference genome (assembly GCF_000001405.38, NCBI annotation release 109, Ensembl annotation release 92) の NCBI および Ensembl/Havana annotation を分析し、一貫して注釈が付けられている追加のコーディングシーケンス (CDS) を識別しました。 CCDSデータは、CCDSウェブサイトおよびFTPサイトで公開されており、各ブラウザの更新サイクルに従って、共同研究者のゲノムおよび/または遺伝子ブラウザのウェブサイトで利用可能になる。

今回の更新では、新たに894のCCDS IDを追加し、128遺伝子をヒトCCDSセットに追加している。 CCDS Release 22では、19,033のGeneIDに対応する合計33,397のCCDS IDが追加されています。詳細はリリース&統計レポートをご覧ください。

過去のお知らせを見る

概要

遺伝子に対するアノテーションは複数の公的資源により、異なる方法で提供されていて、結果として情報は似ているが必ずしも同じではないことが分かっています。ヒトとマウスのゲノム配列は十分に安定しており、同一と思われる遺伝子配置の特定を開始し、それらのデータを公開し、3大公開ゲノムブラウザのコアセットとしてサポートされるようになった。長期的な目標は、遺伝子アノテーションの標準セットへの収束を支援することである

この目的に向けて、コンセンサスCDS（CCDS）プロジェクトが設立された。

Access and Availability

Consensus CDS projectの最初の結果は、参加者のゲノムブラウザのウェブサイトから利用可能になっています。また、CCDSの識別子は、関連するNCBI RefSeqおよびEntrez Geneのレコードに表示されています。 CCDSのレポートは、提供されたリンクをたどるか、このページの上部にあるクエリーインターフェースを用いて直接データベースを照会することでアクセスできる。

CCDSデータセットは、匿名FTPでも利用可能である。

Collaborators

CCDS のセットは共同研究者の合意により構築されています。

European Bioinformatics Institute (EBI)
- Ensembl Annotation Pipeline
- HAVANA Curation Group
HUGO Gene Nomenclature Committee (HGNC)
Mouse Genome Informatics (MGI)
National Center (MGI) などの共同研究者の間でコンセンサスを得ています。 for Biotechnology Information (NCBI)
- Eukaryotic Genome Annotation Pipeline
- RefSeq Curation Group
CCDSセットは、独立したキュレーショングループが、最初は異なるケースで合意することにより完全になっていくと想定しています。サポートが弱い遺伝子の実験的検証の追加や、自動アノテーションの手法の改良が進むにつれて。 CCDSの更新サイクルの間、CCDSの共同研究グループ間のコミュニケーションは、相違点を解決し、改良点を明らかにする継続的な活動である。

CCDS Identifiers and Tracking

CCDS setに含まれるアノテーション遺伝子には、一意の識別子番号とバージョン番号（例：CCDS1.1、CCDS234.1)が関連付けられています。バージョン番号は、CDS構造が変更されたり、その位置で基礎となるゲノム配列が変更されたりすると更新される。アノテーションと配列に基づくゲノムブラウザの更新サイクルに伴い、CCDSセットは識別子を維持したまま前方にマッピングされる。既存のCCDS遺伝子の変更はすべて共同研究の合意によって行われ、一つのグループが一方的にセットを変更することはない。

Process Flow and Quality Testing

CCDSセットはNCBIとEnsemblによって行われている全ゲノム注釈更新に従って算出されています。アノテーションの更新は、手動キュレーションと自動計算処理の混合によって定義された遺伝子を表しています。

主なキュレーショングループは、EMBL-EBIのHavanaチームとNCBIのRefSeqアノテーショングループです。自動的な方法はEnsemblグループとNCBIのゲノムアノテーション計算パイプラインを経由している。自動化された情報よりもキュレーションされた情報が優先され、その情報はEMBL-EBIとNCBIのグループ内で一貫性があり、かつ厳しいQCコントロールをパスしなければならない。
1. ゲノムアノテーション結果の比較
2. ゲノム上の同一位置座標を持つアノテーションコード領域の特定
3. 品質評価
4. コアセットから低品質のCDSを削除して共同グループ間での追加レビューにかける CCDS遺伝子セット定義の一般プロセスには、以下のものがあります。
CCDSセットには、完全長（開始ATGと有効なストップコドン）と注釈され、フレームシフトなしでゲノムから翻訳可能で、コンセンサススプライスサイトを使用したコーディング領域が含まれています。将来的には、実施する品質テストの数や種類を増やす予定であるが、種を超えた比較解析の一貫性、推定偽遺伝子、レトロトランスポーズ遺伝子、合意スプライス部位、サポート転写物、タンパク質相同性を特定するための解析が含まれる。

Publications

CCDS:
The consensus coding sequence (CCDS) projectについては以下の引用を使用してください。ヒトとマウスのゲノムに共通のタンパク質コード化遺伝子セットを同定する。
Pruitt KD, Harrow J, Harte RA, Wallin C, Diekhans M, Maglott DR, Searle S, Farrell CM, Loveland JE, Ruef BJ, Hart E, Suner MM, Landrum MJ, Aken B, Ayling S, Baertsch R, Fernandez-Banet J, Cherry JL, Curwen V, Dicuccio M, Kellis M, Lee J, Lin MF.（共著）, 日本人材機構出版会, pp, Schuster M, Shkeda A, Amid C, Brown G, Dukhanina O, Frankish A, Hart J, Maidak BL, Mudge J, Murphy MR, Murphy T, Rajan J, Rajput B, Riddick LD, Snow C, Steward C, Webb D, Weber JA, Wilming L, Wu W, Birney E, Haussler D, Hubbard T, Ostell J, Durbin R, Lipman D,.
Genome Res. 2009 Jul;19(7):1316-23.
PubMed: PMID: 19498102
Tracking and coordinating an international curation effort for the CCDS Project.
Harte RA, Farrell CM, Loveland JE, Suner MM, Wilming L, Aken B, Barrell D, Frankish A, Wallin C, Searle S, Diekhans M, Harrow J, Pruitt KD.PubMed: PMID: 19498102Tracking and coordinating an international curation effort for the CCDS Project.PubMed: PMID: 19498102Database 2012 Mar 20;2012:bas008. doi: 10.1093/database/bas008.
PubMed: PMID: 22434842
Consensus Coding Sequenceデータベースの現状と新機能.
ファレルCM、オリアリーNA、ハルトRA、ラブランドJE、ウィルミングLG、ワリンC、ディーカンスM、バレルD、サールSM、アケンB、ハイアットSM、フランキッシュA、スナーMM、ラジプトB、スチュワード CA、ブラウンGR、ベネットR、マーフィーM、ウーW、ケイMP、ハートJ、ラジャンJ, Weber J, Snow C, Riddick LD, Hunt T, Webb D, Thomas M, Tamez P, Rangwala SH, McGarvey KM, Pujar S, Shkeeda A, Mudge JM, Gonzalez JM, Gilbert JG, Trevanion SJ, Baertsch R, Harrow JL, Hubbard T, Ostell JM, Haussler D, Pruitt KD.など。
Nucleic Acids Res. 2014 Jan 1;42(1):D865-72. doi: 10.1093/nar/gkt1059.
PubMed: PMID: 24217909
Consensus coding sequence (CCDS) database: a standardized set of human and mouse protein-coding regions supported by expert curation.（CCDSデータベース：専門家によるキュレーションでサポートされたヒトおよびマウスのタンパク質コーディング領域の標準セット）。
Pujar S, O’Leary NA, Farrell CM, Loveland JE, Mudge JM, Wallin C, Girón CG, Diekhans M, Barnes I, Bennett R, Berry AE, Cox E, Davidson C, Goldfarb T, Gonzalez JM, Hunt T, Jackson J, Joardar V, Kay MP, Kodali VK, Martin FJ, McAndrews M, McGarvey KM, Murphy M, Rajput B, Rangwala SH, Riddick LD, Seal RL, Suner MM, Webb D, Zhu S, Aken BL, Bruford EA, Bult CJ, Frankish A, Murphy T, Pruitt KD.
Nucleic Acids Res. 2018 Jan 4;46(D1):D221-D228. doi: 10.1093/nar/gkx1031.
PubMed: PMID: 29126148
PubMed Central.JP.JP.JP.JP.P.D.D.D.D.D.D.D.D.。 PMCID: PMC5753299CcdsBrowse: 1.1.44

Alai

CCDS Report for Consensus CDS

コメントを残すコメントをキャンセル

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル