GEM Japan ENA / EVA / EGA

国(運営主体)

欧州諸国(EMBL-EBI)

目的・目標

遺伝情報(塩基配列・遺伝子変異・遺伝子型および表現型)をグローバルに共有するための基盤(ENA・EVA・EGA)を提供する。

概要

ENA(European Nucleotide Archive)
  • 塩基配列情報およびシーケンシングに関する手順(試料調整・シーケンス機器の運転・バイオインフォマティクス解析等)を収集し提供する。
  • 扱うデータは、無加工および加工の塩基配列情報やアノテーション情報、主要な欧州シーケンスセンターからのデータ、さらには定期的な情報共有によりINSDC(International Nucleotide Sequence Database Collaboration)から得られるデータなど。
  • INSDC のメンバーとしてデータをグローバルに共有するため、ENAブラウザを通じてすべての情報に無料かつ無制限にアクセスできる。
  • 個々の研究成果を他の研究者に広めるために、塩基配列のシーケンスデータをENAまたは他のINSDCパートナーのレポジトリに登録することはとても重要かつ必須の原則となっている。ENAは、科学論文の出版社や資金提供機関と協力してこの原則を確立し、公表された論文と自在に連携するデータ登録・アクセスのシステムを提供する。
  • European Commission(欧州委員会)、BBSRC (British Biotechnology and Biological Sciences Research Council) やWellcome Trust等からの外部資金提供を受ける。
EVA(European Variation Archive)
  • 様々な生物種に関するあらゆるタイプの遺伝子変異(バリアント)のオープンアクセスデータベース。
  • 生データをEVAスタディブラウザにより提供する。
  • 注釈付けしたアレル頻度等の統計値が付加されたデータをEVAバリアントブラウザにより提供する。
  • ヒト遺伝子変異情報は米国dbSNPにて管理し、EVAと相互にデータ交換を行う。
EGA(European Genome-phenome Archive)
  • 匿名化したヒトの塩基配列・アレイ解析・表現型に関する制限公開データベース。
  • データ登録機関で構成されるDAC(Data Access Committee)が、データ利用条件を規定するDAA(Data Access Agreement)を作成し、基準に合う研究者や臨床医にのみアクセスを認可する。
  • 登録データの概要をカタログとして公開する。
  • 利用者は希望するデータの検索を行い、該当するDACに利用許可申請を行う。

これらの取り組みはEMBL-EBI(EGAはCRGと共同)にて運営されており、ELIXIRのコアデータリソースデポジションデータベースにも登録されている。

*INSDC(International Nucleotide Sequence Database Collaboration):すべての公開塩基配列情報の相互交換と複製を行う国際的な取り組み。ENAのほか米国NCBIおよび日本DDBJ(国立遺伝学研究所)がメンバーとして活動。
*EMBL-EBI(European Molecular Biology Laboratory - European Bioinformatics Institute):欧州分子生物学研究所の一部門の欧州バイオインフォマティクス研究所。
*CRG(Centre for Genomic Regulation):スペイン生物医学ゲノム研究センター
*ELIXIR:ライフサイエンス研究リソース統合のために2013年に創設された欧州横断の政府組織であり、欧州23か国から220超の研究機関が参加。

現状・トピックス

データ(2019年末時点)
ENA

  • 収集およびアノテーションしたシーケンスデータをまとめて四半期毎にリリース
  • 簡便なデータアクセス方法(ENAブラウザ等)の普及やデータ量の増加に伴い、2020年3月のリリース143にて定期リリースを終了する予定
EVA
  • 様々な生物種の遺伝子変異データベース
  • 対象生物種の割合は、短い遺伝子変異(<50塩基対)に関する研究ではヒト53%、ウシ14%、ヒツジ12%、構造変異(>50塩基対)に関する研究ではヒト93%
EGA
  • スタディ3,593、データセット5,252
  • 疾患:がん44.1%、循環器系5.4%、免疫系2.8%、他
  • データ:エクソーム22.8%、全ゲノム19.1%、トランスクリプトーム15.8%、他
  • 登録者(国別):英国18%、米国15%、ドイツ8%、日本3%、他
  • 利用者(国別):米国33%、英国16%、カナダ6%、日本1%、他

基本情報

経緯

ENA
  • 1980年代、世界初の塩基配列データベースEMBL Data Libraryが公開
  • 1995年、EMBL-Bank創設
  • 2008年、Trace ArchiveとSRA (Sequence Read Archive) が公開
  • 2010年、これらを統合
EVA
  • 2014年、公開
EGA
  • 2008年、EMBL-EBIにより公開

連携機関

ENA EVA

GA4GHへの貢献

  • Work Streams:  Discovery / Cloud / Data Security / Data Use & Researcher Identities (DURI) / Large Scale Genomics / Clinical & Phenotypic Data Capture / Genomic Knowledge Standards / Regulatory & Ethics /
  • Tool Kits:  GA4GH Passports / Data Repository Service (DRS) API / Crypt4GH(EGA) / Tool Registry Service (TRS) / Phenopackets / Beacon / Data Use Ontology / htsget API / refget API / Workflow Execution Service (WES) API / Read File Formats (SAM/BAM/CRAM) / Breach Response Protocol / Genetic Variation File Formats / Phenotype Representation for Genomic Medicine and Research / Search / Service Registry Prototype / Testbed & Interoperability Demonstration

Champions

  • Thomas Keane (EGA, EVA; EMBL-EBI)
  • Dylan Spalding (EGA; EMBL-EBI)
  • Cristina Gonzalez (EMBL-EBI)

対象疾患・領域

Rare Disease, Cancer, Complex Traits, Basic Biology

リンク

ENA: European Nucleotide Archive
EVA: European Variation Archive
EGA: European Genome-phenome Archive

最終更新日 令和2年1月22日