プレスリリース 遺伝子のスイッチ役を「見える化」―バイオビッグデータを有効活用―

平成30年11月9日プレスリリース

九州大学
情報・システム研究機構
科学技術振興機構
日本医療研究開発機構
 

九州大学大学院医学研究院の沖 真弥助教と目野 主税教授は、情報システム研究機構・ライフサイエンス統合データベースセンター(DBCLS)の大田達郎特任研究員などとの共同研究により、世界中から報告されたタンパク質とゲノムDNAの結合情報を全てデータベース化し、組織や臓器を形成する司令塔的なタンパク質の探索に応用できることを示しました。

われわれの体のゲノムDNAにはヒストンや転写因子と呼ばれるタンパク質が結合し、遺伝子のオン・オフのスイッチ役としてはたらき、臓器の形成や疾患などに関与します。そのようなタンパク質がゲノム全体のどこに結合しているかを調べるため、2007年にChIP-seq法という手法が開発され、これまで10万件近くもの実験結果が報告されています。しかしそのデータ量があまりに膨大なため、そのビッグデータから必要な知識を取り出すことは非常に困難でした。

本研究グループは、論文などで報告されたChIP-seqデータを全て収集してスーパーコンピューターで統合解析し、それを「見える化」したWebサービス(ChIP-Atlas; https://chip-atlas.org)を開発しました。これによりどの転写因子が、どの細胞で、どの遺伝子に結合するかが容易に理解できるため、すでに遺伝子制御のしくみ、薬理作用、老化や疾患などの研究に世界中で利用されています。また同研究グループは、このビッグデータをさらに高次解析し、免疫細胞、肝臓、血管などを形成する司令塔的な転写因子の予測に応用できることを示し、将来的には再生医療などに応用できると期待されます。本研究成果は、JSTライフサイエンスデータベース統合化推進事業、日本学術振興会科学研究費、AMED老化メカニズムの解明・制御プロジェクトの支援を受けており、2018年11月9日午後8時(日本時間)に、国際学術雑誌「EMBO Reports」オンライン版に掲載されます。

背景

わたしたちの細胞の中に存在するゲノムDNAは、ヒストンと呼ばれるタンパク質に巻きついてクロマチンという構造を形成します。また、転写因子と呼ばれる約千種類のタンパク質がクロマチンに結合することで、付近の遺伝子発現のオン・オフを制御します。このような遺伝子のスイッチ役の巧みな制御によって、さまざまな組織や臓器などが形成され、正常に機能するようになります。もし転写因子に異常があると、遺伝子の制御が乱れるため、胎児の奇形、がんや自己免疫疾患などの原因となることが知られています。また、いくつかの転写因子は多数の遺伝子をまとめて制御できるため、そのような転写因子を皮膚の繊維芽細胞へ大量に導入すると、iPS細胞や肝細胞などへ変えることもできます。

このように、転写因子は遺伝子のスイッチ役として機能しますが、30億塩基対もあるゲノムDNAのどこに結合しているのか?については長らく謎のままでした。ところが約十年前にChIP-seqという手法が登場し、ヒストンや転写因子が結合する場所をゲノム全体にわたって調べることができるようになったため、遺伝子研究は大きなブレークスルーを迎えました。その後、ChIP-seq法を用いた研究成果は世界中から次々に報告され、現在までに約10万件、800兆バイトものデータ量になります。しかしこれらはA/T/G/CからなるDNAの塩基配列しか公開されていないため、そのデータの意味を理解して活用するためには複雑な計算処理やデータの可視化などが必要になります。この膨大な量のデータを計算するには、普通のパソコンをはるかに超えた能力の計算機が必要なため、これまで論文で報告されたChIP-seqデータのほとんどは、他の研究者に活用されることなく死蔵されていました。

※ChIP-seqとはChromatin immunoprecipitation with sequencingの略で、対象となるヒストンや転写因子に対する抗体を用いることで、それらが結合するDNAを集め、高速シーケンサーで配列を読み取る、という手法です。ただし、そのDNA配列だけでは何も理解できないため、配列データの座標化、統計解析や可視化処理などが必要です。

発表内容

ChIP-seqデータベースの開発

九州大学と情報システム研究機構・ライフサイエンス統合データベースセンター(DBCLS)を中心とする研究グループは、国立遺伝学研究所のスーパーコンピューターシステムを利用して約10万件のChIP-seqビッグデータを全て収集・計算し、ヒストンや転写因子がゲノムDNAに結合する位置情報をすべて可視化することに成功しました。また、実験に用いられた試料に関する情報を整理し、全てのデータについて実験対象の細胞や転写因子の名前をきちんと明記しました。これらのデータは2015年12月よりChIP-Atlas(https://chip-atlas.org)というWebサービスとして公開しましたが、その後、更新や改訂を重ね、このたび正式に論文として報告しました。この中では本サービスの内容と使い方、可視化処理の方法や、利用事例(後述)について述べられています。

ChIP-Atlasは、高校で習う程度の転写因子やゲノムに関する基礎知識があれば誰でも使うことができます。アトラス(地図帳)をめくるように好きな遺伝子にアクセスし、そこに結合する転写因子やヒストンの種類、および細胞タイプなどを視覚的に理解できます。たとえば1ページ目の図は、マウスのFoxa2という、肝臓形成に重要な遺伝子にアクセスした例です。図の最上段にはFoxa2遺伝子の部分(いわゆるエクソン)が青いバーとして示されています。図の中央にはFoxa2遺伝子の端の部分(いわゆる転写開始点)がありますが、そこには●印で示すようにProx1やCebpbなどの転写活性化因子がliver(肝臓)で結合するということがわかります。またFoxa2遺伝子の左側の部分には★印で示すようにEzh2やSuz12という転写抑制化因子がembryonic stem cells(ES細胞)で結合していることがわかります。つまり肝臓やES細胞において、Foxa2遺伝子はこのような転写因子によってオンまたはオフの制御を受けることがビジュアルで理解できます。このような転写因子などの結合部位がChIP-Atlasには約8億か所も収録されており、このようなデータベースは世界初です。

ChIP-seqデータベースの応用事例

ChIP-seqデータは世界中から毎月約1,500件も報告されていますが、これらのデータは毎月ChIP-Atlasに追加されているため、利用者は常に最新のデータを閲覧できます。毎月、国内外から約10万ページビューのアクセスがあり、これまで約50報の論文に引用されています。おもに遺伝子発現を制御するしくみに関する研究のほか、薬の作用、がん、老化、生物進化などにかかわる転写因子の研究に応用されています。これらの利用事例は今回の論文にも述べられており、今後も幅広い生命科学研究の発展に寄与できると思われます。

また同研究グループは、組織特異的に発現する複数の遺伝子がどの転写因子によって制御されているか?について解析しました。たとえば、肝臓では発現するが、その他の臓器ではほとんど発現しないような遺伝子を「肝臓特異的遺伝子」としてリストアップし、それらの多くに共通して結合するような転写因子をChIP-Atlasのビッグデータを用いて探索しました。その結果、HNF4AやFOXA2などの転写因子が肝臓特異的遺伝子の多くに結合することがわかりました。つまりHNF4AやFOXA2は肝臓で重要な複数の遺伝子の発現をまとめて制御する、司令塔的な転写因子であるといえます。実際に皮膚の線維芽細胞にこれらの転写因子を大量に導入すると、肝細胞へと分化転換できることがすでに証明されています(いわゆるダイレクト・リプログラミング技術)。また同研究グループは、血管内皮細胞特異的遺伝子にはTAL1, FOS, JUN など、マクロファージ特異的遺伝子群にはSTAT1やSPI1などの転写因子が高頻度に結合することを示しました。これらの成果は、それぞれの細胞タイプの司令塔的な転写因子であると考えられるため、将来的にはダイレクト・リプログラミング技術による組織再生への応用が期待されます。

ChIP-seq_説明図

発表論文

著者:
Shinya Oki, Tazro Ohta, Go Shioi, Hideki Hatanaka, Osamu Ogasawara, Yoshihiro Okuda, Hideya Kawaji, Ryo Nakaki, Jun Sese, and Chikara Meno
タイトル:
ChIP-Atlas: a data-mining suite powered by full integration of public ChIP-seq data.
掲載誌:
EMBO Reports, 2018, e46255.(doi: 10.15252/embr.201846255)

謝辞

本研究は以下の研究費の支援により行われました。

  • 科学技術振興機構(JST)ライフサイエンスデータベース統合化推進事業(統合化推進プログラム)
  • 日本学術振興会科学研究費(25840087, 18KT0024, 16H06530, 26291051, 17H01571, 15K14529)
  • 日本医療研究開発機構(AMED)老化メカニズムの解明・制御プロジェクト(JP17gm5010003)

お問い合わせ

研究に関するお問い合わせ

九州大学大学院 医学研究院 発生再生医学分野
助教 沖 真弥(おき しんや) E-mail:soki"AT"dev.med.kyushu-u.ac.jp
教授 目野 主税(めの ちから) E-mail:meno"AT"dev.med.kyushu-u.ac.jp
TEL:092-642-6259 FAX:092-642-6260

報道に関するお問い合わせ

九州大学広報室
TEL:092-802-2130、FAX:092-802-2139
E-mail:koho"AT"jimu.kyushu-u.ac.jp

情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター 広報担当
TEL:04-7135-5508 FAX:04-7135-5534
E-mail:public_relations"AT"dbcls.rois.ac.jp

科学技術振興機構 広報課
TEL:03-5214-8404 FAX:03-5214-8432
E-mail:jstkoho"AT"jst.go.jp

JSTライフサイエンスデータベース統合化推進事業に関するお問い合わせ

国立研究開発法人科学技術振興機構 バイオサイエンスデータベースセンター 企画運営室
〒102-8666 東京都千代田区四番町5番地3
TEL:03-5214-8491 FAX:03-5214-8470
E-mail:nbdc-funding"AT"jst.go.jp

AMEDの事業に関するお問い合わせ

国立研究開発法人日本医療研究開発機構 基盤研究事業部 研究企画課
〒100-0004 東京都千代田区大手町1-7-1 読売新聞ビル
TEL:03-6870-2224 FAX:03-6870-2246
E-mail:kenkyuk-ask"AT"amed.go.jp

※E-mailは上記アドレス”AT”の部分を@に変えてください。

最終更新日 平成30年11月9日