AMEDシンポジウム2019開催レポート AMEDシンポジウム2019開催レポート(2日目):AMED成果報告③

(抄録)

IT/AI/ML Embedding:激動するIT(AI、ビッグデータ、IoT、5G)を 如何に咀嚼するかが肝となる時代

喜連川 優氏(国立情報学研究所 所長)

データがAIの燃料になる

講演の様子

AMEDの臨床研究等ICT基盤構築・人工知能実装研究事業において「医療画像ビッグデータクラウド基盤」の構築が採択して頂きました。最近、米国では「date fuel AI:データがAIの燃料になる」という表現がよく利用されます。これは、ガソリンが車の燃料になぞらえ、データがAIの燃料、つまりデータがないとAIは動かないということを表しています。2012年は深層学習が画像認識において歴史的快挙を出した年でもあり、同時に、オバマ政権がビッグデータイニシアティブを制定した年でもあり、2012年以降、AIとビッグデータは並走して進展してゆきます。一人が獲得出来るデータは大した量にはなりませんので、データは共有することが何よりも重要になります。

クラウド基盤構築のための三つの戦略

さて、AMEDの事業を実施するにあたり、3つの戦略を立てました。あちこちで、GAFAに負ける中国に負けると声高に叫ばれているなかでの我々のビジョンです。

一つ目は、学術団体(学会)との連携です。例えば、日本内視鏡学会によると、我が国では上部下部合わせて内視鏡検査を年間1,500万回くらい行っており、これほどの数を行う国は他になく、しかも、きっちりとデータにしているのは日本のみと伺いました。もちろん最初から全ての機関からデータを収集することなどできませんが、将来的方向として、学会のお力添えを得ることが必須と考えた次第です。即ち、過去にも、IT屋と医師、あるいは、病院との共同研究はすでにあり、それを超える姿を目指しました。

二つ目の戦略は、全国、裏日本までを全て100Gbpsの超高速回線で結ぶ学術情報ネットワーク(SINET5)の利用です。全世界に類例のないパワフルなネットワークが国中を走っている国家は日本しかありませんので、これを使わない手はないだろうと考えました。セキュリティに関しましては、SINET5が提供する強化されたネットワークL2VPNが利用可能です。全国から医療画像を集めてビッグデータのAI解析するための高性能クラウド基盤をSINETに結合して開発することし、国立情報学研究所(NII)に医療ビッグデータ研究センターを2016年に設立しました。

三つ目の戦略として、オープンイノベーションという言葉が適切かはわかりませんが、研究開発はNIIだけではなく、全国の大学が参加できるフレームワークをつくろうと考えました。NIIは大学共同利用であり、全ての大学と日頃から密な連携をしております。全体構造としては、AMEDの付託により我々(NII)がクラウド基盤構築し、そこに各学会からデータを入れていただき、日本中の多様な大学の画像AIの専門家が一緒に画像認識器を開発しようという仕組みです。

医療ビッグデータ研究センターの研究体制


図1 医療ビッグデータ研究センターの柱
画像をクリックするとPDFが開きます。

要するに過去色々な医療画像処理の研究がなされてきたわけですが、それよりも圧倒的にスケールが大きなフレームワークとすることを目指したと言えます。最初は、さまざまな失敗も出てくると考えますが、方向が間違っていなければ、失敗を早くすることが大切というのが(Fail Fast)がIT屋の考えです。

この医療ビッグデータ研究センターの主な役割は、①インフラ(クラウド基盤)の整備と、②AI画像解析技術の開発の二つの柱があります(図1)。

クラウド基盤の整備としては、ネットワーク、セキュリティ、クラウド、画像解析技術を融合した安全性、高性能のクラウド基盤を整備し、SINET5を通じて全国規模で収集された画像データをストレージに受け入れて解析します。そして、ユーザは統一されたインターフェースの中で、どこでも自由にアクセスできるようにNIIが整理してリフォームを進めています。画像の格納状況に関しては、間もなく1億枚が集まる状況です。それより嬉しいことは、この画像解析を行う研究者が徐々に増えていることで、100名に達する勢いです。

AI画像解析技術の開発については、各学会の医療画像解析に対するニーズを調査し、収集されたデータを用いたAI学習により、プロトタイプを開発しております。病理画像解析は福島や徳島で実証実験を進めて頂いておりますし、眼科学会も実利用にむけて精力的な開発を進めております。

データの”お作法”

こうしたたくさんのデータを収集していく中で、データの“お作法”についての整備が欠如しているのではないかと考えます。データは一体誰のものか、どこまでオープンにするか、個人情報などありますが、中でも、利益再配分についての整備が必要だと考えています。

今回のシステムではスケールを大きくするために、患者さん、病院、担当医などさまざまな方にお世話になっています。IT技術者も貢献していますが、関係した全ての方々が幸せを感じないと、この大きなパイプラインが巡回しなくなります。このデザイン整備をどのように進めていくべきかは非常に大きな課題であると考えております。

そしてデータが財になったときに、産業財産権、著作権などデータの議論の場が必要になり、データをつくる人とデータを使う人の権利のバランス“法益”を考えなければならないと考えます。

講演動画

当日行われた講演の様子を公開しました。以下のリンクをクリックすると、動画ページへ移動します。
※動画配信は外部サービスを使用しています。

AMEDシンポジウム開催レポート2019
トップページに戻る

最終更新日 令和3年1月13日