英国のムーアフィールズ眼科病院で主任眼科医を務めるピアース・キーンは、10年ほど前から眼底検査に光干渉断層計（OCT）を使い始めた。当時、この技術の実用性はまだ低かった。彼は「断層図の画像は粗く、撮影にも時間がかかりました」と話す。

キーンはユニヴァーシティ・カレッジ・ロンドンの研究者でもあり、2007年から2年かけて、OCTスキャンの画像から失明の恐れのある疾病を発見するための研究を行なった。OCTでは眼球の詳細な3Dイメージが作成されるが、画像診断は非常に時間と手間のかかる作業だ。最新の装置では、1回の検査で最大6,500万枚の画像を撮影することが可能になっている。

英国の国民保険サーヴィス（NHS）では眼科検診でOCT検査が広く利用されているが、画像の量が多すぎるため診断が追いつかない状況にあるという。キーンは「大量の画像をどうさばいていくかが課題になっています」と説明する。

ムーアフィールズ眼科病院がグーグルの親会社アルファベット傘下のDeepMind（ディープマインド）と共同開発した画像診断システムが、この問題の解決に向けた糸口になるかもしれない。

世界最高レヴェルの眼科医と同等以上の成績

医学誌『Nature Medicine』に掲載された論文によると、OCT画像を使って学習した人工知能（AI）は50種以上の目の疾患を94.5パーセントの精度で言い当てることができる。診断対象には緑内障、糖尿病網膜症、加齢黄斑変性（AMD）など、よく見られる眼疾患が含まれている。

キーンは「AIは熟練の眼科医とほぼ同じ精度で眼の病気を発見しました」と話す。「OCTの画像から疾病の有無とその種類を判断することにおいて、ムーアフィールズで働く世界最高レヴェルの眼科医と同等か、場合によってはそれより優秀な成績を残したのです」

この画像診断システムは複数のOCT検査装置で使えるほか、それぞれの診断を下した理由も示される。これはAIを利用したシステムとしては珍しい。

DeepMindの共同創業者のひとりであるムスタファ・スレイマンによると、近く臨床試験を始めることを計画しており、その後は当局に認可を申請する予定だ。実際に医療現場に配備されるようになれば、OCT検査で画像の解析にかかる手間と時間が短縮され、早期の治療開始が可能になる。

DeepMindの画像診断システムには2つのニューラルネットワークが使われており、どちらも既存のスキャンデータを使って深層学習をさせた。

ひとつ目のニューラルネットワークは、OCTの検査画像から疾患の特徴を検出するように訓練されている。熟練の眼科医と検眼士のチームが膨大な時間をかけて、過去の検査画像に問題箇所と疾患名のタグ付けを行い、このデータセットをAIに学習させたのだ。利用可能な画像データは約100万枚あったが、そこから1万4,884枚が選ばれた。

一方、ふたつ目のニューラルネットワークは、ひとつ目の診断結果を分析して、それが正しいかを検討する。同時に疾患の進行具合などから、適切な治療を提案することもできるという。2つのネットワークを組み合わせることで診断精度が向上するというわけだ。

スレイマンはシステムについて以下のように説明する。「単に『これは黄斑変性のように見えますね』と言うのではなく、具体的に検査画像のどこからその診断を下したのかが示されます。実際にスキャン画像の問題の場所に印を付けるようになっています」

論文では997枚の検査画像について、AIと眼科医8人が画像診断を行った。眼科医たちには、患者の既往症や別の検査画像など追加の情報を与えられている。論文には「AIのフレームワークは専門医と肩を並べただけでなく、ときには診断の精度で医師を上回ることもあった」とある。

個人情報をめぐる当局との駆け引き

冒頭でも書いたように、AIの正答率は94.5パーセントを記録した。眼科医は追加の情報がある場合はこれとほぼ同等の精度で疾患を発見することができたが、AIと同じようにOCT画像のみから診断を下そうとした場合、正答率はそれぞれ6.7パーセント、6.8パーセント、10.9パーセント、13パーセントに低下する。

今回のシステムは医療におけるAI利用の最新の事例だ。ほかにも皮膚がんや乳がんなどの検出システムの開発が進められており、米食品医薬品局（FDA）は4月にAIを搭載した眼疾患の検査装置を承認した。英政府も医療現場でAIを活用して行く方針を示している。

一方で、医療AIにはさまざまな課題もある。DeepMindがNHSと協力して医療AIを開発するのは初めてではないが、過去には個人情報の取り扱いなどから厳しい批判にさらされた。

2017年7月には、データ保護監督機関がNHSが患者160万人の個人情報をDeepMindに違法に提供していたと指摘。スレイマンはこれに対して、ブログで「わたしたちはNHSや患者のデータの扱いにおけるルールの複雑さを過小評価していた」と書いている。DeepMindはその後、データシェアをめぐるNHSとの契約内容を変更した。

DeepMindはムーアフィールズとの共同開発ではコストの一部を負担している。情報公開法に基づく請求で明らかになった情報によると、2017年8月までにNHSに11万ポンド（約1,550万円）が支払われており、これには検査データの分割や匿名化にかかる費用も含まれる。なお、NHSからDeepMindへの支払いはゼロだ。

NHSはDeepMindに過去に行われたOCT検査100万回のデータに加え、眼の病気の症状や経過、治療に関するデータを提供した。これらのデータはいずれも患者が特定できないように処理が施されている。また、過去に10件以下しか見つかっていない珍しい症例や患者本人が情報の共有を拒否した場合は除外した。

キーンが画像診断におけるAIの可能性を考えるようになったのは、2015年6月に『WIRED』UK版に掲載されたDeepMindに関する記事がきっかけだったという。彼はスレイマンに連絡を取るために、LinkedInのプレミアムサービスを1カ月分だけ購入した。DeepMindとの初めてのミーティングからわずか1週間後の2016年6月に、両者が共同研究を進めることが発表された。

共同開発したAIシステムが実用化されれば、ムーアフィールズは5年間に渡り、提携するクリニックなど国内30カ所の拠点でこれを無料で使用することができる。キーンとスレイマンはいずれも、今回の論文発表は共同研究の第1段階にすぎないと強調する。

AIも万能ではない

一方で、医療分野におけるAIのすべてが成功を収めているわけではない。IBMは自社の「Watson」のがん治療への応用に取り組むが、AIシステムが「どのような治療を行うかの選択で複数のミスを犯した」ことを認めている（同社によれば、Watsonは世界230カ所の医療機関で8万4,000人以上の患者の治療「支援」に貢献してきたという）。

英国のスタートアップBabylon Healthは、NHS、韓国のサムスングループ、中国のテンセント（騰訊控股）と組んでAIを使った体調管理アプリを開発しているが、医師から本来なら留意すべき症状を見逃したとの指摘を受けた。ただ、Babylonはこれに対し、複数の症状が選択されると一律の結果が出ない場合もあると反論している。

もちろんDeepMindのシステムも完璧ではない。精度が94.5パーセントということは、診断した997枚の画像のうち5.5パーセントは疾患を見逃したことになる。

一方で、キーンは「深刻な眼疾患があるのに何も問題ないと診断されたケースは皆無でした」と説明する。逆に、実際には何も問題がないのに、AIが「緊急もしくは早急な治療が必要」との判断を下したことは2回あったという。また、誤診率は専門医が追加の情報も合わせて判断した場合より低かった。

スレイマンは、2つのニューラルネットワークを使うことで、なぜAIがその診断を下したのかを詳しく調べることが可能になっていると話す。「ニューラルネットワークのそれぞれの層で何が起こっているのかを知るために、奥深くまで入り込もうとしています。機械学習を使ったあらゆるAIシステムにおいて、これは非常に重要なことです」

なぜなら、現実の世界で影響が出てくるからだ。キーンは「この観点では、これまでに行われた医療AIに関する研究の多くは役に立ちません」と補足する。「素晴らしい精度を誇るアルゴリズムが開発されていますが、現場での使用例がないのです」

DeepMindは2種類のOCT装置で診断システムを試した。1台は日本の光学機器メーカーであるトプコンの3次元眼底像撮影装置、もう1台はドイツのハイデルベルク・エンジニアリングのものだ。

スレイマンは「ほとんどの人は正しく理解していないようですが、装置の個々の部品がアルゴリズムにとっては異なる信号を出してきます」と説明する。また、複数の装置で使えることで汎用性の高いシステムになる。

システムの汎用性を高めることはこの先10年といったスパンでの目標になるだろうが、まずは画像診断システムの臨床試験を行う予定だ。OCT検査の必要な患者を抱える医療機関は、この最新鋭のシステムを試す機会を得ることになる。スレイマンは「数年後に当局から承認が出て現場での利用が可能になれば、年間30万人が恩恵を受けるでしょう」と話している。