自閉症スペクトラム（ASD）には、非常に幅広い症状がある。例えば、社会的行動や対人コミュニケーションの難しさ、学習障害、反復行動、強いこだわり、刺激に対する過敏な感覚。これらの効果的な治療方法を確立するために、これまでさまざまな研究機関が自閉症関連の遺伝子の特定を試みてきたが、その症状の幅広さのために候補遺伝子は数百にも上る。

また、神経発達障害のひとつである自閉症スペクトラムは、一卵性双生児の一致率の高さ、そして遺伝子の共有率が高いほど発症率が高いことから、遺伝的要因が強いことが明らかになっている。例えば両親の同じ兄弟は、母親だけが同じ兄弟、または父親だけが同じ兄弟と比べると、発症率が高くなる傾向にある。このことから現在、自閉症は多くの遺伝的な要因が複雑に絡み合って発症するものだと思われている。

一方で、自閉症患者は90年代から増加の傾向にあり、遺伝だけでは説明できないのも事実である。多くの遺伝子を共有しているにもかかわらず、家族のメンバーのなかで単発的に自閉症を発症するケースも多くあるのだ。少なくともこのような孤発性自閉症の原因のひとつは、「ジャンクDNA」と呼ばれる機能が特定されていないDNA領域にある遺伝子発現調節機能の突然変異にあるのかもしれない。

このほどプリンストン大学の研究チームが、これまで「ジャンク」「ガラクタ」と呼ばれていた膨大なゲノムのなかに、自閉症スペクトラムに関連するとみられる突然変異を発見した。途方もない量のゲノムから自閉症の機能的影響を解読することを可能にしたのは、人工知能（AI）の一種であるディープラーニングだ。この手法によって、自閉症に限らずすべての疾患において「非コードDNA」の突然変異による影響を予測・検出するフレームワークとなり得る可能性があるという。

遺伝子の発現量をコントロールする「非コードDNA」

「遺伝子」とは、われわれの体を設計するための「タンパク質に翻訳される情報」が記録されている場所である。「ゲノム」は遺伝子よりも幅広く、タンパク質の情報のみならず生物を設計するすべての情報が記されている。

以前の自閉症研究の多くは、タンパク質を合成する遺伝子のみの変異を特定することに焦点が当てられていたため、既知のヒト遺伝子20,000個と、それらの遺伝子をコントロールする周辺領域に絞って分析されていた。その膨大な情報量でさえヒトゲノム32億の塩基配列のなかの1～2パーセントほどである。これらの遺伝子が突然変異を起こすと、うまく機能しない変異タンパク質をつくり出す。

その一方で、タンパク質に翻訳されることのない残り98パーセント以上のゲノムは、どんな機能があるのか全貌が明らかにされていない。それが、かつて「ジャンク」と呼ばれていた理由だ。

ところが近年、この膨大な「非コードDNA」には重要な発現調整機能があることが明らかになってきた。これらの領域にあるゲノムが突然変異を起こすと、遺伝子の発現調節機能を混乱させる。それらは遺伝子のつくり出すタンパク質自体に変異を起こすわけではないが、いつ、どのくらいつくり出すのかといった制御機能に影響を及ぼすという。

研究チームは、1,790人の自閉症の子どもたちと、“正常”と診断された家族の全ゲノムをディープラーニングにより分析した。なお、この調査では遺伝的な要素を除外するために、当事者以外は自閉症の罹患歴のない家族グループが選ばれた。つまり遺伝性のない孤発性自閉症スペクトラムは、膨大な「非コードDNA」のなかにある何らかの突然変異によるものかを突き止めるためだ。

非コード領域の突然変異で表面化？

分析結果によると、自閉症患者の「非コードDNA領域」には、家族のメンバーと比べて多くの突然変異がみられたという。研究者らはこれらの制御機構の突然変異が、逆にどの遺伝子に影響するのかを調査した。すると、そのほとんどがシナプス伝達およびニューロン発達に強く関連する脳機能の遺伝子であることが判明した。

なお、それらの突然変異のなかには、以前の研究で特定された自閉症関連の遺伝子もあった。しかしそれらの突然変異は、孤発性自閉症患者の30パーセント未満だったと同論文では報告されている。研究チームによると、今回新たに発見された非コード領域の突然変異は、より多くの自閉症関連遺伝子を検出するだろうとのことだ。なお、このような突然変異は、胚と同様、精子細胞と卵細胞で自然に起こり得るものである。

「これは非遺伝性の非コードDNA変異が、複雑なヒトの疾患または障害を引き起こすことを示した最初の研究です」と話すのは、プリンストン大学コンピューターサイエンスおよびゲノミクスの教授であるオルガ・トロヤンスカヤ博士だ。「この知見は、自閉症だけにとどまりません」

また多くの医師は、すべての自閉症患者が同じ症状をもつわけではないという理由から、一般的な診断を下すのを避ける傾向にある。これに対して共著者のプリンストン大学ルイス・シグラー総合ゲノム研究所のチャンドラ・テスフェルド博士は、「遺伝子学的には同じように見えます」と説明している。これらの研究成果は、自閉症スペクトラムの診断に役立つことになるという。

疾患の原因を全ゲノムから掘り起こすAI技術

これまでの研究で「非コードDNA」領域の分析は、どの突然変異が機能的であるのか、さらにそのどれが自閉症スペクトラムの表現型に寄与しているか認識するのは非常に困難だった。

今回使用されたディープラーニングのアルゴリズムは、部分的な「非コードDNA」から、生物学的に関連性のある部分の識別方法を学習する。さらに、その部分的な「非コードDNA」が、どのように遺伝子発現を変化させるかを予測し、それぞれの突然変異を機能的影響力の順にスコアを割り当てた。

またこの研究では、アルゴリズムの正確性を検証するため、いくつかの「非コードDNA」変異の影響を実験している。ディープラーニングで予測された機能的影響力の高い「非コードDNA」の突然変異を細胞に組み込み、遺伝子発現の変化を実験的に確認することで、このモデルの正確性を裏付けたのだ。

「この手法は、あらゆる疾患を解析するうえでの土台を提供するでしょう」と、トロヤンスカヤ博士は言う。「疾患の根底に横たわる、あらゆる原因を理解するための革新的技術なのです」

非コードDNAの突然変異と疾患を結びつける新技術

神経発達障害のひとつである自閉症スペクトラムは、1990年代から世界中で増加傾向にある。8歳児を対象にした米国疾病管理予防センター（CDC）の統計では、2004年の調査で166人にひとりの割合だった自閉症は、2018年の調査では59人にひとりになっている。

もしかすると、われわれの社会に蔓延する環境的な何かが「非コードDNA」領域の突然変異を促すのかもしれない。人間には処理が難しい膨大なデータ解析を必要とするこのような疑問も、いずれAIにより明らかにされるのだろうか。

研究者らは、この研究で使用されたのと同じ手法を通し、がんや心臓病における「非コードDNA」の変異が果たす役割を探ることができると説明している。今回の研究は学術誌「Nature Genetics」に掲載されている。