NTTは18日、同グループのAI関連技術corevoの研究開発、および大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(NII)の人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めたことを発表した。

ロボットは東大に入れるかのプロジェクトでは、センター試験や東京大学の第2次学力試験を用いて、人間が解く問題を人工知能がどこまで解けるのかを明らかにすべく、研究活動を進めている。このなかで英語の問題は、自然言語処理や知識処理の統合的な問題を多く含む。NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。

近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。

今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。