ヤフーは11月15日、数十万の選択肢の中から適切な解を、世界最速・高精度に予測するという機械学習技術「AnnexML」（アネックスエムエル）を開発し、オープンソースソフト（OSS）としてGitHubに公開した。

AnnexMLの処理フロー

ユーザーのサービス利用情報などビッグデータと、そのユーザーがクリックした広告などの数十万の選択肢との組み合わせを効率的に学習でき、「サービス利用情報のあるユーザーに対して、どの広告がクリックされやすいか」といった有力な候補の組み合わせを世界最速・高精度に予測するという。

テキストや画像、商品データ、ユーザーデータなど、複数の特徴を持つ高次元データを、大量のデータベースの中から高速に検索・特定できる技術「NGT」（OSSで公開済み）も活用。項目数を数十に圧縮したビッグデータをグラフ構造に整理・学習することで、高い予測精度と高速化を両立させた。

同種のビッグデータ分類技術と比較したところ、さまざまな研究に引用されている既存技術「SLEEC」より最大で約58倍の予測速度を記録し、論文投稿時点（2017年2月）で世界最速だったという。

同技術は特許を取得済みだが、商業用途も含め、特許のライセンスを無償提供する形でGitHubに無償公開した。

同社は、ECや広告のパーソナライズ機能の精度向上などに同技術を活用することを検討する。

同社はさまざまな種類のビッグデータを保有しており、その利活用のための技術も「世界TOP10」を目指しているという。大学や研究機関との共同研究やAI技術関連のOSS公開など、アカデミア領域への情報発信を強化しており、今回の技術のOSS公開もその一環としている。