Googleは、動画に記録されている対象物や、対象物の動きをキーワードとして検索できるAPI「Cloud Video Intelligence」（プライベートベータ版）を公開した。同APIを使うと、ある動画に「トラ」が映っているかどうか、映っているとしたらビデオのどの部分に映っているのか、何が「走っている」のか「泳いでいる」のかなどが調べられる。



動画に映っているものの検索が可能に（出典：Google） 動画に映っているものの検索が可能に（出典：Google）

Cloud Video Intelligenceは、動画内の情報を言語化できる技術。「犬」「花」「人間」といった名詞や、「走る」「泳ぐ」「飛ぶ」といった動詞を使って、ビデオ内を検索できる。

人工知能（AI）技術の一種である深層学習（ディープラーニング）を応用し、Googleの機械学習フレームワーク「TensorFlow」をベースに開発した。すでに「YouTube」などで使われているそうだ。

Googleは、メディア企業が膨大な非構造化データである動画ライブラリを同APIで解析し、カタログ化することで価値を高められる、としている。また、ビデオ管理ソフトなどでの活用も考えられるという。



ビデオ全体を通し、映っている対象物をリスト表示（出典：Google） ビデオ全体を通し、映っている対象物をリスト表示（出典：Google）

同APIの紹介ページでは、映像に映っている対象物の候補を提示するデモが体験できる。以下の画像は、その動作の一部をとらえたものだ。



これだけで「キリン」と推定（出典：Google） これだけで「キリン」と推定（出典：Google）



笑顔の人間も判別（出典：Google） 笑顔の人間も判別（出典：Google）



「ネコ」に見えないこともない（出典：Google） 「ネコ」に見えないこともない（出典：Google）



自信なさそうに「魚」（出典：Google） 自信なさそうに「魚」（出典：Google）



人間が世話をしているからか「ペット」だと思ったらしい（出典：Google） 人間が世話をしているからか「ペット」だと思ったらしい（出典：Google）



実写とアニメの区別も可能（出典：Google） 実写とアニメの区別も可能（出典：Google）