2019年11月27日 16時03分 ネットサービス

InstagramのAIは「explore(発見)」タブに表示する投稿をどのようにして選んでいるのか？

by geralt



Instagramのアプリを使用すると、ホーム画面の下にある虫眼鏡のアイコンの「explore(発見)」タブから自分の好みにマッチした投稿を手軽に見つけることができます。この「発見」タブに表示されるコンテンツはいったいどのように選び出されているのか、Instagramが公式ブログでその秘密を明かしています。



Powered by AI: Instagram’s Explore recommender system

https://ai.facebook.com/blog/powered-by-ai-instagrams-explore-recommender-system/



Inside the Instagram AI that fills Explore with fresh, juicy content | TechCrunch

https://techcrunch.com/2019/11/25/inside-the-instagram-ai-that-fills-explore-with-fresh-juicy-content/



Instagramの利用者数は2018年に10億人を突破し、各ユーザーは日々無数の写真やムービーを投稿しています。こうしたコンテンツの中からユーザーの好みに合わせたコンテンツを探し出してくるのは、人力では不可能なことはもちろん、AIにも容易なことではありません。そこで、InstagramではAIを用いて、大きく分けて2つのプロセスでコンテンツを選別しています。





◆Embedding(埋め込み)

Instagramは最初に、「Embedding(埋め込み)」という手法を使って、投稿ではなくアカウント単位でユーザーの好みを探ります。例えば、深層学習で自然言語を処理する「Word Embedding(言葉の埋め込み)」という技術では、文章の文脈から単語に重み付けをして言葉と言葉の結びつきを推測しています。同様に、Instagramがアカウントごとの好みの傾向を分析する「ig2vec」でも、「埋め込み」が使われています。



一例として、あるユーザーが「犬の写真」を大量に投稿しているユーザーをフォローしたり、「いいね！」を送ったりしていれば、そのユーザーは「犬が好き」だと予測できます。このように、InstagramのAIはユーザーの一連の行動を文章に、アカウントを言葉に見立てた「アカウント埋め込み」により、アカウントとアカウントを関連付けてユーザーの好みを探っていきます。この時、ユーザーと好みが近いと判断されたアカウントを「シードアカウント」と呼びます。





◆ランキング

「埋め込み」で「シードアカウント」を見つけたら、次はそのアカウントが投稿したコンテンツの中から、ユーザーが特に好きそうな500個のコンテンツを選び出します。次に、500個のコンテンツを3段階のプロセスでランク付けして、最終的に発見タブに表示させるコンテンツを選別します。



まず最初のプロセスは、最小限の機能を備えたフィルタリング機能でコンテンツを500個から150個に絞ります。次に、150個から50個にふるい分けます。スパムやフェイクニュース、「ポリシー違反の可能性が高いコンテンツ」はこのタイミングで除外されます。そして、最終的に50個の中から特にユーザーの好みにマッチした上位25個を選定して、発見タブに表示される最初の25個のコンテンツを決定します。





Instagramのエンジニアであるイヴァン・メドベージェフ氏は、「発見タブの最もエキサイティングな点は、より興味深く関連性が高いコンテンツを見つけてもらえるように、継続的に好みを見つける方法を探しているところです。Instagramの発見タブは、常に進化し続けています」と述べて、今後のさらなる改良に意欲をのぞかせました。