株式会社Gunosyは4月28日、同社が取り組む「クリックベイト（釣り記事）」記事を回避するためのアルゴリズム研究開発について同社共同創業者開発本部データ分析部の関喜史氏が説明を行った。

Gunosyは、スマートフォン向けのキュレーションアプリ「グノシー」や、KDDIと共同開発したニュースアプリ「ニュースパス」を提供。約600媒体と提携しており、1日数千本配信される記事の中からアプリに掲出する記事を独自のアルゴリズムを用いて選定している。

具体的には、1）記事のテキスト情報や媒体社の属性情報から該当する配信先のカテゴリを決定する「カテゴリ推定」、2）同一の話題について言及している記事のクラスタを生成し、スコアリングする記事選定、3）TwitterやFacebookなどSNSでの話題度に応じてスコアリングする「話題度推定」、4）ユーザーの滞在時間や読了率、CTRをリアルタイムに集計し、記事のスコアに反映させる「リアルタイム記事評価」――など、機械学習・自然言語処理を用いて選定する。

インターネット広告の市場規模が拡大したことで、ページビュー（PV）を増やすことへの価値が高まり、より少ないコストでPVを上げることに比重が置かれるようになった。そこで、ユーザーに記事をクリックさせるための工夫（メディアハック）が積極的に行われるようになった結果、著作権処理や情報の真偽確認を怠ったDeNAの“WELQ問題”、虚偽やデマをあたかも真実であるように報じる“偽ニュース”、クリックベイトといった過剰なメディアハックが問題になった。

現状のいきすぎたメディアハックへの対策として、Gunosyではクリックベイトの配信を減らすためのアルゴリズムの研究開発を2016年秋ごろから開始したという。この取り組みについて「ユーザーへ最適な情報を提供することがプラットフォームとしての社会的責任だ」と関氏は語る。

偽ニュースの過度な拡散を防ぐための取り組みはすでに業界全体で行われており、情報の共有、メディアの事前審査やガイドライン策定などの対策が取られてきた。一方で、クリックベイトに関してはまだ十分な議論がなされていない状況だという。

クリックベイトは、タイトルの情報量を落として誤った解釈に誘導する「誤読誘発型」、ユーザーが期待するコンテンツ（画像など）をタイトルで想起させる「画像想起型」、過剰なタイトルで引きつける「過剰表現型」に分類できる。スマートフォンのニュースアプリは記事概要が表示されていないケースも多く、記事タイトルとサムネイル画像がユーザーの意思決定に大きく影響する。そうすると、ユーザーを煽るクリックベイトを量産するサイトにPVが集まりやすくなり、結果的にネットメディアやプラットフォームの信頼性の喪失につながることになる。

ユーザー満足度が下がることで、アプリをアンインストールされることは避けたいが、「クリックベイトは表現の領域の問題になるため、ルールとして明文化するのは難しい」と関氏は述べる。

そこで、滞在時間や、スクロール速度、SNSシェア数など、ウェブ上で取得できるユーザー行動をもとに満足度を推定する実験を行ったという。ユーザー行動をもとにしたクリックベイト対策は、2014年にFacebookが先行して行っているが、Gunosyでも一部のユーザーにA/Bテストを実施し、ユーザーの行動変化を分析した。

ユーザーの滞在時間が数秒程度と短かった場合にクリックベイトとして判別し、表示を切り替えるテストを行ったところ、一部のユーザーで満足度が高まる傾向が見られた一方で、別のユーザーでは低下する傾向が見られた。滞在時間が長くとも、ユーザーとしては不快に感じるケースもあるため、滞在時間や読了率で評価するのは指標として十分ではないことが分かったそうだ。

そのため、ユーザーが記事に対する満足度合いをアプリで回答・送信できるフィードバック機能の導入に向けたテストも実施した。最終目標としては、ユーザーがクリックベイト記事を目にする前に予測し、掲出を回避するシステムを目指す。

「行動に基づいた特定では、最初に記事にアクセスしたユーザーの満足度を下げることもあるため、将来的には事前に予測できる仕組みを作る。テクノロジーの進化によってユーザーの行動は詳細に分かるようになった。これをもとに、AI技術でも人間と同じように“だまされた”と感じてもらえるようなシステムは作れるのではないかと思う。」

また、アルゴリズムの開発だけでなく、業界全体で議論を深めて適切なメディアハックの線引きを明確化する必要があるという。さまざまな事例をもとに、各社の取り組みやガイドラインの検討など、積極的な情報共有が求められるとしている。