2019年05月15日 06時00分 メモ

Google検索の「トップニュース」欄では少数のニュースサイトが優先的に表示されている

by Negative Space



Googleが提供する検索エンジンのGoogle検索は、ウェブ上で最も多く使われている検索エンジンです。そんなGoogle検索が表示するニュースサイトの傾向について研究者らが分析した結果、少数のニュースサイトが優先的に表示されていたり、ニュースサイトの思想傾向に偏りがあったりすることが明らかになりました。



Search as News Curator:The Role of Google in Shaping Attention to News Information

https://dl.acm.org/citation.cfm?id=3300683



Audit suggests Google favors a small number of major outlets - Columbia Journalism Review

https://www.cjr.org/tow_center/google-news-algorithm.php



2019年4月末にウェブ分析企業のParse.lyが発表した調査結果によると、ニュースサイトへのトラフィックのうち23％が検索エンジンから来るものでした。中でもGoogle検索のアルゴリズムはニュースサイトのトラフィックに大きな影響を与えています。



しかし、多くの人はGoogle検索のアルゴリズムがどのように働いているのかを知らず、検索結果に表示されるニュースサイトにどのような傾向があるのか、あるいは多様性が確保されているのかは不明です。そこでノースウェスタン大学のNick Diakopoulos准教授らの研究チームは、Google検索で表示される「トップニュース」の項目について調査を行いました。



Google検索で多くのニュースがヒットするワードを検索すると、関連するニュースが検索結果の上部にある「トップニュース」という表示枠に表示されます。トップニュースの欄にはおよそ3個ほどの関連ニュースおよびニュースがリリースされた時間が表示され、多くのユーザーはトップニュースの表示枠からニュースサイトへとアクセスしているとみられます。





Diakopoulos氏らはこのトップニュースに表示されるニュースサイトの傾向を調査するため、2017年11月に話題となった200以上の検索ワードについて検索結果を分析しました。用いられた検索ワードは、Googleのトレンドに上がったニュースイベントから手動でピックアップされたもので、「コリン・キャパニック(colin kaepernick)」「地震(earthquake)」「税制改正(tax reform)」「ヘルスケア 政府(healthcare gov)」といったワードが含まれていました。



検索に際してはGoogle検索の表示結果が個人の好みにパーソナライズしてくる影響を最小限に抑えた上で、各検索ワードは1分間に1度、24時間にわたって検索されたとのこと。また、研究チームは各検索によってトップニュースに記事が表示された頻度を「インプレッション」として計測し、どの記事がどれほどのインプレッションを稼いだかという点についても分析しました。たとえトップニュースに表示されても、すぐにトップニュースから外されてしまってはインプレッションは少なくなり、長期にわたって表示され続ければ多くのインプレッションを稼いだことになります。



調査の結果、合計で6302個ものニュース記事へのリンクが、トップニュースに表示されたとDiakopoulos氏は述べています。そして表示されたニュース記事のサイトについて分析を行ったところ、合計で678個ものニュースサイトがトップニュースに表示されたものの、わずか20のニュースサイトが全インプレッションの半分以上を占めていることが判明。さらに、上位20％のニュースサイトが全インプレッションに占める割合は、実に86％にも及ぶことがわかりました。トップ3のニュースサイトであるCNN、ニューヨーク・タイムズ、ワシントン・ポストが全インプレッション占める割合は23％にのぼり、少数のニュースサイトが多く表示されていることも明らかとなっています。





ニュースサイトの多様性は検索ワードによってばらつきがあり、1つの検索ワードあたり平均で19のニュースサイトが表示されたものの、30％の検索サイトでは10個以下のニュースサイトしか表示されませんでした。また、「レックス・ティラーソン(rex tillerson)」という検索ワードでは合計で38ものニュースサイトが表示されたものの、インプレッションで考えるとCNNとタイムが75％を占めていたとのこと。



このようにGoogle検索によってトップニュースに表示されるニュースサイトには、一定の傾向があることが判明しました。しかし、検索エンジンの検索結果がユーザーの態度や意見に影響を与え、認識や固定観念を形作るという(PDFファイル)研究結果も示されており、ニュースサイトの多様性は投票結果などを左右しかねない重要な問題です。



そこで、Diakopoulos氏らはGoogle検索のトップニュースに表示されたニュースサイトについて、イデオロギー的な観点からも分析を行っています。研究チームはFacebookでの共有結果からニュースサイトの思想傾向を分析した過去の研究にもとづき、各ニュースサイトの思想が「左寄り(左翼的)」か「右寄り(右翼的)」かを判断し、インプレッションの割合を調査しました。





その結果、全インプレッションのうち62.4％が左寄りと評価されたニュースサイトのものであり、右寄りと評価されたニュースサイトの割合はわずか11.3％に過ぎませんでした。残りの26.3％は右寄りとも左寄りとも評価されていないニュースサイトだったそうですが、たとえ残りの26.3％を右寄りのニュースサイトに分類したとしても、Google検索のトップニュースに表示されるサイトは明らかに左寄りだという傾向があるとDiakopoulos氏は述べています。



なお、Google検索で使用した検索ワードをGoogleのデータベースであるGDELTでチェックしたところ、左寄りの記事は右寄りの記事よりも2.2倍ほど多かったそうですが、これを考慮に入れてもGoogle検索のトップニュースは左寄りの傾向があるとのこと。



また、Googleのトップニュースには記事のリリース時刻も表示されていますが、これについても研究チームは分析を行っています。その結果、トップニュースに表示された記事のうち83.5％が24時間以内にリリースされたものであり、1時間以内だったものは13.1％にものぼることも判明。つまり、新鮮なニュースをリリースできる媒体が、Google検索で優位に立ちやすいようです。





最後に研究チームは、「Google検索のトップニュースがどれほどのトラフィックをニュースサイトにもたらしたのか？」という点についても、検索ワードやインプレッションなどの情報と共に、アクセス解析ツールのChartbeatを用いて分析しています。インプレッションあたりのトラフィック増加は検索ワードごとにバラつきが多かったそうで、「マット・ロウアー(Matt Lauer)」という検索ワードでは、1インプレッションあたり3961ものトラフィック増加が観測されたものの、58％の検索ワードでは1インプレッションあたりのトラフィック増加は100以下にとどまったとのこと。



研究チームがトップニュースのインプレッション数および通常検索の表示結果に基づいて、Google検索による記事のトラフィック数予測モデルを構築したところ、1時間にわたってトップニュースに表示された場合、トラフィックは15.5％増加しました。その一方で、通常検索の結果で1時間にわたって上位に表示された場合のトラフィック増加は9.4％だったそうで、トップニュースに選ばれることがトラフィック増加に役立つことが示唆されています。



この予測モデルに基づくと、CNNがトップニュースの恩恵によって24％のトラフィック増加を達成する一方で、ナショナル・パブリック・ラジオ(NPR)は3.7％の増加しか得られないということがわかりました。研究チームはどういったアルゴリズムでGoogleがトップニュースを選択しているのかは不明だとしながらも、いくつかの支配的なニュースサイトはトップニュースの選択傾向を解読し、ほかのニュースサイトよりも優位に立っている可能性があると述べました。

