2019年03月18日 09時53分 ネットサービス

Google＋が終了する前に投稿をインターネットアーカイブに保存しようという試み



Googleのソーシャルネットワークサービス「Google＋」は、2019年4月2日のサービス終了がアナウンスされています。5000万人分の個人情報が漏洩するリスクがあるバグが発見されたことでサービスとしての寿命を短くすることとなったGoogle＋ですが、サービス終了までに過去に投稿されてきた「一般公開されている投稿」を保存しようと奮闘しているチームが存在します。



The Internet Archive is working to preserve public Google+ posts before it shuts down - The Verge

https://www.theverge.com/2019/3/17/18269707/internet-archive-archiveteam-preserving-public-google-plus-posts



Google＋は2019年4月2日にサービスが終了し、そこからプラットフォーム上のデータが削除される予定となっています。そうなるとGoogle＋に投稿された過去の投稿は永久にインターネット上から消えてなくなってしまうということで、インターネット上の貴重なデータのアーカイブを行うアーカイブチームが、一般公開されている投稿をインターネットアーカイブに保存する試みをスタートしています。



アーカイブチームは海外掲示板のReddit上で、Google＋のポストを保存する取り組みをスタートしたと発表。データのバックアップにはスクリプトを使用しており、一般公開されたポストのみ保存可能で、非公開または削除された投稿をバックアップすることはできないとのこと。加えて、インターネットアーカイブは自分のポストをアーカイブしてほしくない人にはアカウントの削除を促しており、特定コンテンツの削除要求手続きも案内しています。



Saving of public Google+ content at the Internet Archive's Wayback Machine by the Archive Team has begun : plexodus

https://www.reddit.com/r/plexodus/comments/az285j/saving_of_public_google_content_at_the_internet/





アーカイブチームはGoogle＋上のすべてのコンテンツをアーカイブすることは難しいとしており、ひとつの投稿につきアーカイブ可能なコメントの数は500件までとしています。また、コメントは静的HTMLとしてポストのサブセットとなるだけなので、投稿に連なる長いディスカッションスレッドのように維持されることとなるかどうかは明らかになっていません。



そのほか、ポストに含まれる写真およびムービーコンテンツはフルの解像度のまま保存されることはなく、解像度を落として保存されることとなる模様です。





アーカイブプロジェクトはPCまたはサーバーシステム上の仮想マシン(VirtualBox、VMWare、またはその他の仮想化システム)上で実行される「グラバー」スクリプトに基づき、「Warrior」と呼ばれるツールを使用することで遂行されるとのこと。記事作成時点では以下のページからWarriorを入手可能なので、アーカイブチームの保存活動を手助けすることもできます。



ArchiveTeam Warrior - Archiveteam





なお、アーカイブチームは「コンテンツのアーカイブはプロジェクトが進行する速度とその管理により制限を受けます。過去の経験から、アーカイブチームはすぐに驚くべき量のデータを保存することが可能で、一般的な成功を収めるでしょう」と記しています。

