2019年12月12日 19時00分 ネットサービス

ウェブ上の情報を記録・保存する「インターネット・アーカイブ」の存続をひっそりと脅かしているものとは？

by drosen7900



非営利団体のインターネット・アーカイブは、日々インターネット上に現れては消えていく大量のウェブサイトやデータを記録・保存しています。インターネット・アーカイブによって記録された情報は貴重な資料となり得るだけでなく、裁判における証拠能力があるとも認定されていますが、そんなインターネット・アーカイブがひっそりと存続の危機に陥っているとのことです。デジタルアーカイブの界隈に多大な貢献をしており、インターネット・アーカイブの中心人物としても知られるジェイソン・スコット氏は2019年12月10日、「インターネット・アーカイブが危機に陥っており、人々には寄付をお願いしたい」とTwitter上で訴えました。





A thread about Internet Archive's "Silent Killer" and why you should both donate to @internetarchive this month (https://t.co/EZkFMNo1xX) and encourage others to do so. (Photos by Jamie Lyons) pic.twitter.com/5Y566JvQO6 — Jason Scott (@textfiles) 2019年12月10日



スコット氏によると、インターネット・アーカイブは20年にわたってウェブサイトのコピーを保存し、さまざまな形式のメディアを「Wayback Machine」などのサービスでホストしているとのこと。



The Archive has been saving copies of websites and hosting many different forms of media for a couple decades now. As part of what people think as The Wayback Machine (https://t.co/eRMnoT5Xyj), crawlers and partner crawlers have been doing scans of the web for most of that time. pic.twitter.com/FWfYxxCiTG — Jason Scott (@textfiles) 2019年12月10日



スコット氏がインターネット・アーカイブに加入した2011年の時点で、およそ5ペタバイト(PB)(5000TB)のデータが保存されていましたが、さらに入念なクローリングが標準化されたことで、2019年の時点でインターネット・アーカイブが保存するデータ量は60PBを超えるにまで至ったそうです。2019年になって新たに追加されたデータは10PBにも及ぶそうで、「2019年には1996年～2011年に追加した量の2倍ものデータが追加されました」と、スコット氏は述べています。



I joined in 2011, and it's now 2019. The whole site was 5 petabytes when I joined.



IT IS OVER SIXTY PETABYTES NOW.



Just this year, we will add at least ten more petabytes of data. So in 2019, we will add two times as much data as we'd added from 1996-2011. pic.twitter.com/FzERUc2TGJ — Jason Scott (@textfiles) 2019年12月10日



記録するデータ量の増加と共に発生するのが、データを保存するドライブの容量問題です。インターネット・アーカイブではサーバーラックのドライブを2TBのものから8TBまたは16TBのものに強化しており、より多くのデータを小さなスペースに収めようと努力しています。時折、「データをAmazonやGoogleのクラウドに保存してはどうか」と聞かれることもあるそうですが、利用規約や転送費の面を考慮して、サーバーを自分たちで管理しているとのこと。



We've switched from 2 terabyte drives to 8 to 16 currently. This means we can fit more data in smaller spaces. These two server racks have 10.5 raw petabytes of data in them. Naturally, they're mirrored as well. pic.twitter.com/b0nVrpYuFG — Jason Scott (@textfiles) 2019年12月10日



インターネット・アーカイブには毎日100万人以上のユニークユーザーがアクセスしており、ユーザー層は研究者やジャーナリスト、活動家などさまざま。すべてのユーザーはインターネット・アーカイブが保存している膨大なコンテンツにわずか数秒でアクセス可能です。たとえば1999年にサービスがスタートし、2013年に閉鎖されたミニブログの「Xanga」や……



Xanga was/is a blogging site that announced they were converting to "2.0" and the websites that had been around for 15 years were going to go through a little rough patch, i.e. stored and inaccessible, unless the user took action. We backed it up. 10 terabytes. pic.twitter.com/AhK5PRHWHa — Jason Scott (@textfiles) 2019年12月10日



YouTubeとの競争に敗れて2015年に閉鎖されたムービー共有サイトの「BLIP.TV」



There have been a number of video sharing sites that have gone under as the YouTube juggernaut won the battle. One of them was https://t.co/12qwzO4MPs, which had many unique videos that are otherwise lost. Archive Team backed a bunch of it up. 227 terabytes. pic.twitter.com/89kxT6FOAg — Jason Scott (@textfiles) 2019年12月10日



2012年に閉鎖された写真共有サイトの「Webshots」など、インターネット・アーカイブはすでに閲覧できなくなってしまった数多くのウェブサイトを当時の状態のまま保存しています。



Webshots was a photo sharing site from 1999 to 2012, when it was sold and converted to "Smile!", and in doing so, they deleted 13 years of user photos and galleries. We backed it up. 117 terabytes. pic.twitter.com/YXvjuu7rk5 — Jason Scott (@textfiles) 2019年12月10日



また、2019年4月にサービスが終了した「Google＋」のコンテンツをインターネット・アーカイブに保存する活動も行われ、消えてしまうはずの膨大なデータがインターネット・アーカイブによって守られています。



Google＋が終了する前に投稿をインターネットアーカイブに保存しようという試み - GIGAZINE





こうした活動に加え、日々の入念なクローリングは確実にインターネット・アーカイブのディスク領域を圧迫しています。その結果、サーバーの運営費はインターネット・アーカイブにとって大きな財政的負担となっており、静かにかつ確実に危機に追いやっているとのこと。コストを削減したければクローリングするウェブサイトを減らし、一部のデータ保存活動を停止すればOKですが、この考えは世界全体にとっていいアイデアではないとスコット氏は主張。



そこでスコット氏は人々に向けて、インターネット・アーカイブに寄付をしてくれるよう訴えています。アメリカではインターネット・アーカイブへの寄付は非課税であり、クレジットカードやPayPalでの支払い、さらには暗号通貨での支払いなどにも対応しています。





インターネット・アーカイブへの寄付は、以下のページから行うことが可能です。



Donate to the Internet Archive!

