米GitHubは11月13日（現地時間）、オープンソースソフトウェア（OSS）のソースコードを、人類の共有財産として1000年にわたり保存する取り組み「GitHub Archive Program」を発表した。ノルウェーの永久凍土の地下にある情報保管庫に、GitHub上のソースコードをコピーして保存する他、月単位や年単位のコピーをInternet Archiveなど協力団体のデータベースからダウンロードできるようにする。

「GitHub Archive Program」公式Webサイトより

2020年2月2日の時点でGitHb上に公開されている公開リポジトリや、重要度の高い休眠リポジトリのコピーを作成。超長寿命のデータストレージを手掛けるノルウェーの企業Piqlが、データを2次元コードに変換。約1キロの長さになるフィルムに、2次元コードを記録し保存する。フィルムはポリエステルとハロゲン化銀でできており、耐久試験では1000年の寿命があると見積もられているという。情報を引き出せるよう、索引やデータの復元方法なども残す。

データを二次元コードに変換して記録

保管場所はノルウェーのスヴァールバル諸島にある「Arctic World Archive」というデータ保管施設。スヴァールバル諸島は非武装地帯であり、保管庫は永久凍土の地下250メートルにある炭鉱跡に建設されている。環境が安定しているため情報の長期保存に向いているとされ、イタリアやブラジルなどの歴史的なデータなども保管している。

取り組みにはインターネット上の情報を保管する非営利団体Internet Archiveや、米Microsoftの研究機関Microsoft Researchなどが協力する。「全てのアクティブな公開リポジトリを1万年保存する」というさらなる目標に向け、石英ガラスにレーザーでデータを書き込むMicrosoft Researchの「Project Silica」と連携していくという。

米GitHubは「世界はオープンソースソフトウェアに支えられている」とし、「GitHub Archive Programの使命は情報を多重にバックアップすることで、価値の高い知識を未来の世代のために残していくことだ」と説明している。