株式会社富士通研究所は、磁気テープストレージにおいてアクセスを高速化する技術を開発した。

磁気テープストレージは、大容量で低コストなストレージとしておもにバックアップ用途で用いられており、近年では転送速度の向上やファイル単位のデータ管理機能をもたらすファイルシステム「LTFS(Linear Tape File System)」も普及してきた。しかしテープ型ストレージの構造上、最新の規格「LTO8」を採用した場合でも、シーケンシャルリードが360MB/sと高速な一方で、ランダムリードがその10分の1以下と非常に低速となってしまい、必要なデータに必要なタイミングでアクセスするといったアーカイブ用途での利用が難しかった。

今回同社では、複数のテープカートリッジを管理するLTFSの上位に、新たにそれらを仮想的にまとめる「仮想統合ファイルシステム」を開発。ユーザーは個々のテープカートリッジを意識せずデータにアクセスできるようになる。

磁気テープでは、長さ方向に分割された「ラップ」上にデータが順に書き込まれ、端まで行くと折り返していく。このため、書き込み順にあたる論理アドレスと、実際にデータがある場所にあたる物理アドレスとの間の距離が大きく異なる。

一方、仮想統合ファイルシステムでは、テープ上の物理位置が近いものから順番に処理を行なっていき、ヘッド移動の効率化を図る。また、エラー部分のみがデータ末尾に再書き込みされる仕組み上、ファイルサイズから書き込み終了の場所が決定できないため、定期的にヘッドの位置を計測する。加えて、読み出し開始位置にヘッドをあわせる時間を短縮するため、同一ラップ上で近い位置に2つの読み出し要求があった場合は、2つの間のデータも読み出した上であとで破棄するといった工夫もされている。

各ファイルのインデックスを磁気テープ上に持つLTFSの仕様上、ファイル数が読み出し性能に影響を与えやすく、とくにサイズの小さいファイルを大量に書き込んだ場合は大幅な性能低下を引き起こしてしまう。これを解決するため、指定サイズ以下のファイルについては、LTFS上ではひとまとめの大きなファイルとして扱える仕組みを開発。加えて、ファイルのメタデータを仮想統合ファイルシステム側で管理することで、ファイルの一覧表示や属性の制御、削除などといった読み出し以外の操作をテープへのアクセスなしで処理できる仕組みとした。

これらの高速化技術を実装した磁気テープストレージにおいて、50,000個のファイル(1個あたり100MB)からランダムに100個読み出すテストを実施。従来は5,400秒必要だったところ、4.1倍となる1,300秒での読み出しが可能となった。また、256個のファイル(同1MB)をHDDから磁気テープ上に移動させるテストでは、従来は2.5秒かかっていたところ、1.9倍の1.3秒で移動が行なえた。

同社では、2022年度中の製品化を予定しており、業務での使用を想定した検証を進めている。