できるというのがわかって以降、違う手法でも透過的データ圧縮が実現できることがわかってきました（不思議なもので、できると分かったら続々と出てくる）。 Rodrigo Gonzalez and Gonzalo Navarro, "Statistical Encoding of Succinct Data Structures", CPM 2006, [ ps.gz ] P. Ferragina, R. Venturini. "A simple storage scheme for strings achieving entropy bounds", SODA 2007, [ pdf ]

そうした中、2000年以降、圧縮索引に牽引される形で簡潔データ構造の研究が進み，それらの成果を使って透過的データ圧縮は実現できるというのが分かりました（この仕事と圧縮全文索引で定兼先生はIBM科学賞を受賞されてます）。 K. Sadakane and R. Grossi, "Squeezing Succinct Data Structures into Entropy Bounds", SODA 2006 [ pdf ] これは、（すごく間単に言えば）LZ78法をベースにしており、LZ78法で抽出されたフレーズ辞書からなるTrieをを簡潔データ構造で保存し、これを長いフレーズと短いフレーズに場合分けして、参照することで定数時間アクセスでの復元を実現しています。

TrackBack





Listed below are links to weblogs that reference 透過的データ圧縮: