今月の情報処理学会誌(2008年8月号)が届いた。

情報爆発に関する特集も知らないことが書いてあったりして参考になる。たとえば「情報爆発時代のための新しい超高速アルゴリズム」には

最初に提案されたアルゴリズムはaprioriとよばれるもので，ディスク上のデータへのアクセス回数を最小化するようデザインされている．その後，データがメモリに収まるようになると，メモリにデータの必要部分を格納し，深さ優先的に山登り探索を行う第２世代のアルゴリズムが提案された．現在の主流は，探索中に必要ないレコードやアイテムを再帰的にデータから消去して圧縮を行う第３世代のアルゴリズムである．

(p.898) とあり、さらにLCMという新しいアルゴリズムを開発したのだという。自然言語処理的にはどういう局面でこのあたりのアルゴリズムが役に立つのか分からないが、こういう解説記事で知っておくとなにかのとき使えるかな?

あと楽しみにしていたのがミニ小特集「コンピュータ将棋は止まらない」(「ミニ」「小特集」は「馬から落馬する」的な表現のような……)。今年の世界コンピュータ将棋選手権での優勝プログラムがアマ名人2人と特別対局して連覇した、というのは知らなかったのだが、コンピュータ将棋もとうとうここまで来たのか、という感じ。

小特集の中でも何回か触れられているが、羽生や森内あたりのトッププロも悲観的に見て2015年、楽観的に見たら2010年までには確実に勝てるようになっているだろうな……。中学生のころは「自分の生きている間になるかどうか」なんて思っていたのだが、予想していたより遥かに速いペースである。

技術的なブレークスルーは2005年の Bonanza による評価関数の自動学習のようだが、今はまだ有効な特徴量の発見に使うくらいに止め、具体的なパラメータは人手でチューニングする手法も互角に戦えているらしい。職人芸的に(将棋の強い開発者が自分の知識を用いた)パラメータチューニングする時代から、とにかく利きそうな素性を放り込んで膨大な棋譜の中から統計処理・機械学習するという時代に移行するという、どうやら他の分野でも見たような流れの真っ只中にいるようだ。

膨大にデータがあるなら将棋に全く詳しくない(ルールが分かるくらい)の人でもプログラムが作れるというのが統計的手法のおもしろいところで、かな漢字変換でもそれなりの大きさのデータセットが(無料かもしくは数千円程度で)公開されていればもっと流行るのかなあと思ったりもする。

興味ある人は一読をお勧めする。