一日の大半をWebブラウジングに費やしているような人は、その知識がWeb上の文章が対応しているといっても過言ではない。いや、これは言い過ぎですね。

上のは言い過ぎにしろ、中途半端な知識があって「あー、それどっかのWebページでみたんだけどなー、どこだっけなー」とイライラするってのはありがち。そこで、自分の観たWebページの内容をインデクシングして、すべて検索できるようにすれば快適に違いない。より抽象的に言うと、自分の頭ん中に入りきらなかったものを溜め込んでおく、シンクのようなものがあれば便利だよなー、って感じ。

というわけで、Plagger + Subscription::BrowserHistory + HyperEstraierを使った、観たWebページ検索ツールを作ってみた。

実は、このツールを使うと、わりと危険なことが起こる可能性がある。このエントリー最後に書いた注意を読んでから試したい人は試すと良いです。どうなってもうちは責任とれませんので。



注意(けっこうやばげ) とりあえず作ってみたものの、いくつか問題がある。しかも、結構やばい感じの問題だったりするので注意。 Filter::EntryFullTextはとりあえず、履歴にあるURLにすべてアクセスする。そうするとアクセスしてはいけないURLにアクセスしてしまうかもしれない。URLによっては勝手にコメント投稿しちゃったり、お買い物で購入ボタンをぽちっと押してしまうかもしれない。基本的に認証はスルーできないはずなので、滅多にそんなことにはならないと思うけど。 あと、履歴が全部含まれるので、他人に検索されたりすると、見せたくないものまで見られるかも。プライバシーの問題という。 ともかく、履歴URLを片っ端からアクセスして、それをさらすという事。注意ですよ。