アーロン・シュワルツの Raw Thought で theinfo.org の立ち上げを知る。

Open Library の作業でどでかいデータを扱った経験を活かしたとのことで、こういうのをスクレイピング技術というらしいが、恥ずかしながらよく分からなかったので検索したら、@IT の「進化する“Webスクレイピング”技術の世界」という文章がひっかかった。例によって西村賢さんの記事である。

HTML の XML 化による Web1.0 サイトの Web2.0 化とな。