こんにちは。検索・編成部の原島です。

大学の研究者にお会いすると、「クックパッドのデータを研究に使用したいんですが...」と相談されることがあります。料理に関する研究をしているけれど、実際のデータがないため、なかなか研究が進まないという相談です。

料理に関する研究が進まないのは、クックパッドにとっても残念なことです。これらの研究は、クックパッドのサービスを改善するための「芽」でもあります。データがないだけで芽が育たないのは、非常に悲しい話です。

このような現状を打破するため、本日から、クックパッドのデータを研究者に公開します。このエントリでは、我々が準備してきたデータ公開の仕様について QA 形式で解説します。

誰が利用できるの？

申請していただいた研究者です。ただし、公的機関（e.g. 大学、独立行政法人）の研究者に限ります。申請時には、クックパッドと国立情報学研究所（後述）による審査があります。

何が利用できるの？

レシピと献立に関するデータです。レシピについては、クックパッドで 2014 年 9 月 30 日までに公開されたレシピが利用可能です。各レシピに付随するデータは以下のとおりです。

タイトル

材料

手順

つくれぽ（「作りましたフォトレポート」の略）

etc

献立については、クックパッドで 2014 年 9 月 30 日までに公開された献立が利用可能です。各献立に付随するデータは以下のとおりです。

タイトル

調理時間

ポイント

コツ

etc

レシピ・献立ともに、公開するのは、クックパッド上で誰でも閲覧できるデータ（クロール可能なデータ）だけです。

どうすれば利用できるの？

国立情報学研究所（以下、NII）が運営する情報学データリポジトリで利用申請を受け付けています。NII は、情報学分野の研究を促進させるため、様々なデータを集約しています。そして、それらを利用するための統一的な窓口を設置しています。クックパッドのデータも、NII の協力の下で公開しています。

http://www.nii.ac.jp/dsc/idr/cookpad/cookpad.html

利用手順は下図のとおりです。申請の審査も含めて、申請してから 1 〜 2 週間でデータを利用できます。

いつから利用できるの？

本日（2 月 24 日）から申請を受け付けます。

なぜ公開するの？

最後に公開の動機です。データを公開する一番の動機は、冒頭でも述べたとおり、料理に関する研究を促進させたいというものです。

料理に関する研究をしている人は沢山います。最近では、料理に関する研究会や国際会議なども開催されています。しかし、データがないことで、多くの研究が行き詰っています。これは非常に残念なことです。

今回のデータ公開は、これらの研究を支援するものです。データがあれば、既存の研究を発展させたり、新しい研究を創出させることができるかもしれません。そして、それらは、まわりまわって、クックパッドのサービスを改善するための芽となります。

また、別の動機として、悪質なクロールを減らしたいというものがあります。

残念ながら、研究者の中には、クックパッドのデータを使用するため、悪質なクロールを行う方がいます。短時間に膨大なリクエストが送られると、最悪の場合、クックパッドのサービスに影響が出る恐れがあります。

しかし、クックパッドがデータを公開すれば、わざわざクロールする必要はありません。公開されているデータを利用する方が、圧倒的に楽です。そして、悪質なクロールが減れば、サービスの健全性も向上します。

まとめ

本日からクックパッドのデータを研究者に公開します。公開するのはレシピや献立に関するデータです。利用申請は NII で受け付けています。本件を通して、沢山の研究が前進すれば幸いです。

データ公開は、私と会員事業部の有賀、同部の村田で運用しています。本件に関するお問い合わせなどありましたら、recipe-corpus [at] cookpad.com までご連絡ください。よろしくお願いします。