Mozillaが発表したパブリックドメインの音声データセットを提供するプロジェクト「 Common Voice 」が、4万2000人以上のデータ提供者から18言語・1361時間にもおよぶ音声データセットが集まったこと、そしてこのデータセットを公開することを明かしました。 Sharing our Common Voices - Mozilla releases the largest to-date public domain transcribed voice dataset - The Mozilla Blog https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-voices-mozilla-releases-the-largest-to-date-public-domain-transcribed-voice-dataset/

・関連記事

IBMが100万人の顔データを収めた膨大なデータセットを「顔認識技術の公平性」を目指してリリース - GIGAZINE



Googleが科学者やジャーナリストを助ける「データセット検索」の提供を開始 - GIGAZINE



27TB以上の研究用データセットをBitTorrentで共有する「Academic Torrents」 - GIGAZINE



「バッハっぽさとは何か？」をAIに理解させることを可能にする330曲・100万音分のデータセットが公開される - GIGAZINE



史上最大規模の動画データセット「YouTube-8M」公開 - GIGAZINE



2019年03月01日 19時00分00秒 in ソフトウェア, Posted by logu_ii

You can read the machine translated English article here.