Googleが米国時間9月5日、「Dataset Search」を立ち上げたと発表した。

 学術的な資料の検索サービス「Google Scholar」と同じように、パブリッシャーサイトやデジタル図書館、執筆者の個人的なウェブページなど、あらゆるホスト先のデータセットを対象とし、科学者やデータジャーナリストらがウェブ上の膨大な情報の中から必要なデータセットを容易に見つけ出すのを支援する。

 たとえば、日々の天候の記録を分析したい場合、「daily weather」と入力すると、米航空宇宙局(NASA)や米海洋大気庁(NOAA)のほか、Hardvard大学の「Dataverse」などの学術機関のレポジトリのデータが情報提供者や更新日などの情報とともに表示される。
https://japan.cnet.com/storage/2018/09/06/144fbfe504337e7d5604c0d9c0670898/BO99AzQyhaw.max-1000x1000.png

Dataset Searchの開発にあたり、Googleはデータセットの提供者に向けたガイドラインを作成し、作成者や公開日、データ収集方法などの情報を提供するよう促している。情報はオープンスタンダードのschema.orgに準拠して整理されている。この情報をGoogleが分析し、同じデータセットの異なるバージョンを特定したり、そのデータセットについて論じている可能性のあるものを抽出したりしている。

 現在も複数の言語に対応しており、今後も対応する言語を増やしていく予定だ。
https://japan.cnet.com/article/35125193/