データセットは、同じ目的や形式でまとめられたデータの集まりです。生物多様性では、観察記録、標本記録、音声記録、調査地点、分類名、位置情報などがデータセットとして扱われます。
単にデータがたくさんあるだけでは、使いやすいデータセットにはなりません。何を集めたのか、どの期間か、どの地域か、誰が管理しているか、どの条件で再利用できるかが必要です。
なぜ重要か
研究、自治体、企業レポートで使うときは、個別の投稿よりも、まとまったデータセットとして扱えることが重要になります。データセットの説明がないと、あとから同じ意味で読み返せません。
ikimon.lifeでの扱い
ikimon.life では、観察記録をそのまま雑にまとめるのではなく、同定状態、公開範囲、Evidence Tier、ライセンス、位置精度を分けて扱う必要があると考えています。
研究公開や外部連携では、どの記録が含まれ、どの記録が除外されるかを明示することが大切です。