研究・データ・信頼性について
ikimon は「市民が見つけた生きものを、研究や保全で扱える地域データへ育てる」ための基盤です。AI の候補、市民の同定、反対意見、専門家レビューを同じ履歴に残し、どの記録をどの強さで使えるかを段階分けします。
ここでいう研究利用可能とは、研究用 API / DwC-A の標準公開対象に入るという意味です。論文上の結論、不在証明、増減、因果関係まで自動で保証するものではありません。
参考にした設計
ikimon の信頼設計は、単独のサービスを真似るのではなく、世界中の市民科学で使われている実務を組み合わせます。
- iNaturalist: Community Taxon の考え方。単なる多数決ではなく、分類系列上でどこまで合意しているかを見る。
- eBird: 地域・季節・希少性のフィルタと reviewer による確認。あり得る記録でも、文脈に合わないものは追加確認に回す。
- Pl@ntNet: AI 候補を入口にし、コミュニティ検証を経て公開データとして扱う流れ。
- GBIF: occurrence として外部利用するための分類名、位置、日付、ライセンス、証拠の品質要件。
- iSpot 型の reputation / expertise: 誰の確認か、どの分類群で信頼できるかを重く扱う。
そのため ikimon は「研究に使える」と雑に断言しません。市民記録を、分類合意・反対意見・専門確認まで追跡できる地域生物データ基盤として扱います。
AI と人の役割
AI は候補と見分けるヒントを返します。市民は場所・時刻・写真・気づきを残し、同じだと思う、別の分類だと思う、証拠が足りないといった判断を足します。必要な場面では、authority / expert reviewer が確認します。
AI が自動で確定したように見せないことが前提です。AI は入口であり、研究公開の判定は人の同定、反対意見、分類名照合、証拠メディアを合わせて決めます。
同定の信頼レーン
- AI candidate: AI が候補名と次に見るべき特徴を返す。
- Public identification: 市民が「同じ」「別分類」「証拠不足」などの判断を残す。
- Community consensus: 2 名以上の独立した同定から、分類系列上の合意点を計算する。
- Authority / expert review: 専門家または権限を持つ reviewer が、難分類群、反対意見、証拠不足を確認する。
- Research export: 条件を満たす record だけを研究用 API / DwC-A の標準公開対象にする。
同定ワークベンチだけでなく、観察詳細ページからも同定に参加できます。観察カード、地図、プロフィール、探索ページからは /observations/:id#identify へ送り、専門権限者には batch review への導線も出します。
Evidence Tier — どの記録が研究用に渡せるか
記録は信頼レーンに沿って段階が変わります。
- Tier 1: AI 候補提示のみ。その場のメモとしては有効ですが、研究の主張の根拠にはなりません。
- Tier 1.5: AI 候補に、地域・季節・過去記録・組写真などの補助条件が重なった状態。人が確認するための強い候補として扱います。
- Tier 2: 市民による同定が 1 件付いた状態。観察の読み取り方向が見え始めますが、標準の研究公開対象ではありません。
- Tier 3+: 2 名以上の独立した合意、または authority / expert review が付いた状態。研究用 API / DwC-A の標準公開対象です。ただし open dispute、分類名照合、位置秘匿、ライセンス、sampling effort は別に確認します。
- Tier 4: 調査設計、努力量、位置・ライセンス、専門確認までそろい、共同研究や保全判断で根拠パッケージとして扱える状態です。
/api/v1/research/occurrences と export_dwca.php は、既定で Tier 3+ のみを返します。open dispute がある record は除外します。
分類についての合意
ikimon の同定合意は、同じ名前が 2 票あるかだけでは決めません。分類系列上の合意点を採用します。
たとえば 1 枚の写真に複数の生物が写っている場合、対象ごとに occurrence を分けて判断します。A さんが「モンシロチョウ」、B さんが「Pieris 属」、C さんが近縁別種を提案した場合、種では割れていても、属や科では合意していることがあります。このとき ikimon は、支持が 2/3 以上かつ 2 名以上の独立支持がある最下位分類を community taxon として扱います。
種レベルで割れているのに、最初の候補名をそのまま研究公開名にすることはしません。分類系列が衝突する場合は、種 Tier 3 には上げず、属・科など安全な階級へ戻すか、専門家レビューに回します。
反対意見が出たとき
「別の分類では?」「証拠が足りない」「生物ではない」「位置や日付がおかしい」という指摘は open dispute として残します。
open dispute が 1 件でもある record は、Tier 3 へ昇格しません。研究用 API / DwC-A からも除外します。反対意見を消して合意に見せるのではなく、どの根拠で採用・却下・証拠不足にしたかを履歴として残します。
解決方法は次のいずれかです。
- 追加写真、動画、音声、形質メモで証拠を増やす。
- 位置、日付、観察条件を補足する。
- 別分類の提案を採用し、community taxon を再計算する。
- authority / expert reviewer が、採用、却下、証拠不足のいずれかで解決する。
quick capture と survey の違い
quick capture は、散歩や旅先での 1 件をすばやく残すための記録です。名前が分からなくても、場所と写真とメモを残せます。ただし、この 1 件だけで不在や増減を強く言うためのものではありません。
survey は、対象・努力量・時間をそろえて残す記録です。見つかったことだけでなく、見つからなかったメモも、手順つきの観察として扱えます。研究に近い読み方をしたいときは、こちらの前提が必要です。
位置情報とライセンス
希少種や保護上配慮が必要な位置は、公開精度を落とすか非公開にします。通常の記録でも、住所や生活圏が見えすぎる出し方はしません。
研究用に渡すときは、分類合意だけでなく、位置精度、公開可能性、ライセンス、証拠メディアの有無を確認します。Tier 3+ でも、秘匿すべき位置や利用条件に合わない記録は、そのまま外部公開しません。
言いすぎないための線引き
- 努力量がないデータだけで「いない」「増えた」「減った」を強く言わない。
- AI の候補だけで確定扱いにしない。
- 市民記録を軽視しないが、確認の重さは分けて扱う。
- 近縁種で割れた記録を、無理に種名で公開しない。
- open dispute がある record を研究用の標準公開対象にしない。
- 研究や公開に使うときほど、証拠、同定、位置、ライセンス、sampling effort を厳しく見る。
研究で使いたい方へ
データの取得方法、DOI 発行、共同研究の相談は 研究利用申請 からお受けしています。Evidence Tier 3+ の観察を対象に、Darwin Core 形式で取り回しやすい形で持ち帰れます。