差分プライバシー
- データの集計情報を公開する際に個人のプライバシーを保護する技術
- 個々のデータがDBに含まれるかどうかを外部から推測しにくくするために、結果にわずかなランダムノイズを加える
- データの有用性を維持しつつ、個人の情報が特定されるリスクを軽減する
- データ分析や統計公開に広く用いられており、ユーザーのプライバシーを保護する上で重要な役割を果たす
ある学校で生徒の身長を調べる調査を行ったとします。個々の生徒の身長をそのまま公表すると、特定の生徒が識別されてしまう可能性があります。そこで、実際の身長にランダムな数値(ノイズ)を加えて公表します。例えば、ある生徒の実際の身長が160cmだったとしても、+3cmや-2cmのノイズを加えて163cmや158cmとして公表するのです。これにより、個々の生徒の正確な身長は隠されますが、全体の統計(例えば平均身長)はある程度正確に推測することが可能です。この方法で、個人のプライバシーを保護しつつ、有用なデータ分析を行うことができます。