2025年8月18日、米カリフォルニア大学デービス校の研究チームが発表した新しい研究によって、生成AI(GenAI)ブラウザアシスタントが利用者の同意なしに個人情報や機密データを収集・共有していることが明らかになった。この研究成果は、8月13日に開催されたUSENIX Security Symposium 2025で発表された。
まとめ記事:UC Davis研究:GenAIブラウザアシスタントがユーザーの機密情報を追跡・共有している実態を暴露
調査概要
- 対象ツール(9種類)
Monica、Sider、ChatGPT for Google、Merlin、MaxAI、Perplexity、HARPA.AI、TinaMind、Copilot - 調査手法
- 公開サイトと非公開サイト(例:医療系サイト、IRSサイト)でのデータ収集挙動を監査
- プロンプトを通じた「属性リーク」テストで、プロフィール作成やパーソナライズを確認
主な発見
- 過剰なデータ収集
- 一部拡張機能はページ全体のHTMLやテキストを取得
- 医療履歴や診断内容といったセンシティブ情報まで収集
- 特に「Merlin」はIRSサイト入力フォームから社会保障番号(SSN)を外部送信していた
- HARPA.AIも同様にページ全内容を収集
- プロファイリングとパーソナライズ
- MonicaやSider:文脈内外でのプロファイリングを実施
- HARPA.AI:文脈内のみ
- TinaMind、Perplexity:プロファイリングなし
- シナリオ例:高級車サイト閲覧後に「私はお金持ちか?」と質問すると、属性を学習し回答
- 第三者への情報共有
- Merlin、TinaMind:Google Analyticsにデータ送信
- Merlinはユーザーの生クエリを外部サーバに共有
→ 結果として広告ターゲティングやCookie連携に利用可能
研究者の警告
- 拡張機能は基本的に審査が緩く、ユーザーの認識不足が深刻なリスクを生む
- 「GenAIブラウザアシスタントに入力する情報は、保存・利用され続けることを理解すべき」
- プライベート空間で利用する場合は特に注意が必要
インサイト
- 利便性と引き換えにプライバシーが危険に晒されている
- 透明性・ガイドライン・ユーザー教育が不可欠
- 個人利用者も「使う前にリスクを理解する」姿勢が求められる
