お問い合わせ
2026 / 03 / 11 セキュリティ

AIに入力した情報は学習されるのか

Lead

AIに入力した情報は学習されるのかをテーマに、個人プランと法人プラン・APIの違い、オプトアウト設定、DPA確認、入力マスキングまで、士業事務所が守秘義務を保ったまま運用する判断軸を整理します。

結論: 学習されるか否かは、利用プラン・契約・設定・地域・サービス種別の組み合わせで決まります。「ChatGPT は学習する/しない」と一文で語れる問題ではなく、公式ドキュメントの該当節と改訂日を確認することが唯一の正解になります。

2025 年後半から 2026 年初頭にかけて、主要ベンダーのデータ取り扱いポリシーには複数の改訂が観察されています。たとえばあるベンダーは消費者向けプロダクトについて「入力と出力をモデル改善に利用するが、ユーザーは設定からオプトアウトできる」と明示するようになりました。別のベンダーも Enterprise / Team / API について「デフォルトでは顧客のビジネスデータをモデル訓練に使わない」というスタンスを公式ドキュメントで打ち出しています。同じ「ChatGPT」「Claude」と呼んでいても、契約形態によって取り扱いが大きく異なる、という構造が見えてきます。

本記事では「学習される/されない」を判断するためのフレームと、士業事務所として最低限おさえておきたい確認手順を整理していきます。本文中の各サービスの取扱いは執筆時点(2026 年 2 月)の公式ドキュメントに基づくため、運用開始前には必ず最新版を確認してください。

「学習に使われる」とはどういうことか

「学習に使われる」とは、入力したテキストやファイルがモデルの訓練データセットに組み込まれ、将来のモデルの応答に影響を与え得る状態を指します。よく混同される概念と分けて整理しておきます。

  • 学習(training): 入力がモデル本体のパラメータ更新に使われます。一度学習されたものを「忘れさせる」ことは技術的に難しいとされています
  • ログ保持(logging / retention): 入力・出力がサービス側のサーバに保存されます。学習用途ではなく、不正利用検知やサポート対応のために一定期間保存されることが多いです
  • アブユーズモニタリング: 自動・人手による安全性レビューです。違反通報や安全フラグがついた会話が対象になります
  • コンテキスト保持: 同じ会話内で前の発言を参照する仕組みです。セッションを超えて他人の応答に出ることはありません

「学習されない=ログも残らない」と誤解されることが多いのですが、両者は別物です。学習対象から外されていても、規約違反検知のために一定期間ログが保持される設計は珍しくありません。守秘義務の観点では、学習・ログ・アクセス権限・保持期間の 4 点をそれぞれ確認していく必要があります。

個人向けと法人向けでデフォルトが違う

サービスごとに細部は異なりますが、業界全体としては以下のような傾向が観察されています。

個人向け(無料・有料サブスクリプション): 個人向けプロダクトでは、ユーザーの入力がモデル改善に使われる設定がデフォルトになっていることが多い状況です。設定画面でオプトアウト(学習に使わせない選択)が用意されているケースがあり、利用前にトグルの状態を確認しておきたいところです。

ある消費者向けプロダクトでは「入力と出力をモデル改善に利用するが、ユーザーは設定からオプトアウトできる」「ただしオプトアウトしても、安全性レビューでフラグが立った会話や、ユーザー自身が報告した内容は学習対象になり得る」と明記されています。最新の表現は各社の公式情報を確認してください。

法人向け(Team / Enterprise / Business 等): 一方、法人向けプランでは「ユーザーの入力をモデル学習に使わない」がデフォルトに設定されているのが一般的です。契約上もデータ管理者(コントローラ)が顧客側に切り替わり、ベンダーは処理者(プロセッサ)として動く構造になります。

商用利用向けの利用規約には「ベンダーはサービスの顧客コンテンツをモデル学習に利用しない」旨が明記されていることが多く、API や法人向けプロダクトでは顧客コンテンツを学習に使わないことが契約レベルで約束されている、というのが現在の業界水準です。最新の条件は各ベンダーの公式情報を確認してください。

横断ビューに整理すると以下のようになります(実際の条件は各ベンダーの最新ドキュメントで確認してください)。

利用形態学習利用のデフォルトオプトアウトログ保持DPA
個人向け Web UI(無料・有料)学習対象になりやすい設定で変更可(要点検)一定期間保持なし
法人プラン(Team/Enterprise)学習に使わないデフォルトで対象外一定期間保持締結可能
API/SDK(個人キー)学習に使わない傾向規約で確認30 日が典型限定的
API/SDK(法人契約 + ZDR)学習に使わない契約で担保無効化可能締結前提

「法人プランなら全部安全」とはなりません。「学習に使われない」と「サーバにログが残らない」と「従業員から見えない」は別問題であり、それぞれの条件はプラン・契約・地域・追加オプションによって変わってきます。

API・SDK 経由は別物として扱う

業務システムやワークフローに AI を組み込む場合、Web UI ではなく API/SDK 経由で呼び出すことになります。この場合の取扱いは、コンシューマ向け Web UI とは別物として整理しておく必要があります。

業界全体の傾向として、以下のような状況が観察できます。

  • API リクエストの内容は、デフォルトではモデル学習に使われない設定になっているベンダーが多いです
  • 不正利用検知のためのログは一定期間(30 日が典型)保持されることが多くなっています
  • エンタープライズ契約や Zero Data Retention(ZDR)オプションを結ぶことで、ログ保持自体を無効化できる場合があります
  • 個人事業主が自分のクレジットカードで API キーを取得して使っている場合と、法人として商用契約を結んでいる場合では、適用される規約と保護水準が異なってきます

士業事務所がクライアントの個人情報や機微情報を扱う場合、API 直接利用であっても「個人アカウントで気軽に試す」段階を超えたら、法人契約・DPA・ログ保持期間の 3 点を必ず明文化しておくのが安全側の運用になります。

確認すべきドキュメントの読み方

実務上、確認するドキュメントは大きく 3 つに分かれます。

第一は **プライバシーポリシー(Privacy Policy)**です。サービス全体としての個人情報の取扱いが書かれています。「How we use your data」「Training data」「Model improvement」といった節を探していきます。改訂日(Last updated)の確認は必須です。半年前の解説記事の内容が、現在の規約と一致している保証はありません。

第二は データ利用・モデル改善ポリシーです。学習への利用条件、オプトアウト方法、保持期間に特化したドキュメントになります。各社が個別ページとして公開していることが多いので、公式情報を確認してください。

第三は **DPA(Data Processing Addendum)**です。法人契約に紐づくデータ処理契約です。GDPR や日本の個人情報保護法に対応するための条項、サブプロセッサ一覧、データの所在地、暗号化、監査権限などが定義されます。士業として業務利用するなら、DPA の締結が事実上の前提になります。

読むときの観点は次のとおりです。

  • 文書の改訂日(書いてない文書は信用度を一段下げる)
  • 「学習に使う/使わない」の主語が「ユーザー」「顧客」「フィードバック提供者」のどれを指しているか
  • 「デフォルト」と「設定変更で変えられるもの」の区別
  • 「明示的に提供したフィードバック」が例外として学習対象になる条件
  • 安全性レビュー・違反通報の例外条項

特に「あなたが明示的にフィードバックを送った場合は学習対象に含まれる」型の例外は、ほぼすべての主要ベンダーに存在します。良い回答だったので「👍」を押した瞬間に、その会話が学習候補に入る、という理解で運用設計をしておきたいところです。

「学習されない」を運用で担保する

完全な技術的保証は難しいとしても、運用設計で「学習されない」を実質的に担保することは可能です。レイヤーごとに整理していきます。

オプトアウト設定の徹底

  • 個人向けプランを使う場合は、設定画面で「チャット履歴をモデル改善に使わない」相当のトグルをオフにします
  • アカウントごとに設定状態を点検し、入所員のオンボーディング手順に組み込んでおきます
  • フィードバック送信ボタン(👍/👎)を業務利用時は押さないルールを共有しておきます

法人プランの契約

  • クライアント情報を扱う業務には、原則として法人プラン + DPA 締結済みの構成を使います
  • 個人プランは「学習・調査・社内用途のみ」と用途を分け、利用ガイドラインに明記しておきます

入力ガイドラインの整備

技術的な設定だけに頼らず、そもそも入れない情報の線引きを決めておきます。

  • 氏名・生年月日・マイナンバー・口座番号などの直接識別子は原則マスキング
  • クライアント名は仮名化(A 社、B 氏など)してから入力
  • 紙の生資料を撮影してそのままアップロードしない
  • 共有 PC・共有アカウントで業務利用しない

設定で「学習されない」状態を作っていても、生の個人情報を入れないという上流の規律があるほうが、想定外の挙動の起点を減らせます。

残る論点

ここまでで「学習されるか否か」の判断フレームと運用は一通り整理してきました。一方で、現時点では明確な答えが出ていない、所として議論を継続したほうがよい論点も残っています。

  • 「忘れさせる権利」の技術的限界: 一度学習されたモデルから特定データの影響を消す技術(Machine Unlearning)は研究段階にあります。誤って学習対象に入った場合の事後対応は、現状では削除請求と監査記録での担保が中心になり、技術的な消去は保証できません
  • ベンダー方針の改訂頻度: 主要ベンダーは年複数回、ポリシーを更新しています。半年に 1 回の点検で十分か、四半期点検まで上げるかは、所の規模と扱うデータの機微度で判断が分かれます
  • 国内法・所属会指針との整合: 個人情報保護法・各士業法・所属会指針は、生成 AI 関連の論点を順次取り込んでいます。海外ベンダーの DPA 文言と、国内の守秘義務規律の対応関係は、最終的には個別案件ごとに有資格者の判断が必要になります
  • 「フィードバック例外」の運用: 業務利用中に「👍」を押した場合、その会話が学習対象に入る可能性があります。これを所内で完全に抑止できるかは、教育と運用設計の問題として残ります
  • API/SDK 連携での ZDR 適用範囲: ZDR 契約済みでも、サブプロセッサのログ・連携先 SaaS のキャッシュなど、ベンダー単独では制御しきれない経路があります

これらの論点は「答えが出るまで AI 利用を止める」という性質のものではなく、運用しながら継続的に点検していく対象になります。半年に 1 回程度、公式ドキュメントの改訂と所内運用の差分を確認するサイクルを規程に書いておきたいところです。

参考

  • 個人情報保護委員会「生成 AI サービスの利用に関する注意喚起等について」 — https://www.ppc.go.jp/news/careful_information/230602_AI_utilize_alert/
  • 主要ベンダー各社のプライバシーポリシー・商用利用規約(最新版を公式サイトで確認)
  • 各社のモデル改善ポリシー・データ利用ポリシー(オプトアウト方法と保持期間に関する記述)
  • 各社の Enterprise Privacy ページ(法人向けプロダクトのデータ取扱い)
Author · 著者

三方 浩允

AI 導入の論点を相談する

業務課題を 60 分で整理することから始められます。

お問い合わせ