EN ログイン

TDM例外とは|意味・定義・GEO対策における位置づけ

AIクローラー対応 2026-06-09

著者:喜多 陽平 / Kita Yohei 公開日:2026年06月02日

TDM例外(Text and Data Mining Exception)とは、EU著作権指令(CDSMD 2019/790)において定められた「テキスト・データマイニングを著作権侵害なく行える」という例外規定のことです。同指令では、コンテンツ所有者が商業目的のTDMに対してオプトアウト(拒否)できる権利も認められており、AIの学習用クロールへの対応方針を設計する上でGEO対策と密接に関係します。

このページでわかること

  • TDM例外の意味・法的背景
  • なぜコンテンツ所有者がAI学習を拒否できるのか
  • robots.txtとTDMRepの違い
  • GEO対策とのトレードオフ
  • よくある誤解

TDM例外とは

TDM(Text and Data Mining)とは、大量のテキスト・データを自動的に収集・分析する処理のことです。AI学習データの収集はTDMの一形態として位置づけられます。

EU著作権指令(CDSMD 2019/790)は、TDMに関して2種類の例外規定を設けています。ひとつは科学研究目的のTDMを原則として許可するもの(Article 3)、もうひとつは商業目的のTDMも許可しつつ、コンテンツ所有者が機械可読な形式でオプトアウトを表明した場合はその意思を尊重するものです(Article 4)。

なぜAI学習を拒否できるのか

コンテンツ所有者がAI学習用クロールを拒否できる根拠は、EU著作権指令Article 4のオプトアウト条項です。コンテンツ所有者が「機械可読な形式」で権利留保を宣言した場合、商業目的のTDMはその意思を尊重しなければなりません。

さらに2024年に施行されたEU AI Act(2024/1689 Article 53)では、汎用AI(GPAI)開発者に対してTDM権利留保の遵守が義務づけられました。EU市場で事業を行うAI企業はコンテンツ所有者のオプトアウト表明を無視できなくなっています。

ただしこれはEUの法制度です。日本を含むEU域外では現時点で同等の法的拘束力はなく、robots.txtによるブロックも技術的慣例にとどまります。

AI学習を拒否する方法

TDMオプトアウトを表明する主な方法は2つあります。それぞれ性質が大きく異なります。

① robots.txt(最も普及・ただし法的拘束力なし)

現在最も広く使われているオプトアウト手段です。GPTBot・ClaudeBot・PerplexityBotなど特定のクローラーをBot名で指定してブロックします。ただしrobots.txtは1994年から続く技術的な慣例であり、法的な強制力はありません。AIクローラーが無視しても法的制裁はなく、2025年の調査ではAIクローラーが3週間でサイト1件あたり平均156件のrobots.txt違反リクエストを送っていたことが報告されています。

② TDMRep(W3C仕様・EU法的拘束力あり)

W3Cが策定したText and Data Mining Reservation Protocol(TDMRep)は、HTTPヘッダー・メタタグ・tdmrep.jsonファイルを通じてTDM権利留保を機械可読な形式で宣言するプロトコルです。EU著作権指令およびEU AI Actに明示的に言及されており、EU域内ではrobots.txtとは異なり法的拘束力を持ちます。

GEO対策とのトレードオフ

AIクローラーをブロックすることはAI学習データへの自社情報の含有を制限できます。しかし同時に、AIに引用・推薦される機会も失います。これがGEO対策とTDMオプトアウトの本質的なトレードオフです。

Genviewでは、この判断を「全部ブロックか全部許可か」ではなく、「何をAIに学習・参照させたいか」という観点から戦略的に設計することを推奨しています。

例えば学習用クロール(GPTBot)はブロックしながら、検索インデックス・引用用クロール(OAI-SearchBot)は許可するという使い分けが可能です。学習データには含めたくないが、AIの検索結果・引用には登場したい——という方針を持つ場合、クローラーの種類ごとに判断を変えることが有効です。

詳しくはAIボットクロールとはをご覧ください。

Genviewによる定義

GEO対策の文脈において、TDM例外とは「EU著作権指令が定めるテキスト・データマイニングの例外規定であり、コンテンツ所有者がAI学習用クロールに対してオプトアウトを表明できる法的根拠」です。robots.txtによる技術的なオプトアウトとTDMRepによる法的拘束力を持つオプトアウトの両方を理解した上で、GEO対策の目的に合わせた判断が必要です。

GEO対策においてクロール拒否は「守り」の手段ですが、AIに引用・推薦されることを目指す「攻め」とはトレードオフの関係にあります。何のためにブロックするのかを明確にした上で設定することが推奨されます。

この定義はGenviewの見解であり、業界の総意ではありません。

関連語

  • AIボットクロール:AIクローラーBotがWebコンテンツを取得する処理。TDM例外・オプトアウトの主な対象。
  • llms.txt:AIに理解してほしい情報を伝える補助ファイル。TDMRepとは異なりオプトアウトではなくオプトインの性質を持つ。
  • RAG(Retrieval-Augmented Generation):AIがリアルタイムでWeb情報を取得して回答を生成する仕組み。学習用クロールと引用用クロールはRAGとは異なるレイヤーで動作する。
  • Grounding:AIが特定の情報源に基づいて回答を生成する仕組み。クロールを許可することでGroundingの対象になりやすくなる。

よくある誤解

誤解①:「robots.txtでブロックすれば法的に保護される」

robots.txtは技術的な慣例であり、法的な強制力はありません。AIクローラーが無視しても現時点では法的制裁はありません。法的な保護を求める場合はTDMRepによる権利留保の宣言が有効ですが、その法的効力はEU域内に限られます。

誤解②:「AIクローラーをすべてブロックすべき」

AIクローラーには学習用・インデックス構築用・リアルタイム取得用など複数の種類があります。すべてをブロックするとAI引用・推薦の機会も同時に失います。目的に応じて許可・拒否を使い分けることが推奨されます。

誤解③:「TDM例外は日本には関係ない」

TDM例外はEUの法制度ですが、EU市場に向けてコンテンツを公開している企業・EU域内のAI企業と取引している企業には影響します。また日本でも著作権法上のTDMに関する議論は進行中であり、今後の法改正によって状況が変わる可能性があります。

よくある質問

Q: TDMオプトアウトはどこから始めれば良いですか?
A: まず「AIに何を学習・参照させたいか」という方針を決めることが先です。その上で自社サイトのrobots.txtで主要なAIクローラーの扱いを確認します。EU市場に向けたコンテンツを持つ場合はTDMRepの実装も検討が必要です。

Q: GEO対策においてAIクローラーはブロックすべきですか?
A: 一概には言えません。学習データへの含有を制限したい場合はブロックが有効ですが、AIの検索・引用への登場を目指す場合はブロックが逆効果になります。クローラーの種類ごとに目的を整理した上で判断することが推奨されます。

参考文献

← GEO用語集に戻る
お申込みはこちら →