robots.txtとは|意味・定義・GEO対策における位置づけ
著者:喜多 陽平 / Kita Yohei 公開日:2026年06月02日
robots.txt(ロボッツテキスト)とは、ウェブサイトのルートディレクトリに設置するテキストファイルで、クローラー(自動巡回プログラム)に対してアクセス可否を伝える仕組みです。GEO対策においては、AIの学習用クローラーと検索・引用用クローラーを区別して設定することが重要であり、「全部ブロック」か「全部許可」かではなく、目的に応じた使い分けが求められます。
このページでわかること
- robots.txtの意味・定義
- AIクローラーの2種類と使い分け
- 主なAIクローラーの一覧
- GEO対策における位置づけ
- よくある誤解
robots.txtとは
robots.txt(ロボッツテキスト)とは、サイトのルートURL(例:https://genview.io/robots.txt)に設置するテキストファイルです。User-agent(クローラーの名前)ごとにAllow(許可)またはDisallow(不許可)を記述することで、そのクローラーがアクセスできるページを制御します。
重要な前提として、robots.txtは法的拘束力のない技術的な慣例です。良識あるクローラーはrobots.txtを尊重しますが、無視することも技術的には可能です。Capconvert(2026年3月)の調査では2025年Q4にAIボットリクエストの13%がrobots.txtを無視していたことが報告されています。法的拘束力を持つオプトアウトについてはTDM例外を参照してください。
なぜGEOでrobots.txtが語られるのか
2026年時点で、AIクローラーは大きく2種類に分かれています。そしてGEO対策においては、この2種類を区別して設定することが非常に重要です。
No Hacks(2026年4月)は「学習クロールをブロックすること・検索クロールをブロックすること・ユーザートリガーのフェッチをブロックすることは、それぞれ別の決定だ。1つのrobots.txtルールでこの3つを正しく制御することはできない」と指摘しています。
GEO対策の観点では「学習クロールをブロックしながら検索・引用クロールは許可する」という使い分けが、多くのブランドにとって合理的な選択です。
AIクローラーの2種類
| 種類 | 目的 | ブロックした場合の影響 |
|---|---|---|
| 学習用クローラー | AIモデルの学習データとして収集 | 自社コンテンツがAIの学習データに含まれない(IP保護) |
| 検索・引用用クローラー | リアルタイムの検索・引用のために取得 | そのAIの検索結果・引用から除外される(GEO的に大きな損失) |
Mersel AI(2026年)は「GPTBot(学習用)をブロックしてもGoogle検索順位には影響がない。しかしOAI-SearchBot(検索用)をブロックするとChatGPTの検索結果から完全に除外される」と報告しています。
主なAIクローラー一覧(2026年)
| クローラー名 | 提供元 | 種類 |
|---|---|---|
| GPTBot | OpenAI | 学習用 |
| OAI-SearchBot | OpenAI | 検索・引用用 |
| ChatGPT-User | OpenAI | ユーザートリガー(引用リンク取得) |
| ClaudeBot | Anthropic | 学習用 |
| Claude-SearchBot | Anthropic | 検索・引用用 |
| Google-Extended | 学習用(Googlebot検索には影響しない) | |
| PerplexityBot | Perplexity | 検索・引用用 |
| CCBot | Common Crawl | 学習用(多数のオープンソースLLMが使用) |
| Meta-ExternalAgent | Meta | 学習用(リファラルトラフィックはほぼゼロ) |
Cloudflare(2025年8月)の報告では、250万以上のサイトがAI学習クロールを完全にブロックする設定を選択していることが示されています。
GEO対策におけるトレードオフ
Rutgers Business SchoolとWharton Schoolの研究(2025年12月)では、robots.txtでAIクローラーをブロックしたサイトはトラフィックが平均23%低下したことが示されています。これはブロックにリスクがあることを示す学術的根拠です。
Genviewでは、robots.txtの設定を「全部ブロックか全部許可か」ではなく、以下の観点で判断することを推奨しています。
- 学習用クローラー:自社コンテンツをAIの学習データとして提供したくない場合はDisallow。GEO的な影響は限定的
- 検索・引用用クローラー:GEO対策を重視するならばAllow。ブロックするとそのAIの検索・引用から完全に除外される
- 機密コンテンツ・管理ページ:すべてのクローラーに対してDisallow
Genviewによる定義
GEO対策の文脈において、robots.txtとは「クローラーへのアクセス可否を伝える技術的慣例ファイルであり、AIの学習用クローラーと検索・引用用クローラーを区別して設定することでGEO対策とIP保護のバランスを取るための手段」です。
robots.txtは法的拘束力がなく、あくまで技術的な慣例です。法的なオプトアウトが必要な場合はTDM例外・TDMRepの活用が必要です。GEO対策においてはrobots.txtを「守り」と「攻め」の両方の観点から設計することが推奨されます。
この定義はGenviewの見解であり、業界の総意ではありません。
AI検索時代に備える本格的なGEO対策を、今すぐ始めませんか?
Genviewをご契約いただくと、主要なAIクローラーの最新仕様に準拠した、「ほぼコピペでそのまま使えるrobots.txtのテンプレート・解説ページ」をご利用いただけます。守りと攻めの具体的な記述例を今すぐ確認・実装したい方は、管理画面よりご活用ください
料金プランの確認・お申込みはこちら関連語
- TDM例外:EU著作権指令が定めるAI学習用クロールへの法的オプトアウト権。robots.txtとは異なり法的拘束力を持つ。
- llms.txt:AIにとって重要なページを伝える補助ファイル。robots.txtと組み合わせて使うことでAIへの情報提供を最適化できる。
- Grounding:AIが特定の情報源に基づいて回答を生成する仕組み。検索・引用用クローラーを許可することでGroundingの対象になりやすくなる。
- Zero Click Search:ユーザーがクリックせずに検索を完結させる状態。AI引用されることがZero Click環境での露出維持につながる。
よくある誤解
誤解①:「robots.txtでブロックすれば完全に守れる」
robots.txtは法的拘束力のない技術的慣例です。良識あるクローラーは遵守しますが、強制力はありません。2025年Q4にはAIボットの13%がrobots.txtを無視していたという報告もあります。完全な保護が必要な場合はサーバーレベルの制御(WAFルール・403応答)との併用が必要です。
誤解②:「AIクローラーをブロックしてもSEOには影響しない」
Google-ExtendedやGPTBotのブロックはGoogleの検索順位に影響しないとされています。しかし検索・引用用クローラー(OAI-SearchBot・PerplexityBotなど)をブロックするとそのAIの検索結果から除外されます。ブロックの対象と影響範囲を正確に理解することが重要です。
誤解③:「robots.txtは一度設定すれば変更不要」
AIクローラーの種類は急速に増加・変化しています。新しいAIサービスが登場するたびに新しいクローラーが追加されるため、定期的な見直しが必要です。廃止されたクローラー名の削除・新しいクローラーの追加を少なくとも四半期ごとに確認することが推奨されます。
よくある質問
Q: GEO対策を重視する場合、robots.txtはどう設定すれば良いですか?
A: 基本方針として「検索・引用用クローラー(OAI-SearchBot・PerplexityBot・Claude-SearchBotなど)はAllow、学習用クローラー(GPTBot・ClaudeBot・CCBotなど)はDisallow」という使い分けが多くのブランドにとって合理的です。ただし自社のコンテンツ戦略・IP保護方針に応じて判断してください。
Q: robots.txtの設定を確認する方法はありますか?
A: ブラウザでhttps://[ドメイン]/robots.txtにアクセスすることで現在の設定を確認できます。Google Search Consoleの「robots.txtテスター」を使うと特定のクローラーに対する設定が正しく機能しているかも確認できます。
参考文献
- Rutgers Business School・Wharton School「AI Crawler Blocking Impact Study」2025年12月(robots.txtでAIクローラーをブロックしたサイトはトラフィックが平均23%低下)
- No Hacks「The AI User-Agent Landscape in 2026: A Complete Reference」2026年4月(学習クロールと検索クロールの制御は別々の決定であるという指摘)
- Mersel AI「How to Block AI Bots in robots.txt: GPTBot, ClaudeBot & More (2026)」2026年3月(GPTBotブロックはGoogle検索順位に影響なし・OAI-SearchBotブロックはChatGPT検索から除外)
- Cloudflare「AI Bot Blocking Report」2025年8月(250万以上のサイトがAI学習クロールを完全ブロック)