EN ログイン

情報密度(Information Density)とは|意味・定義とGEO対策における位置づけ

AIの仕組み 2026-06-09

著者:喜多 陽平 / Kita Yohei 公開日:2026年06月09日

情報密度(Information Density)とは、テキストの単位量(トークン・文・チャンクなど)に対して、どれだけ意味のある情報が詰まっているかを示す概念です。同じトークン数でも、有益な情報が凝縮されているテキストは情報密度が高く、冗長な表現や繰り返しが多いテキストは情報密度が低いといえます。GEO対策においては、情報密度の高さだけでなく「AIが知らない情報を含むか」という観点が引用価値を決める重要な要素になります。

このページでわかること

  • 情報密度の意味・定義
  • 情報密度が高いだけではAIに引用されない理由
  • Information Gainとの関係
  • 情報密度 × Information Gain がAI引用の条件になる理由
  • GEO対策における位置づけ
  • よくある誤解

情報密度とは

情報密度は「トークンあたりの意味量」として理解するのが最も実用的です。AIはテキストをトークン単位で処理し、限られたコンテキストウィンドウ内で情報を参照します。情報密度が低いコンテンツは、限られたトークン枠を冗長な表現で消費します。情報密度が高いコンテンツは、同じトークン数でより多くの意味をAIに届けます。

情報密度 文例 特徴
低い GEOというものは、最近注目されている概念で、AIに関係していて、検索最適化に関連した施策のことを指すと言われています。 冗長・ぼかし表現・繰り返し
高い GEOとは、ChatGPTやGeminiなどの生成AIが回答を生成する際に自社情報を引用させるための最適化施策です。 定義が明確・情報が凝縮されている

トークンとは

チャンクとは

なぜGEOで情報密度が語られるのか

GEO対策において情報密度が重要な理由は、AIのコンテキストウィンドウが有限だからです。RAGシステムがチャンクをAIに渡す際、情報密度が低いコンテンツは限られたトークン枠を冗長な表現で消費してしまいます。情報密度が高いコンテンツは同じトークン数でより多くの意味を届け、AIが参照できる情報量を最大化します。

また、情報密度の高さはコンテンツの意味的な焦点を高め、検索・Retrievalを伴う推論フローで意味的な関連性が評価されやすくなる可能性があります。ただし情報密度が高いほどコサイン類似度が上がるとは言い切れません。クエリの内容と文脈によって評価は変わります。

Retrievalとは

情報密度が高いだけでは不十分

ここがこの記事の核心です。

情報密度を高めることは重要ですが、それだけではAIに引用されません。なぜなら、情報密度が高くても「AIがすでに知っていること」しか書かれていなければ、AIはそのコンテンツを引用する理由を持ちません。

多くの記事が「GEOとはAI引用最適化のことです」と書いています。それぞれの記事の情報密度が高くても、内容が同じであればAIにとっての価値は変わりません。

AIが引用するのは「意味が凝縮されていて、しかも新しい」コンテンツです。この「新しさ」がInformation Gainという概念につながります。

情報密度とInformation Gainの関係

Princeton大学・Georgia Techの研究(Aggarwal et al., 2023)は、GEOにおける「Information Gain」という概念を示しています。AIがすでに知っている情報を超えて、コンテンツが提供する独自の情報価値が高いほどAIに引用されやすいという考え方です。

情報密度は「どれだけ多くの意味を運べるか」を表し、Information Gainは「どれだけ新しい意味を運べるか」を表します。AI引用において重要なのは、この両方を満たすコンテンツです。

AI引用の条件

情報密度が高い(トークンあたりの意味量が多い)

Information Gainが高い(AIが知らない新しい情報を含む)

AIが引用する価値のあるコンテンツ

逆に言えば、いくら無駄を削って情報密度を高めても、他のコンテンツと同じ内容しか書かれていなければInformation Gainは低く、AI引用率は上がりません。情報密度の最適化は、一次情報や独自の観察・分析を発信する戦略と組み合わせて初めて機能します。

一次情報とは

オリジナルリサーチとは

GEO対策における位置づけ

GEO対策において情報密度は「AIへの情報伝達効率を決める設計指標」として位置づけられますが、単独の施策としてではなく、Information Gainと組み合わせて機能します。

情報密度の改善は冗長さの排除・定義の明確化・テーマの集中によって実現できます。しかしこれはどんな文章にも有効な原則であり、GEO固有の施策ではありません。GEO対策として差別化が生まれるのは、情報密度の高い文章の中に「他では読めない情報」が含まれているときです。

AI可読性とは

リランキングとは

Genviewによる定義

GEO対策の文脈において、情報密度とは「テキストの単位量に対する意味の凝縮度であり、AIが限られたコンテキストウィンドウ内で参照できる情報の質を決める指標」です。

Genviewでは、情報密度を「AIへの情報伝達効率を決めるコンテンツ設計の基本指標」として位置づけています。ただし情報密度はInformation Gainと組み合わせて初めてAI引用につながります。情報密度が高いだけのコンテンツはAIに「整理された既知の情報」として処理される可能性があります。情報密度が高く、かつAIが知らない情報を含むコンテンツが、AI引用において最も価値を持ちます。

この定義はGenviewの見解であり、業界の総意ではありません。

関連語

  • トークン:AIがテキストを処理する最小単位。情報密度はトークンあたりの意味量として理解できる。
  • チャンク:RAGシステムでコンテンツを取得する単位。チャンク内の情報密度が高いほど取得・採用されやすい傾向がある。
  • 一次情報:そのブランドしか持っていない情報。情報密度とInformation Gainの両方を満たす最も有力なコンテンツ形式。
  • Retrieval:RAGシステムでクエリに関連するコンテンツを取得するプロセス。情報密度が高くテーマが集中したコンテンツは意味的な関連性が評価されやすくなる可能性がある。
  • リランキング:初期取得後に候補ドキュメントを再評価するプロセス。情報密度の高いコンテンツはリランキングでも評価されやすい傾向がある。
  • AI可読性:AIがコンテンツを読み取り・参照しやすい状態のこと。情報密度の高い構造はAI可読性と相互に補完する。

よくある誤解

誤解①:「情報密度を高める=短くする」

情報密度は長さではなく「内容の凝縮度」の問題です。短くても情報密度が低いテキストはあります。長くても情報密度が高いテキストもあります。目的は「トークンあたりの意味量を高める」ことであり、文字数の削減ではありません。

誤解②:「情報密度を高めればAIに引用される」

情報密度の最適化はAI引用の必要条件のひとつですが、十分条件ではありません。情報密度が高くても、AIがすでに知っていることしか書かれていなければInformation Gainは低く、引用される動機をAIに与えません。

誤解③:「情報密度とInformation Gainは同じもの」

異なる概念です。情報密度は「どれだけ多くの意味を運べるか」という量と効率の問題で、Information Gainは「どれだけ新しい意味を運べるか」という独自性の問題です。両方を満たすコンテンツがAI引用において最も価値を持ちます。

よくある質問

Q: 情報密度とInformation Gainを両立するにはどうすればいいですか?
A: 自社が持っている一次情報・独自の観察・分析を、冗長さなく明確に書くことが基本です。顧客インタビューの集計・自社ツールの利用データ・現場での観察——これらを定義・背景・具体例・解釈の構成で書くと、情報密度とInformation Gainの両方を持つコンテンツになります。
Q: Information Gainのない情報密度の高いコンテンツはどう扱われますか?
A: AIにとっては「整理された既知の情報」として処理される可能性があります。引用されないわけではありませんが、AIがすでに十分な知識を持つテーマでは、同じ内容を書いた多くのコンテンツと競合することになります。独自性のある情報を含めることがAI引用において優位に働きます。

参考文献

  • Aggarwal et al.「GEO: Generative Engine Optimization」Princeton University・Georgia Tech(2023年)(GEOにおけるInformation GainとAI引用率の関係を分析)
← GEO用語集に戻る
お申込みはこちら →