GEO対策で効果が出ない理由——「構造」の前に「問い」を疑う

作成者: 椎名真弓｜May 28, 2026 6:26:59 AM

GEO対策は、何が正解かがまだ明確でない領域だ。

自社のコンテンツがAI検索に引用されない。そのとき、「構造がまだ足りないのかもしれない」と考え、見出しをさらに整理したり、文章を追加したり、Schema markupを追加したりすることは、自然な発想ではないだろうか。

しかしAI Alchemy Labの観察実験から見えてきたのは、別の可能性だ。効果が出ない原因が「構造の問題」ではなく「問いの問題」である場合、構造をいくら改善しても引用には結びつかない。

本記事では、この観察から導いた診断の考え方を仮説として提示する。

ひとつ先に伝えておきたいことがある。ここで述べる内容は、AI Alchemy Labが独自に行った小規模な観察実験（後述するEXP-007、9クエリ・複数記事の比較）から導いた仮説であり、断定ではない。業界の専門家が同じ論点を独立して整理しているリソースを見つけられなかったため、あえて仮説として提示する。誤りが含まれる可能性もある。その前提で読んでほしい。

「効果が出ない」を分解する

GEO対策で「効果が出ない」という状態には、少なくとも2つの異なる問題が混在している。

ひとつは「そもそも引用されていない」という状態。 AIの回答にページが登場しない。引用ソースとして選ばれていない。これはGEO対策の入口の問題だ。

もうひとつは「引用されているが流入につながっていない」という状態。 AIの回答にはページが引用されているが、クリックされていない。あるいはクリックはあるが問い合わせや登録に至っていない。これは引用後の設計の問題であり、入口の問題とは別軸で考える必要がある。

本記事が扱うのは前者、「そもそも引用されていない」 という問題だ。

この区別が重要なのは、原因が違えば打ち手が根本的に異なるからだ。「引用されていない」という問題に対して「引用後の導線設計」を改善しても効果は出ない。逆もしかりだ。

まず自分のサイトが「引用されていない」のか「引用されているが流入につながっていない」のかを確認することが、診断の出発点になる。

観察から見えた構図——「問い」と「構造」は別の問題だった

AI Alchemy Labでは2026年5月、9クエリ・複数記事を使った比較観察実験（EXP-007）を実施した。問いの「広さ」が引用結果に与える影響を、引用部品性スコアと照らし合わせながら観察したものだ。

結果は対照的だった。

広い問い（「GEO対策とは何か」レベル）では、3記事すべてが未引用だった。 引用部品性スコアの高低にかかわらず、広い問いに対しては引用候補として選ばれなかった。

固有の問い（「AI Alchemy Labの実験で何がわかったか」レベル）では、3記事すべてが引用された。 ここで注目すべきは、引用部品性スコアが4項目中1点しかない記事でも引用されたことだ。固有の問いの帯域では、構造の完成度に関係なく引用された。

中くらいの問い（「Perplexityで自社記事が引用されない原因は何か」レベル）では、3記事中1記事のみ引用された。 引用されたのはテーマ一致度が高く、引用部品性スコアも4/4だった記事。未引用の2記事はテーマ近接はあるもののスコアが低かった。

この3つの結果から見えてくる構図がある。

問いの競合密度が高い帯域では、そもそも引用候補の土俵に乗れない。 どれだけ構造を整えても、その問いに答えているページが大量に存在する状態では、小規模サイトが引用候補として選ばれる可能性は低い。これは構造の問題ではなく、問いの問題だ。

問いの競合密度が低い帯域では、構造への依存度が下がる。 その問いに直接答えられるページが少なければ、構造が不十分でも引用候補になりうる。

中間帯域では、問いとテーマの一致＋構造の両立が条件になる可能性がある。 どちらか一方では不十分で、両立して初めて引用候補として浮上する。

ここから導かれる順序がある。「問いの設計」が先で、「構造の整備」はその後だ。

問いの競合密度を確認せずに構造改善を重ねることは、土俵に乗れない問いに対して完璧な答えを用意し続けることに等しい。構造の問題ではなく、問いの問題を先に解くことが、GEO対策の入口として機能する可能性がある。

ただし「問いさえ正しければ構造は不要」ということではない。中間帯域の結果が示す通り、問いとテーマが一致した上で構造の密度も必要になる帯域が存在する。問いの設計は構造整備の代替ではなく、先行条件だ。

診断の考え方——「問いの競合密度」と「引用部品性」の二軸

前章の観察から、GEO対策の効果が出ない原因を診断する軸として、以下の2つを提案する。

問いの競合密度

自分のページが答えようとしている問いに、他のページがどれだけ答えているか、という軸だ。

確認方法は単純だ。自分が答えようとしている問いをそのままPerplexityに投げる。上位の引用ソースが大手メディア・専門メディア・官公庁サイトで占められているなら、その問いの競合密度は高い。引用ソースが少なく、個人サイトや小規模サイトが混在しているなら、競合密度は相対的に低い。

競合密度が高い問いのまま構造改善を続けても、引用の土俵に乗れない可能性がある。その場合、問いをより固有の方向に絞ることを先に検討する。

引用部品性スコア

ページの中に、AIが回答に差し込める独立した情報単位があるかどうか、という軸だ。AI Alchemy Labでは以下の4項目でチェックしている。

冒頭の自己完結性：冒頭1〜3文以内に、定義・結論・数値のいずれかがあるか
回答ブロックの独立性：各セクションが、前後の文脈なしに単独で意味をなすか
問いとテーマの一致度：記事全体が答えようとしている問いと、ページのテーマが1対1に近いか
固有データの有無：一次情報・独自観察・具体的な数値が含まれているか

4項目すべてを満たす必要はない。ただし競合密度が中程度の問いを狙う場合は、複数項目の充足が引用確率に影響する可能性がある。

診断の順序

まず問いの競合密度を確認する。競合密度が高いなら、問いを見直す。競合密度が適切な問いに対して、次に引用部品性スコアを確認する。スコアが低い項目を改善する。

この順序で動くことで、「構造は整っているのに引用されない」という状態の原因が、問いにあるのか構造にあるのかを分離して診断できる。

AI Alchemy Lab自身でこの診断軸を使ってみた

この診断軸を、AI Alchemy Labの既存記事に実際に当てはめてみる。

記事	問いの競合密度	引用部品性スコア	EXP-007での結果
第1回（GEO実験を始める理由）	高（GEO入門系は大手メディアが多数）	1/4	広い問いで未引用・固有の問いで引用
第2回（クエリ種別と引用元の変化）	中（観察系記事は競合少なめ）	4/4	中くらいの問いで引用・広い問いで未引用
第6回（固有クエリ実験EXP-006報告）	低（実験ログ系は競合極めて少ない）	2/4	固有の問いで引用

第1回記事は、問いの競合密度が高い帯域を狙っている。構造スコアが低いことも要因ではあるが、仮にスコアを4/4に改善しても、競合密度の問題が残る限り広い問いでの引用は難しい可能性がある。

第6回記事は、スコアが2/4と低いにもかかわらず固有の問いで引用された。これは「問いの競合密度が低い帯域では、構造への依存度が下がる」という観察と一致する。

ただしこの自己適用はn=3記事の観察であり、再現性には限界がある。この診断軸の有効性はEXP-008という継続実験で現在検証中だ。 本記事自体もその実験の一部であり、この記事がどのクエリで引用されるか（あるいはされないか）を記録する予定だ。

まとめ

GEO対策で引用されないとき、診断の順序として以下を提案する。

まず、「問いの競合密度」を確認する。 自分のページが答えようとしている問いをPerplexityに投げ、引用ソースの顔ぶれを見る。大手メディアが上位を占めているなら、その問いの帯域では競合密度が高く、構造改善よりも問いの見直しが先行条件になる可能性がある。

次に、「引用部品性スコア」を確認する。 問いの競合密度が適切な帯域に絞れたら、ページの中に自己完結した情報単位があるかを4項目でチェックする。

この2軸の診断順序が、「構造を整えたのに引用されない」という状態から抜け出す入口になりうると考えている。

繰り返しになるが、これは小規模観察から導いた仮説だ。AI Alchemy Labでは引き続き実験を重ね、この仮説を更新していく。もし「自分のサイトでこう見えた」「この解釈は違うと思う」という観察があれば、ぜひ教えてほしい。反証も含めて、次の仮説の材料になる。

完全な記事を表示