もし、ユーザーの問いに正面から答えている、世界にたった一つの記事を書いたら、その記事は検索AIに引用されるだろうか。
そう期待して、一本書いてみた。「BtoBの小規模サイトが、無料でAI検索対策を始めるとき、実際にやってみたらどうだったか」——調べた限り、この問いに一次記録で答えている記事はどこにもなかった。空いている椅子に見えた。
結果は、引用されなかった。
ユニークだというのは思い込みで、実は似た記事が他にもあったのか。そう思って、Perplexityが実際に引用したコンテンツを調べてみた。
ところが、引用されていたのは、問いの一部だけに部分一致する記事の寄せ集めだった。問い全体に答えた一本ではなく、断片に答えた複数を、AIがつなぎ合わせている。これはいったいどういうことなのか。
わからないので、その引用結果をそのまま拡張Geminiに見せて聞いてみた。返ってきたのは、「その問いの条件にぴったりはまる単一の記事が、ほぼ存在しないから」だった。つまりGeminiも、空白が実在することは認めている。認めたうえで、寄せ集めで答えていた。
では、Perplexityは私の記事の存在を認識していないのか。
そうでもなかった。記事のURLを直接渡して「要約して」と頼むと、その問いに対する答えを、記事の中から正確に引っぱり出してくる。中身は読めている。認識もしている。なのに、問いを投げると選ばれない。
この食い違いを最後まで切り分けていったら、AIの引用が記事単位でも、主張でも、文言の一致でもなく、もっと細かい単位で決まっているのではないか、と思えてきた。本稿はその一次記録である。
なお、本稿の観察はPerplexityを中心に、Gemini・Google AI Overviewを加えたものにとどまる。AI検索全般を代表するものではないし、観察はn=1規模で、統計的な確証もない。2026年6月時点の挙動であり、モデルが変われば結果も変わりうる。それでも、引用されなかった過程をここまで細かく記録した一次記録は、調べた限り他に見当たらない。だから残す。
前提を手短に説明する。長く書くと、それ自体がこの記事の足を引っ張る。理由は最後まで読めばわかる。
AI Alchemy Labは、これまでの連載で「AIに引用される条件」をいくつか仮説として積み上げてきた(EXP-001〜007)。冒頭に結論を置く、回答ブロックを独立させる、問いと記事テーマを一致させる、固有のデータを持つ——この四つを「引用部品性スコア」と呼んで、自分の記事を点検する物差しにしていた。
その物差しを総動員して、一本の記事を書いた。狙ったのは、さきほど触れた空白地帯だ。専門家が方法論を説く記事は山ほどあるが、「実際にやってみた記録」はない。空いている椅子に座れば選ばれるはずだ、と考えた。
これがそもそもの間違いだった、というのが本稿の結論になる。
公開後、いくつもの問いを投げた。記事タイトルそのものの問い、中心主張をそのまま言い換えた問い、ターゲットが実際に投げそうな長い相談文。Perplexityは履歴の影響を抑えた条件を含めて複数回、GeminiとGoogleも見た。
結果は、どの条件でも引用されない。引用されたのは、いつもの方法論説明系の記事だった。
なぜか。考えられる原因を、一つずつ潰していった。
最初に疑ったのは、そもそも見つけられていないのではないか、ということだった。だがGoogleのオーガニック検索には、この記事が正しいスニペット付きで出てくる。インデックスはされている。これは違う。
次に、記事の中身が伝わっていないのではないか、と疑った。だが冒頭で書いた通り、URLを直接渡せばPerplexityは中心主張も落とし穴も独自性まで正確に要約する。読めていないのではない。これも違う。
では、書き方の配置が悪かったのか。この記事は、冒頭をターゲットの問いへの直接回答に絞り、抽象的な論考は中盤に独立した塊として置く設計にしていた。配置が読解を妨げたのか。だが中身は完全に読めているし、タイトルと完全一致の問いでも引用されない。配置は主因ではなさそうだ。
文言が足りないのか。中心主張に言葉を寄せた問いを投げても、引用されない。これも違う。
残ったのは、「問いの競合密度」だった。広い問いほど競合が多く、固有の問いほど競合が少ない——過去の観察(EXP-007)で見えていた傾向だ。だがこれだけでは説明がつかなかった。タイトルと完全一致する、極めて固有な問いでも引用されなかったからだ。「問い全体」を単位にすると、説明が合わない。単位が粗すぎるように思えた。
切り分けの途中で、過去に何度も引用されてきた別の記事(第2回記事)を対照に使った。この記事は「生成AIはペイン解決系の質問に対して個人ブログやSNSを引用するか」という問いで、これまで三回引用されている。安定して選ばれる記事だ。
ここで一つ実験をした。問いから「ペイン解決系」という語だけを抜いて、「生成AIはどんな種類の質問で個人ブログやSNSを引用するか」に変えた。テーマは同じ、記事も同じ、変えたのは一語だけ。投げた先はPerplexity、履歴の影響を抑えた条件である。
引用が消えた。
変えたのは一語だけなのに、Perplexityの引用結果が反転した。ここから言えるのは、少なくともこの一回、このPerplexityの条件下では、引用を分けたのが記事の良し悪しでも、主張でも、テーマの一致でもなく、「ペイン解決系」という語の有無だった、ということだ。この語は、競合の少ない希少なフックとして働いたように見える。一度の観察で言い切れることではない。だが、これまで切り分けてきた他の原因がどれも当てはまらなかったことと合わせると、引用は「問い全体」よりもっと細かい単位で決まっているのではないか——そういう仮説が立つ。
ここまでをまとめると、こうなる。
AIは問いを受け取ると、それを一本のまま処理しないらしい。いくつものサブの問い、いくつもの概念に分解する。たとえば「無料でGEOを始めるには」という一つの問いを、「GEOとは何か」「無料でできる方法は」「小規模サイトの事例は」といった小さな問いにばらし、それぞれの答えを別々のページから引っぱってくる。Aの部品はこの記事から、Bの部品はあの記事から、という具合だ。そして集めた部品を合成して、一つの回答を作る。引用が起きるのは記事単位ではなく、この部品単位ではないか。
ある部品について、世の中に競合する素材が大量にあれば、AIはそれらをかき集めて合成してしまえる。特定の一本は要らない。逆に、ある部品について競合がほとんどなければ、それを持つ記事が選ばれる。「ペイン解決系」がまさにそれだったように見える。
この見方は、自分の観察だけの思いつきではない。Ahrefsが2026年に863,000件のSERPを分析した最新調査では、AI Overviewに引用されたページのうち従来検索トップ10由来のものが、前年の76%から38%へ落ちている。Googleが公式に認めているquery fan-out——問いを複数のサブクエリに分解し、各サブクエリで多く現れるページを引用する仕組み——が、引用元の選び方を大きく変えたためだとAhrefsは見ている。GEO研究者のまとめでも、「あなたのページはドキュメント単位ではなく、パッセージ(部品)単位で競っている」と、ほぼ同じことが言われている。観察した現象に、外から名前がついていた、という順序だ。
ここがこの記事の、実務に効く核心になる。
SEOに慣れたマーケターは、改善の型を体で覚えている。今の順位を測り、上位ページと自分を見比べ、足りない差分を埋める。この型が効くのは、追い抜く相手がはっきりしているからだ。検索1位のページが目の前にあって、それより良いものを作れば順位が上がる。相手が一枚に決まっているから、比較も改善も成り立つ。
GEOには、その「追い抜くべき一枚」がない。query fan-outで問いが砕かれ、答えの素材が複数のページから別々に集められて合成される以上、勝つべき相手が一枚のページとして存在しない。比較しようにも、相手が問いの断片の数だけ散らばっている。だから、上位ページとの差分を詰めるというSEOの改善が、GEOでは空回りする。
私は、まさにこのSEOの発想のまま動いていた。「空白地帯」を見つけて、そこを埋めれば選ばれると考えた。SEOなら正しい。空いた1位の椅子に座る戦略だ。だがGEOでは、その空白を、AIは既存の方法論記事が持つ部品の寄せ集めで合成して埋めてしまえた。だから空白を埋めるはずの一次記録は、要らないと判断されたのだろう。実際、Geminiは「中小零細の本音に寄り添った単一記事はほぼ存在しない」と空白の実在を認めながら、その空白を方法論記事の寄せ集めで埋めてみせた。空白はある。でも一次記録は選ばれない。
皮肉なことに、引用されなかったあの記事が言いたかったのは、「AIがどんなコンテンツを引用しているか、その顔ぶれを自分の目で見よ」ということだった。だが、この主張をAIの側から眺めると、「AIの引用」「情報の信頼性」「どう選ばれるか」といった、ありふれた話の集まりに見える。どれも、GEOを解説する記事が世の中に大量に書いているテーマだ。つまり私の記事は、希少なフックを持っているつもりで、中身を細かく見ると、競合だらけのありふれたテーマの寄せ集めだった。私は「問いの競合を疑え」と書いた記事自身で、競合の多い場所に立っていた。自分が指さした落とし穴に、自分で落ちていた。
GEOで取りうる改善は、だからSEOとは向きが逆になるのかもしれない。総合点で上位に並ぶのではなく、誰も持っていない一点(フック)を持つこと。「ペイン解決系」という一語が示したのは、その一点の効き目だった。
ここまでの話を、そのまま鵜呑みにはしないでほしい。引用を左右する要因が、「部品の競合密度」のほかにもう二つあることが、今回の観察で見えてきたからだ。一つは「見る人によって結果が変わること」、もう一つは「名前がかぶって負けること」。どちらも、あなたが自分で同じことを試したときに結果が食い違う原因になりうる。だから、おまけの予告としてではなく、ここで先に断っておく。
一つ目、見る人によって結果が変わる。同じ固有の問いを投げても、観察用に履歴を抑えたアカウントではLab記事が一本も出ずに一般論で返ってきた。普段使いの個人アカウントでは別のLab記事が引用され、シークレットモードではまた別の記事が出た。同じ問い、同じ記事なのに、見る人の環境で引用される顔ぶれが変わる。これは、過去にEXP-007で「固有の問いは三問とも引用された」と書いた結論すら、たまたまその環境でそう出ただけかもしれない、ということを意味する。もしあなたがこの記事の話を自分の環境で試して、まるで違う結果になったら、原因はこの揺れかもしれない。
二つ目、名前がかぶって負ける。「AI Alchemy Lab」には、MITに同じ名前の実在プロジェクトがある。履歴を抑えた素の状態でGoogleのAI Overviewにこの名前を投げると、出典がLA TimesやMITの、その権威あるプロジェクトのほうが選ばれ、こちらは出てこない。記事の中身が良いか悪いか以前に、名前そのものがぶつかって引用を奪われる。これは、メディア名やブランド名を決める段階なら避けられるが、決めてしまった後では動かしにくい。
この二つは、それぞれ単独で確かめる価値がある。今回は「部品の競合密度」一点に話を絞るため深入りしないが、近いうちに別のテーマとして取り上げる。
うまくいった話は、たいてい誰かが書いてくれる。だが「やってみたのに引用されなかった」という記録は、表に出にくい。GEOを生業にするサービス事業者は、こういう記録をわざわざ出さないだろうし、出しにくい立場でもあると思う。引用されなかった過程を細かく見せることは、自分たちの方法論への問いにもなりかねないからだ。
けれど、これからGEOを自分の手で試そうとしている、私と同じ立場の人——予算も人手も潤沢ではないなかで、まず小さく始めてみたい人——にとっては、うまくいった話よりも、「やってみたら、こういう壁にぶつかった」という記録のほうが、たぶん役に立つ。少なくとも私は、これを始める前に、こういう記録が読みたかった。
だから残す。今回見えてきたのは、AIは記事を丸ごと評価しているのではなく、問いを細かく砕いて、その断片ごとに素材を集めているらしい、ということ。そして、ありふれた断片しか持たない記事は、たとえ全体として世界に一つでも、選ばれにくいらしい、ということ。
ただ、この結論には、さきほど挙げた二つの邪魔者——見る人によって結果が変わること、名前がかぶって負けること——がまだ残っている。とくに「見る人によって引用される顔ぶれが変わる」現象は、今回の結論そのものを揺さぶりかねない。次に確かめたいのは、たぶんそこだ。これが正しいかどうかは、これからも観察して、記録に残していく。