測り方を変えたら、景色が変わった...
BtoBの小規模サイトがAI検索対策を無料で始めるとき、最初にやるべきことと、落とし穴
BtoBの小規模サイトがAI検索対策(GEO)を無料で始めるなら、最初の一手は「自社のターゲットが投げそうな問いを、実際にAI検索に入れてみる」ことだ。これは悪くない出発点だと思う。ただし、入れたあとに何を見るかで、得られるものが大きく変わる。見るべきなのは「自社が引用されているか」ではない。その問いに対して、いま誰が引用されているのか——引用ソースの顔ぶれだ。
これを見ずに記事を書き始めると、手順通りにやっても引用されない落とし穴にはまる。AI Alchemy Lab自身がはまった。本記事は、その記録だ。
ひとつ先に伝えておきたい。ここで述べる内容は、AI Alchemy Labが独自に行った小規模な観察(後述するEXP-007、9クエリ・複数記事の比較)と、ターゲットの長い問いを実際にPerplexityへ投げた一次記録から導いた仮説であり、断定ではない。誤りが含まれる可能性もある。その前提で読んでほしい。新しい領域だけに専門家によって言うことは違い、何を信じればいいか迷う場面が多い。だからこそ、誰かの言葉を鵜呑みにするのではなく、自分の手元で小さく試して確かめる材料の一つとして、この記録を使ってほしい。
「問いを投げてみる」は正しい。ただし、何を見るかで結果が変わる
AI検索対策で最初にやることとして、多くの解説記事が「自社のターゲットが検索しそうな質問を、Perplexityなどに入れてみよう」と勧めている。これ自体は妥当だ。無料でできて、自分の業界でAIがどう答えているかが一目でわかる。最初の一手として理にかなっている。
問題は、その先で何を見るかだ。多くの人は「自社サイトが引用されているか/されていないか」を見る。引用されていれば嬉しいし、されていなければ落ち込む。だが、小規模サイトが始めたばかりの段階で、いきなり引用されることはほぼない。だから「引用されていない」を確認して終わりでは、次につながらない。
見るべきなのは、その問いの回答に実際に引用されているソースの顔ぶれだ。大手メディアばかりなのか。それとも個人ブログやニッチな専門サイトも混じっているのか。引用元が10本ともBBCやニューヨーク・タイムズのような巨大メディアで占められている問いと、小さなサイトの一次情報が混じっている問いとでは、後から自分が入り込める余地がまったく違う。AI検索の回答画面で引用元リストを開き、「ここに自分が割って入れそうか」という目で顔ぶれを眺める。これが、引用の有無を見るよりずっと実りのある観察だ。
なぜ引用元の顔ぶれを直接見る必要があるのか。従来の検索順位を確認するだけでは足りないからだ。AhrefsがAI Overviewの引用元を調べたところ、従来検索の上位10位以内から引用されたのは38%にとどまり、1年前の76%から大きく下がっていた。つまり、従来の検索順位を見ているだけでは、AI検索でどのページが引用されるかは読めなくなってきている。検索順位を眺めるのではなく、実際にAI検索がいま誰を引用しているのかを、自分の目で確かめる意味がここにある。
AI Alchemy Labが実際にやった記録——9つの問いを投げた結果
抽象論ではなく、実際にやってみた記録を出す。AI Alchemy Labでは2026年5月、自分たちの記事3本を対象に、問いの「広さ」を3段階に分けて、合計9つの問いをPerplexityに投げた(EXP-007)。広い問い・中くらいの問い・固有の問い、それぞれ3本ずつだ。
| 対象記事 | 広い問い | 中くらいの問い | 固有の問い |
|---|---|---|---|
| 第2回記事 | 未引用 | 引用あり(第2回記事) | 引用あり(別記事) |
| 第3回記事 | 未引用 | 未引用 | 引用あり(第3回記事) |
| 第1回記事 | 未引用 | 未引用 | 引用あり(第1回記事) |
数字だけ抜き出すと、こうなる。広い問いは3本中0本が引用。中くらいの問いは3本中1本だけ引用。固有の問いは3本すべてが引用された。
観察できるよう、実際に投げた問いと結果を具体的に残す。広い問いとは、たとえば「生成AIはどんなサイトを引用しますか?」のような問いだ。このとき引用されていたのは、大手メディアやReddit、一般的な解説サイトだった。AI Alchemy Labの記事はどこにも出てこなかった。一方、固有の問いとは、たとえば「AI Alchemy LabがClaude CodeよりDifyを選んだ理由を教えてください」のような、自分たち固有の条件を含んだ問いだ。これには、対象記事が引用された。
この観察にはいくつか条件がある。プラットフォームはPerplexityで、観察時点は2026年5月。一部の問いは過去の履歴の影響を抑えた状態で、一部はログイン状態でと、条件が完全には統一できていない。そして重要な点として、同じ固有の問いをChatGPTとGeminiにも投げたが、そちらでは引用されなかった。この記録はPerplexityを中心とした観察であり、AI検索全般を代表するものではない。Perplexityを主な観察対象にしているのは、引用元が明示され、個人が無料で継続的に観察しやすいからだ。だからここに書くのは、Perplexity上で実際にこう見えた、という事実の記録である。AI検索の引用は、使うツール・時期・ログイン状態・問いの言い回しによって変わる。同じ問いでもエンジンが違えば結果が変わることは、上のChatGPT・Geminiとの差がそのまま示している。
それでも、印象的な点があった。固有の問いで引用された記事の中には、AI Alchemy Labが独自につけている「引用部品性スコア」が4点満点中1点と、構造的にはいちばん弱い記事も含まれていた。引用部品性スコアは、AIが回答に差し込みやすい独立した情報単位がページにあるかを、次の4項目でチェックするものだ。
- 冒頭の自己完結性:冒頭1〜3文以内に、定義・結論・数値のいずれかがあるか
- 回答ブロックの独立性:各セクションが、前後の文脈なしに単独で意味をなすか
- 問いとテーマの一致度:記事のテーマと答えようとしている問いが1対1に近いか
- 固有データの有無:一次情報・独自観察・具体的な数値が含まれているか
この4項目で見て構造的にいちばん弱い記事でも、固有の問いでは引用された。今回の小規模な観察に限って言えば、構造が弱くても問いが十分に固有であれば引用される傾向が見えた、ということだ。
手順通りにやっても引用されなかった。見えてきた落とし穴
ここからが落とし穴の話だ。広い問いで3本とも未引用だったとき、その回答に何が引用されていたかを見ると、大手の解説メディアや一般的な用語解説サイトばかりだった。小さなサイトが入り込む隙はない。
このとき効いているのは、記事の出来不出来ではなく、問いの競合密度だと考えている。「生成AIはどんなサイトを引用しますか?」のような広い問いには、世の中に何千本もの解説記事が存在する。AIはその中から選ぶので、後発の小規模サイトが選ばれる確率は限りなく低い。一方で、「AI Alchemy LabがDifyを選んだ理由」のように、答えられるのが自分しかいない問いには、競合がそもそも存在しない。
ここに落とし穴がある。「AI検索に問いを投げてみよう」という手順を素直に実行すると、つい広い問い——自社の主力キーワードや、検索ボリュームの大きそうな一般的な質問——を投げてしまう。そして引用されないのを見て「うちの記事が悪いのか」と構造の作り込みに走る。だが本当の原因は、記事の構造ではなく、最初に選んだ問いが競合だらけの土俵だった、ということが起こりうる。構造を直す前に、土俵を間違えていないかを疑う。これが得た教訓だ。
そして、ここでもう一段深い落とし穴がある。「専門家の言う通りにやったのに失敗した」という声の正体に関わるものだ。
AI検索対策は新しい領域で、専門家によって言うことが違う。ある人は「LLMO対策は必須だ」と言い、別の人は「まだ様子見でいい」と言う。さらに、こんな出来事もあった。GoogleがイベントでAI Overviews向けの最適化について「特別なGEOやLLMOは不要で、通常のSEOをすればよい」と述べ、llms.txtというファイルもGoogleは使わないと明言した。これ自体はGoogle検索のなかの話だ。Googleは従来検索とインデックス基盤を共有しているので、Google内では「通常SEOの延長」が成り立つ。ところが、この限定的な発言が文脈を切り落とされ、「GoogleがAI検索対策そのものを不要と公式宣言した」という形でSNSに広まった。その一言を根拠に施策を止める判断まで出てきたという。新しい領域ほど、こうした伝言ゲームが意思決定を左右してしまう。実際には、PerplexityやChatGPTはGoogleとは別のパイプラインで動いていて、Google検索についての発言が、そのまま他のAIに当てはまるとは限らない。
このとき、非専門家がとりがちな道は二つある。一つは「専門家でもない自分に判断できるはずがない」と何もしないこと。もう一つは「誰を信じればいいかわからない」と情報を集め続けて動けなくなること。前者は乗り遅れ、後者は時間だけが過ぎる。
AI Alchemy Labが選んだのは、別の道だ。誰か一人の専門家を信じるのをやめて、自分で小さく試して、自分の目で結果を確かめる。知識量で専門家に勝つのは難しくても、自分の手元で起きたことなら、誰の言葉も介さずに確かめられる。実際、「専門家の手順通りに広い問いを投げてみた」ら引用されなかった、という今回の記録は、まさにその確かめから出てきたものだ。手を動かさなければ、この落とし穴の存在自体に気づけなかった。
では、どう問いを選べばいいか——小規模サイトが土俵に乗れる条件
固有の問いで引用されたという観察から逆算すると、小規模サイトが土俵に乗れる条件が見えてくる。
小規模サイトが最初に探すべきなのは、広すぎる問いではなく、自社の事例・実験・判断基準で具体的に答えられる問いだ。自社が実際に試した結果、自社の業界・地域・顧客に固有の条件を含んだ問い。こうした問いは競合密度が低く、答えられるのが自分だけに近づくので、引用される確率が上がる。「業界Aで、規模Bの会社が、課題Cにどう対処したか」というように、条件を具体的に絞り込むほど競合は減る。
逆に、検索ボリュームが大きい一般的なキーワードや、誰でも一般論で答えられる広い問いは、いくら記事を磨いても巨大メディアに埋もれる。小規模サイトが最初に狙う土俵としては不向きだ。
ここで注意したいのは、固有性を高めれば高めるほどいい、という単純な話ではない点だ。あまりに固有にしすぎると、今度は「そもそも誰もその問いを投げない」という別の問題が出てくる。だから本当に狙うべきは、見込み客が実際に投げそうで、なおかつ自社の一次情報を足すことで答えの質を高められる問いだ。 広すぎて埋もれる問いと、固有すぎて誰も投げない問いの、あいだのどこかにそれはある。この中間帯域をどう見つけるかが、いちばん難しく、いちばん肝心なところだ。この限界については次に正直に書く。
この方法の限界——正直に書く
この方法には、はっきりとした限界がある。
最大の限界は、自社が引用される固有の問いを、ターゲットが実際に投げるとは限らないことだ。「AI Alchemy LabがDifyを選んだ理由」という問いには引用されても、AI Alchemy Labの名前を知らない見込み客は、そんな問いを投げない。固有性を上げれば引用されやすくなる一方で、その問いを投げる人の数は減っていく。引用されやすさと、その問いの需要は、トレードオフの関係にある。だから現実には、前章で書いた中間帯域を探す作業になる。この探り方こそ、AI Alchemy Labがいま継続して観察している最中のテーマだ。
もう一つの限界は、観察そのものの不確かさだ。今回の記録はPerplexityでの観察が中心で、3記事×9問という小さなサンプルにすぎない。前述の通り、AI検索の引用結果は、使うAI、その時点のモデルの状態、ログイン状態や過去の検索履歴、問いの言い回しのわずかな違いによって変動する。実際、同じ固有の問いでも、Perplexityでは引用されたのにChatGPTやGeminiでは引用されない、という差が出た。だから、ここに書いたことは「こうすれば必ず引用される」という法則ではなく、「ある条件下でこう見えた」という暫定的な観察だ。
それでも、この方法をやる意味はある。引用される・されないという結果そのものより、自分の業界でAIがいま誰を引用しているのか、その地図を自分の目で持てることに価値がある。外注の見積もりやチェックリストを眺めているだけでは手に入らない、現場の肌感覚が得られる。無料で、誰の許可もいらず、今日から始められる。小規模サイトにとって、これは十分に意味のある第一歩だ。
まとめ——最初の2週間でやること
最後に、無料で始める具体的な手順をまとめる。最初の2週間は、これだけやれば十分だ。
- ターゲットが投げそうな問いを、広い・中くらい・固有の3段階で書き出す。 たとえば「GEO対策とは」(広い)、「製造業のGEO対策のやり方」(中くらい)、「○○業界で△△という課題を××で解決した事例」(固有)のように、同じテーマで粒度を変えて並べてみる。
- それぞれの問いをAI検索に実際に投げる。 まずは無料で使えるPerplexityで十分だ。
- 回答そのものではなく、引用元リストの顔ぶれを記録する。 何本引用されているか、大手メディアばかりか、小さなサイトが混じっているか。引用元が大手で固まっている問いは、当面は避ける土俵だ。小さなサイトや一次情報が混じっている問いに、自社が入り込める余地がある。
- 入り込めそうな問いに、自社にしか書けない固有の情報を答える記事を書く。 顔ぶれを見て「ここなら自社が割って入れそうだ」と思える問いに対して、事例・実際に試した結果・固有の判断基準を載せる。一般論ではなく、自社の一次情報を載せることが鍵だ。
観察するときの注意を一つ。AI検索の結果は、過去の検索履歴やログイン状態に影響されることがある。できるだけ素の状態に近い結果を見たいなら、普段使っていないブラウザで開く、ログアウトした状態で試す、時間や日を変えて複数回見る、といった工夫をするとブレが見えてくる。ただし、こうした「履歴を分離する機能」はAI検索サービス側の仕様変更で使えなくなったり挙動が変わったりすることがある。機能そのものに頼るより、一度の結果を絶対視せず、条件を変えて複数回観察する、という姿勢のほうを大事にしてほしい。
繰り返しになるが、これは小規模な観察から導いた仮説だ。AI Alchemy Labの記事が正解だと言うつもりはない。むしろ、手順通りにやって引用されなかった失敗も、そのまま残している。信じてほしいのではなく、あなた自身が自分のサイトで確かめる材料の一つに使ってほしい。もし「自分のサイトではこう見えた」「この解釈は違うと思う」という観察があれば、ぜひ教えてほしい。反証も含めて、次の仮説の材料になる。