「スキーマ実装 → AI引用増」の因果関係は現時点で証明されていない。Ahrefsの大規模調査・searchVIUの実機実験・Search Atlasの先行研究がいずれも同じ方向を示している。ただし「スキーマが無意味」ではなく「AI引用増の直接レバーではない」が正確な解釈。Bing Copilot向け・テクニカルSEO衛生管理・リッチリザルトとしての役割は引き続き有効。クライアントへの提案においてスキーマを「AEO/AI引用強化策」として前面に出すことは、根拠不十分につき推奨しない。
Ahrefs調査(2026年5月11日)の概要
Louise LinehanとXibeijia Guanが公開した「We Tracked 1,885 Pages Adding Schema. AI Citations Barely Moved.」[1]は、業界でよく引用されてきた「スキーマはAI引用のレバー」という主張に対して、初めて対照群つき因果推論で反証を試みたデータスタディだ。
チームはまず600万URLを分析し、AI引用ページはそうでないページに比べJSON-LDを保有する確率が約3倍高いことを確認した。しかしこれは「相関」であり「質の高いサイトがスキーマも引用も獲得しやすい」という交絡変数の可能性があると判断。因果を検証するための第二フェーズを実施した。
| 項目 | 内容 |
|---|---|
| 介入グループ | 2025年8月〜2026年3月にJSON-LDを追加した1,885ページ(追加日を過去クロールデータで特定) |
| 対照グループ | 同期間にスキーマ追加なし、かつ引用傾向が類似したページ(1介入に対し3対照、異なるドメインから選定)計4,000ページ超 |
| 前提条件 | 全ページが2025年2月時点でAI Overview引用100件以上(すでにAIに認識済みのサイト) |
| 分析手法 | Difference-in-Differences(差の差)分析。プラットフォーム全体のトレンド変動を除外したうえでスキーマ追加の純効果を推定 |
| 計測プラットフォーム | Google AI Overviews / Google AI Mode / ChatGPT |
| 計測期間 | スキーマ追加前後それぞれ30日間 |
結果数値
4種類の補助検定をすべて同方向で実施し、いずれも「明確なプラス効果なし」の結論。なおAI Overviewsの−4.6%については、スタディ期間中にAI Overviews自体が縮小傾向にあったことや、スキーマ追加時に他のコンテンツ要素も変更されていた可能性が指摘されており、原因の帰属は不確かだとAhrefs自身が注記している。
searchVIU実験(2025年10月・12月):AIはJSON-LDを読んでいるか
ドイツのテクニカルSEOエージェンシーsearchVIUが2025年10月に実施し、12月に公開した実験[2]は、AIがページをリアルタイム取得する際のスキーマ処理を検証したものだ。Ahrefsのスタディでも引用されている。
同社はJSON-LD・Microdata・RDFa等を使ってテストページを作成し、価格情報などをスキーマのみに記述(ページ上の可視テキストには表示しない)。ChatGPT・Claude・Perplexity・Gemini・Google AI Modeの5システムにページを直接取得させて、スキーマ内の情報が抽出されるかを確認した。
SEOコンサルタントのClaudio Novaglio[3]はこの結果を次のように解釈している:「スキーマが引用に効く経路があるとすれば、リアルタイム取得ではなくインデックスフェーズ(クロール・学習時)だ。searchVIUの実験はAhrefsの結果を否定するのではなく、なぜ効かないかを説明している」。
AIのスキーマ処理:フェーズ別の整理
Phase 4(直接フェッチ)でのみスキーマが無効であることが検証された。Phase 1〜3での効果については未検証・未公表領域が多く、BingはPhase 2〜3での活用を公式確認している(後述)。
Search Atlas調査(2024年12月):先行研究との一致
AhrefsスタディよりもサンプリングされていたSearch Atlas(現Conductor Search Atlas)の2024年12月調査[4]は、OpenAI・Gemini・Perplexityへの数百万件のLLMレスポンスを分析し、スキーマカバレッジとLLM引用率の関係を検証した。
この結果はAhrefsの因果推論とは独立したアプローチから同方向の結論を示しており、相互補強の関係にある。一方でこの調査も「相関なし」を確認したに過ぎず、未引用ページへの影響や特定スキーマタイプへの効果については言及していない。
「調査は正しい、でも問いが違う」という論点
Ahrefsスタディの公開後、SEO業界では広範な議論が起きた。注目すべきは、調査の結論そのものを否定する声が少なく、「何を計測したかの射程」についての議論が中心になっている点だ。
- DiD分析という因果推論の手法はSEO研究として異例に厳密
- 「相関データ→因果推論」という業界の誤謬への適切な警鐘
- Search Atlasの先行研究と方向性が一致する
- 「スキーマを入れれば引用が増える」という直線的な主張は否定された
- 検証可能なデータセットが公開された初めての研究であり、議論の起点として有効
- 対象は引用100件以上のページのみ。AIに全く見えていないページへの効果は不明
- 「AI引用数を増やす」効果のみを計測。インデックス理解・エンティティ解析・リッチリザルトへの効果は別問題
- BingはスキーマのLLM活用を公式に確認済み。ChatGPT SearchのバックエンドはBing経由
- スキーマタイプを一括で分析しており、特定タイプ(Organizationなど)の効果は未分解
- 30日間という計測ウィンドウが短く、遅効性の効果を見逃している可能性
Gianluca Fiorelli(I Love SEO)[5]はこう評価した:「Ahrefsは誠実な研究を公開した。問題はヘッドラインの『AI引用はほぼ動かなかった』が、スキーマ全否定として一人歩きするリスクだ。彼らがテストしたのは非常に限定的な問いである」。
各社ステートメントの整理(2025年時点)
| プラットフォーム | 公式見解・根拠 | 信頼度 |
|---|---|---|
| Microsoft Bing / Copilot | 2025年3月SMX Munich登壇でFabrice Canel(Principal PM)が「スキーマはBingのLLMがコンテンツを理解するために役立つ」と明言。LinkedInで当該発言をFabrice本人が確認 searchengineland.com — 2025年3月20日 |
公式確認済 |
| Google AI Overviews | 2025年4月、GoogleサーチチームがAI検索での構造化データの優位性に言及。ただし「AI Overviewのために特別なスキーマは不要」とも明記。両発言が並立している点に注意 searchengineland.com — 2026年3月25日 |
部分確認 |
| ChatGPT Search | OpenAIから公式コメントなし。ChatGPT SearchのバックエンドはBingのインデックス経由が主流であるため、Bing向けスキーマが間接的に影響する経路は理論上存在する soar.sh — 2026年 |
未公式(間接的) |
| Perplexity | 公式発言なし。PerplexityBotはインデックス構築時にJSON-LDをパースすると推定されているが、重みは未公表 claudio-novaglio.com — 2026年5月 |
未公式 |
| Anthropic Claude / OpenAI | スキーマ利用について公式コメントなし | 未公式 |
AI引用を実際に左右している要因(複数研究の照合)
スキーマ以外の要因についても、複数の大規模調査が蓄積されている。以下はAhrefs・SE Ranking・Growth Memoらの研究を照合した整理だ。
| 要因 | 効果の強さ | 根拠・出典 |
|---|---|---|
| 被リンク・参照ドメイン数 | 強(複数研究で一致) | 参照ドメイン32K以上のサイトはChatGPT引用率が3.5倍高い(Ahrefs 2026年4月) 「LLM引用を最も強く予測する指標は被リンク」(SE Ranking 129,000ドメイン調査)[6] DA60以上からの高品質被リンク数がTop5シグナルの1つ(Growth Memo 2026年2月)[7] |
| ブランドメンション(獲得メディア) | 強(複数研究で一致) | Ahrefsの75,000ブランド分析:ブランドメンションとAI Overview可視性の相関係数0.664 vs 被リンク0.218。ブランドメンションは被リンクの約3倍予測力が高い[8] Reddit・Quoraでのブランドメンション多数のドメインはChatGPT引用率4倍高(SE Ranking 2025年) |
| コンテンツの権威性・E-E-A-T | 強 | Wellows(2026年):E-E-A-TがAI引用の単独最強予測変数[9] 著名外部メディアへのコンテンツ配信はAI引用を最大325%増(Stacker 2025年12月)[7] |
| Trustpilot・G2等のレビューサイト掲載 | 中 | 掲載サイトはChatGPT引用確率が3倍高い(SE Ranking 2025年)[6] |
| コンテンツの冒頭配置(位置) | 中 | LLM引用の44.2%は記事の最初30%のテキストから(Growth Memo 2026年2月)[7] |
| スキーマ(JSON-LD)実装 | 低〜中(Bing限定で有効) | Bing Copilotには公式確認済みで有効。ChatGPT SearchはBing経由で間接影響の可能性あり 「AI引用の直接レバー」としては因果データが存在しない(Ahrefs 2026年) |
| ドメインオーソリティ(DA)単独 | 弱(AI引用には相関低下) | DA単独ではAI引用の4%未満しか説明できない(BrightEdge 2026年2月、863,000KW分析)[9] AI Overview引用の47%がGoogle検索5位以下のページから(Wellows 2026年) |
スコープの正確な理解
| 問い | Ahrefs調査の回答 | 補足 |
|---|---|---|
| AI引用済みページへのスキーマ追加で引用が増えるか | 効果なし(実証) | DiD分析で因果的に否定。Search Atlasの相関研究とも一致 |
| AI未引用ページへのスキーマで引用獲得できるか | 不明(調査対象外) | Ahrefs自身も「別の問い」と明示。別スタディが必要 |
| Bing Copilotへの影響はあるか | 別途確認必要 | Ahrefsはこの調査で計測しておらず、Bingは公式に有効と言明 |
| RAG直接取得時にJSON-LDは処理されるか | 無視される(searchVIU) | 5システム全てで可視HTML以外は抽出されず |
| インデックスフェーズでスキーマは使われるか | 不明(未検証領域) | BingはPhase 2での活用を言明。Google・Perplexityは公開情報なし |
| リッチリザルト獲得にスキーマは効くか | 別問題(従来SEO) | 今回の調査対象外。リッチリザルトへの効果は引き続き有効 |
コンサルタントとして取るべきスタンス
クライアントコミュニケーション
- 「スキーマを実装するとAI引用が増える」という訴求は因果データが存在しない。現時点では根拠として使えない
- 「スキーマ=AEO・LLMO強化策の主軸」というポジショニングは過剰評価のリスクあり。提案での前面使用を避ける
- 業界で流通する「44%向上」「2.3倍」といった数字は一次ソースを確認できないもの。引用は控える
- スキーマはテクニカルSEO衛生管理として維持・管理する価値がある(リッチリザルト・将来変化への備え)
- Organization・Article等の基本スキーマはBing Copilot向けに有効。ChatGPT Search経由の間接効果も論理的に存在する
- AI引用獲得にはコンテンツのE-E-A-T・被リンク・獲得メディア・ブランドメンションが実証された主要シグナル
- 「スキーマに意味はない」と過剰に振れるのも誤り。調査の限界を踏まえた慎重な表現が重要
- Google・Bing・OpenAIがスキーマの扱いを変更する可能性はあるため、情報のアップデートを継続すること
施策優先度(AI引用獲得の文脈)
| 施策カテゴリ | AI引用への効果 | 推奨優先度 |
|---|---|---|
| コンテンツのE-E-A-T品質向上・著者権威の確立 | 高(実証済み) | 最優先 |
| 被リンク獲得・参照ドメイン数の拡大 | 高(複数研究一致) | 最優先 |
| PR・外部メディア露出・ブランドメンション獲得 | 高(Ahrefsで被リンクより相関高) | 最優先 |
| レビューサイト(Trustpilot等)への掲載 | 中 | 推奨 |
| Organization・Article等の基本スキーマ維持 | 低〜中(Bing向けに有効) | 推奨(衛生管理として) |
| スキーマの網羅的拡充(マイナー型の追加等) | 効果不明(過投資リスク) | 低優先 |
