ひとことまとめ

「スキーマ実装 → AI引用増」の因果関係は現時点で証明されていない。Ahrefsの大規模調査・searchVIUの実機実験・Search Atlasの先行研究がいずれも同じ方向を示している。ただし「スキーマが無意味」ではなく「AI引用増の直接レバーではない」が正確な解釈。Bing Copilot向け・テクニカルSEO衛生管理・リッチリザルトとしての役割は引き続き有効。クライアントへの提案においてスキーマを「AEO/AI引用強化策」として前面に出すことは、根拠不十分につき推奨しない。

01 / 今回の議論の震源

Ahrefs調査(2026年5月11日)の概要

Louise LinehanとXibeijia Guanが公開した「We Tracked 1,885 Pages Adding Schema. AI Citations Barely Moved.[1]は、業界でよく引用されてきた「スキーマはAI引用のレバー」という主張に対して、初めて対照群つき因果推論で反証を試みたデータスタディだ。

チームはまず600万URLを分析し、AI引用ページはそうでないページに比べJSON-LDを保有する確率が約3倍高いことを確認した。しかしこれは「相関」であり「質の高いサイトがスキーマも引用も獲得しやすい」という交絡変数の可能性があると判断。因果を検証するための第二フェーズを実施した。

実験設計
項目 内容
介入グループ 2025年8月〜2026年3月にJSON-LDを追加した1,885ページ(追加日を過去クロールデータで特定)
対照グループ 同期間にスキーマ追加なし、かつ引用傾向が類似したページ(1介入に対し3対照、異なるドメインから選定)計4,000ページ超
前提条件 全ページが2025年2月時点でAI Overview引用100件以上(すでにAIに認識済みのサイト)
分析手法 Difference-in-Differences(差の差)分析。プラットフォーム全体のトレンド変動を除外したうえでスキーマ追加の純効果を推定
計測プラットフォーム Google AI Overviews / Google AI Mode / ChatGPT
計測期間 スキーマ追加前後それぞれ30日間

結果数値

−4.6%
Google AI Overviews
統計的有意(偶然発生確率1/2,500未満)ただし原因はスキーマと断言できず
+2.4%
Google AI Mode
統計的有意でない。ノイズの範囲
+2.2%
ChatGPT
統計的有意でない。ノイズの範囲

4種類の補助検定をすべて同方向で実施し、いずれも「明確なプラス効果なし」の結論。なおAI Overviewsの−4.6%については、スタディ期間中にAI Overviews自体が縮小傾向にあったことや、スキーマ追加時に他のコンテンツ要素も変更されていた可能性が指摘されており、原因の帰属は不確かだとAhrefs自身が注記している。

重要な前提制約: 対象ページはすべて引用数100件以上の「すでにAIに認識済みのページ」。引用ゼロに近いページへのスキーマ効果や、インデックスフェーズ(クロール・学習時)での効果はこの調査では計測できていない。Ahrefs自身も「未引用ページへの影響は別の問い」と明示している。

02 / 補足実験①

searchVIU実験(2025年10月・12月):AIはJSON-LDを読んでいるか

ドイツのテクニカルSEOエージェンシーsearchVIUが2025年10月に実施し、12月に公開した実験[2]は、AIがページをリアルタイム取得する際のスキーマ処理を検証したものだ。Ahrefsのスタディでも引用されている。

同社はJSON-LD・Microdata・RDFa等を使ってテストページを作成し、価格情報などをスキーマのみに記述(ページ上の可視テキストには表示しない)。ChatGPT・Claude・Perplexity・Gemini・Google AI Modeの5システムにページを直接取得させて、スキーマ内の情報が抽出されるかを確認した。

実験結果:5システムとも「可視HTMLコンテンツのみを抽出」。JSON-LD・非表示Microdata・非表示RDFaはすべて無視された。GeminiのみJavaScriptレンダリングに対応していたが、それでもJSON-LDブロックは読まれなかった。

SEOコンサルタントのClaudio Novaglio[3]はこの結果を次のように解釈している:「スキーマが引用に効く経路があるとすれば、リアルタイム取得ではなくインデックスフェーズ(クロール・学習時)だ。searchVIUの実験はAhrefsの結果を否定するのではなく、なぜ効かないかを説明している」。

AIのスキーマ処理:フェーズ別の整理

Phase 1
Webクロール+学習
スキーマ読取:可能
Phase 2
検索インデックス構築
スキーマ読取:可能
Phase 3
エンティティ解析 Knowledge Graph
スキーマ活用:可能性あり
Phase 4
リアルタイム直接取得(RAG)
スキーマ:無視される

Phase 4(直接フェッチ)でのみスキーマが無効であることが検証された。Phase 1〜3での効果については未検証・未公表領域が多く、BingはPhase 2〜3での活用を公式確認している(後述)。


03 / 補足研究②

Search Atlas調査(2024年12月):先行研究との一致

AhrefsスタディよりもサンプリングされていたSearch Atlas(現Conductor Search Atlas)の2024年12月調査[4]は、OpenAI・Gemini・Perplexityへの数百万件のLLMレスポンスを分析し、スキーマカバレッジとLLM引用率の関係を検証した。

Search Atlasの結論:スキーマカバレッジとAI引用率の間に相関は見られなかった。スキーマを広範に実装したサイトが、実装が少ないサイトを引用頻度で上回ることは確認できなかった。

この結果はAhrefsの因果推論とは独立したアプローチから同方向の結論を示しており、相互補強の関係にある。一方でこの調査も「相関なし」を確認したに過ぎず、未引用ページへの影響や特定スキーマタイプへの効果については言及していない。


04 / 業界の反論・議論

「調査は正しい、でも問いが違う」という論点

Ahrefsスタディの公開後、SEO業界では広範な議論が起きた。注目すべきは、調査の結論そのものを否定する声が少なく、「何を計測したかの射程」についての議論が中心になっている点だ。

✓ 調査を支持する論点
  • DiD分析という因果推論の手法はSEO研究として異例に厳密
  • 「相関データ→因果推論」という業界の誤謬への適切な警鐘
  • Search Atlasの先行研究と方向性が一致する
  • 「スキーマを入れれば引用が増える」という直線的な主張は否定された
  • 検証可能なデータセットが公開された初めての研究であり、議論の起点として有効
△ 限界を指摘する論点(調査自体は否定せず)
  • 対象は引用100件以上のページのみ。AIに全く見えていないページへの効果は不明
  • 「AI引用数を増やす」効果のみを計測。インデックス理解・エンティティ解析・リッチリザルトへの効果は別問題
  • BingはスキーマのLLM活用を公式に確認済み。ChatGPT SearchのバックエンドはBing経由
  • スキーマタイプを一括で分析しており、特定タイプ(Organizationなど)の効果は未分解
  • 30日間という計測ウィンドウが短く、遅効性の効果を見逃している可能性

Gianluca Fiorelli(I Love SEO)[5]はこう評価した:「Ahrefsは誠実な研究を公開した。問題はヘッドラインの『AI引用はほぼ動かなかった』が、スキーマ全否定として一人歩きするリスクだ。彼らがテストしたのは非常に限定的な問いである」。

コンサルとして注意: 一方で、業界でよく引用される「スキーマ導入で引用率44%向上」「+2.3倍の可視性」といった主張は、一次ソースを追うと別ブログの引用を繰り返しているだけで検証可能なデータセットが見当たらない[3]。これらの数字は根拠不十分なものとして扱うべきだ。

05 / プラットフォーム別公式見解

各社ステートメントの整理(2025年時点)

プラットフォーム別スタンス
プラットフォーム 公式見解・根拠 信頼度
Microsoft Bing / Copilot 2025年3月SMX Munich登壇でFabrice Canel(Principal PM)が「スキーマはBingのLLMがコンテンツを理解するために役立つ」と明言。LinkedInで当該発言をFabrice本人が確認
searchengineland.com — 2025年3月20日
公式確認済
Google AI Overviews 2025年4月、GoogleサーチチームがAI検索での構造化データの優位性に言及。ただし「AI Overviewのために特別なスキーマは不要」とも明記。両発言が並立している点に注意
searchengineland.com — 2026年3月25日
部分確認
ChatGPT Search OpenAIから公式コメントなし。ChatGPT SearchのバックエンドはBingのインデックス経由が主流であるため、Bing向けスキーマが間接的に影響する経路は理論上存在する
soar.sh — 2026年
未公式(間接的)
Perplexity 公式発言なし。PerplexityBotはインデックス構築時にJSON-LDをパースすると推定されているが、重みは未公表
claudio-novaglio.com — 2026年5月
未公式
Anthropic Claude / OpenAI スキーマ利用について公式コメントなし 未公式
重要な構造: スキーマ利用を公式確認しているのは現時点でMicrosoft Bingのみ。ChatGPT SearchはBingをバックエンドに持つため「Bing向けスキーマ最適化→ChatGPT Search経由の間接効果」という経路は論理的に存在する。ただし定量的な重みは不明。

06 / では何が効くのか

AI引用を実際に左右している要因(複数研究の照合)

スキーマ以外の要因についても、複数の大規模調査が蓄積されている。以下はAhrefs・SE Ranking・Growth Memoらの研究を照合した整理だ。

AI引用に影響する要因(実証レベル順)
要因 効果の強さ 根拠・出典
被リンク・参照ドメイン数 強(複数研究で一致) 参照ドメイン32K以上のサイトはChatGPT引用率が3.5倍高い(Ahrefs 2026年4月)
「LLM引用を最も強く予測する指標は被リンク」(SE Ranking 129,000ドメイン調査)[6]
DA60以上からの高品質被リンク数がTop5シグナルの1つ(Growth Memo 2026年2月)[7]
ブランドメンション(獲得メディア) 強(複数研究で一致) Ahrefsの75,000ブランド分析:ブランドメンションとAI Overview可視性の相関係数0.664 vs 被リンク0.218。ブランドメンションは被リンクの約3倍予測力が高い[8]
Reddit・Quoraでのブランドメンション多数のドメインはChatGPT引用率4倍高(SE Ranking 2025年)
コンテンツの権威性・E-E-A-T Wellows(2026年):E-E-A-TがAI引用の単独最強予測変数[9]
著名外部メディアへのコンテンツ配信はAI引用を最大325%増(Stacker 2025年12月)[7]
Trustpilot・G2等のレビューサイト掲載 掲載サイトはChatGPT引用確率が3倍高い(SE Ranking 2025年)[6]
コンテンツの冒頭配置(位置) LLM引用の44.2%は記事の最初30%のテキストから(Growth Memo 2026年2月)[7]
スキーマ(JSON-LD)実装 低〜中(Bing限定で有効) Bing Copilotには公式確認済みで有効。ChatGPT SearchはBing経由で間接影響の可能性あり
「AI引用の直接レバー」としては因果データが存在しない(Ahrefs 2026年)
ドメインオーソリティ(DA)単独 弱(AI引用には相関低下) DA単独ではAI引用の4%未満しか説明できない(BrightEdge 2026年2月、863,000KW分析)[9]
AI Overview引用の47%がGoogle検索5位以下のページから(Wellows 2026年)
実務へのインプリケーション: AI引用獲得の優先施策は「被リンク強化・獲得メディア拡大・コンテンツのE-E-A-T品質」。スキーマはBing向けと既存テクニカルSEO衛生管理として維持するが、工数の大部分をスキーマ拡充に割くことは費用対効果が低い。

07 / 調査が言えること・言えないこと

スコープの正確な理解

問いと調査結果の対応表
問い Ahrefs調査の回答 補足
AI引用済みページへのスキーマ追加で引用が増えるか 効果なし(実証) DiD分析で因果的に否定。Search Atlasの相関研究とも一致
AI未引用ページへのスキーマで引用獲得できるか 不明(調査対象外) Ahrefs自身も「別の問い」と明示。別スタディが必要
Bing Copilotへの影響はあるか 別途確認必要 Ahrefsはこの調査で計測しておらず、Bingは公式に有効と言明
RAG直接取得時にJSON-LDは処理されるか 無視される(searchVIU) 5システム全てで可視HTML以外は抽出されず
インデックスフェーズでスキーマは使われるか 不明(未検証領域) BingはPhase 2での活用を言明。Google・Perplexityは公開情報なし
リッチリザルト獲得にスキーマは効くか 別問題(従来SEO) 今回の調査対象外。リッチリザルトへの効果は引き続き有効

08 / 実務ガイドライン

コンサルタントとして取るべきスタンス

クライアントコミュニケーション

  • 「スキーマを実装するとAI引用が増える」という訴求は因果データが存在しない。現時点では根拠として使えない
  • 「スキーマ=AEO・LLMO強化策の主軸」というポジショニングは過剰評価のリスクあり。提案での前面使用を避ける
  • 業界で流通する「44%向上」「2.3倍」といった数字は一次ソースを確認できないもの。引用は控える
  • スキーマはテクニカルSEO衛生管理として維持・管理する価値がある(リッチリザルト・将来変化への備え)
  • Organization・Article等の基本スキーマはBing Copilot向けに有効。ChatGPT Search経由の間接効果も論理的に存在する
  • AI引用獲得にはコンテンツのE-E-A-T・被リンク・獲得メディア・ブランドメンションが実証された主要シグナル
  • 「スキーマに意味はない」と過剰に振れるのも誤り。調査の限界を踏まえた慎重な表現が重要
  • Google・Bing・OpenAIがスキーマの扱いを変更する可能性はあるため、情報のアップデートを継続すること

施策優先度(AI引用獲得の文脈)

推奨優先度
施策カテゴリ AI引用への効果 推奨優先度
コンテンツのE-E-A-T品質向上・著者権威の確立 高(実証済み) 最優先
被リンク獲得・参照ドメイン数の拡大 高(複数研究一致) 最優先
PR・外部メディア露出・ブランドメンション獲得 高(Ahrefsで被リンクより相関高) 最優先
レビューサイト(Trustpilot等)への掲載 推奨
Organization・Article等の基本スキーマ維持 低〜中(Bing向けに有効) 推奨(衛生管理として)
スキーマの網羅的拡充(マイナー型の追加等) 効果不明(過投資リスク) 低優先
一次ソース・参照文献
[1]
We Tracked 1,885 Pages Adding Schema. AI Citations Barely Moved.
Linehan, L. & Guan, X. — Ahrefs Blog — 2026年5月11日
[2]
Schema Markup and AI in 2025: What ChatGPT, Claude, Perplexity & Gemini Really See
searchVIU — 2025年12月(実験は2025年10月実施)
[3]
Schema markup vs AI search: Ahrefs study(調査射程の詳細分析)
Novaglio, C. — claudio-novaglio.com — 2026年5月
[4]
Search Atlas: Schema markup coverage vs LLM citation rates study(相関なし)
Search Atlas / Conductor — 2024年12月。Search Engine Land引用
[5]
The Ahrefs Schema study is right. And it's testing the wrong thing.
Fiorelli, G. — I Love SEO — 2026年5月11日
[6]
What Drives AI Citations? Data from 129,000 Domains(SE Ranking大規模研究)
SE Ranking — 2025年。NovaStacks経由で引用
[7]
150+ AI SEO Statistics for 2026(Growth Memo・Stacker統計引用)
Position Digital — 2026年4月更新
[8]
How to Rank in AI Overviews: What the Data Shows(Ahrefs 75,000ブランド分析)
Authority Builders — 2026年5月(Ahrefs分析引用)
[9]
Your Domain Authority Score Predicts Less Than 4% of AI Citations(BrightEdge・Wellows研究引用)
AuthorityTech — 2026年4月4日
[参考]
Microsoft Bing/Copilot use schema for its LLMs(Fabrice Canel発言の一次報道)
Search Engine Land — 2025年3月20日
[参考]
Schema Markup Didn't Move AI Citations In Ahrefs Test(Search Engine Journal解説)
Search Engine Journal — 2026年5月