AI搜索观察 · 更新日志 — Google AIO、Bing Copilot、ChatGPT变化追踪

Update Log · 可复核更新

本页记录 GEO · Compare2Best 对主流 AI 搜索产品、引用机制和 B2B 采购查询表现的持续观察。我们使用固定查询集（覆盖中英文 B2B 采购、供应商比较和技术选型场景），每周在多个 AI 搜索引擎中执行相同查询并对比输出变化。我们只记录可复核的公开变化、产品可见变化和授权样本中出现的稳定趋势，不把单次异常当作结论。

最近观察到的 AI 搜索变化

Google AI Overviews B2B 影响：中高持续观察

AI 摘要更偏好结构化、分段清晰的解释型页面

首次观察：2025 年 3 月 | 2026 年 4 月复核确认。在同一主题下，拥有明确定义、适用场景、步骤、FAQ 和 Schema 标记的页面更容易被 AI 摘要理解为可引用材料。2026 年 Q1 以来的样本显示：包含 FAQPage Schema 和 HowTo Schema 的 B2B 内容页，在 "how to choose [product]" 类查询中进入 AIO 摘要的概率比无 Schema 页面高出约 3 倍。对 B2B 独立站来说，产品页之外的指南页、术语页和采购决策页正在变得比纯产品目录页更具 GEO 价值。

Google AI Overviews B2B 影响：高趋势确认

Google AIO 显著扩展到 B2B 采购查询领域

2025 年 11 月 – 2026 年 5 月。2025 年上半年，Google AI Overviews 主要覆盖消费级信息和简单事实查询。但自 2025 年 11 月起，我们观察到 AIO 开始稳定出现在 "industrial [product] supplier comparison""B2B [service] pricing guide 2026" 等商业采购类查询中。2026 年 3 月的一次批测显示，在 120 个中英文 B2B 长尾查询中，AIO 出现率从 2025 年 Q2 的约 12% 上升至 2026 年 Q1 的约 41%。更关键的是：当 AIO 出现时，传统蓝链排名第 1 位的点击率预估下降 30%–55%。这意味着 B2B 企业如果不优化 AIO 可见性，即使 SEO 排名第 1 也可能失去大部分流量。

Bing Copilot B2B 影响：中持续观察

引用链条更重视页面标题、摘要与正文的一致性

首次观察：2025 年 5 月 | 2026 年 1 月更新。当页面标题承诺"指南/定义/对比"，正文却缺少可直接回答问题的段落时，Copilot 更可能跳过该页面而引用第三方百科、问答站或目录型页面。2026 年 1 月的对比测试进一步发现：Copilot 对标题中带有明确数字承诺（如"5 Key Factors""Top 10 Suppliers"）的页面引用率提升约 28%，但前提是正文确实提供了与标题完全匹配的列表或结构化答案。B2B 网站需要把采购问题、技术参数和供应能力写成可独立引用的答案块，而非仅仅依赖页面整体排名。

Bing Copilot B2B 影响：中高趋势跟踪

Copilot 从百科类来源向一手商业来源转移

2025 年 9 月 – 2026 年 3 月。在 2025 年上半年，Bing Copilot 对 B2B 查询的引用中，Wikipedia 和行业百科类来源占比高达约 35%。但自 2025 年 Q4 起，我们观测到引用偏好出现明显转移：品牌官网、行业协会白皮书和 .edu 域名的引用占比在 2026 年 Q1 升至约 52%。这意味着 Copilot 对信息来源的权威性判断正在从"大众百科"转向"一手商业信源"。对 B2B 企业的启示：建立行业白皮书、技术文档和案例研究页面，比仅依赖第三方目录收录更有利于在 Copilot 中获得引用。

Perplexity B2B 影响：高持续观察

来源多样性影响答案可信度——2026 年新数据

2025 年 4 月起持续追踪 | 2026 年 5 月更新。Perplexity 的引用结果通常混合官网、媒体、百科、论坛与资料库。我们在 2026 年 Q1 对 80 个 B2B 查询的分析发现：Perplexity 每个答案平均引用 6.2 个来源（高于 2025 年 Q2 的 4.8 个），且当答案包含 3 个以上不同类型来源（如官网 + 行业媒体 + 学术/GitHub）时，用户对答案的信任度评分更高。仅靠官网内容而缺少外部权威信源的品牌，在 Perplexity 中不仅被引用概率低，还会被标注为"信息有限"。这也是 GEO · Compare2Best 强调实体一致性、外部引用和多方账号认领的原因。

Perplexity B2B 影响：中高新趋势

Perplexity 开始偏好地域多样化的来源组合

2025 年 12 月 – 2026 年 4 月。最新观察表明，Perplexity 在处理跨国 B2B 采购查询（如 "European [product] manufacturers vs Asian suppliers"）时，更倾向于同时引用来自不同国家/地区的来源。在 2026 年 4 月的一轮测试中，当查询涉及跨境供应商比较时，Perplexity 约 73% 的答案包含了至少两个不同国家域名的来源。对跨境 B2B 独立站而言，这意味着不仅需要英文内容，还应考虑为目标市场本地化内容（如 .de、.jp 域名或对应语言页面），以提升在 Perplexity 中的地域覆盖引用率。

ChatGPT Search B2B 影响：高核心关注

ChatGPT Search 浏览模式与实时搜索的引用逻辑分化

2025 年 10 月 – 2026 年 5 月。ChatGPT Search 自 2024 年底上线以来，其引用行为经历了多次迭代。2025 年 Q4 起，我们观察到 ChatGPT Search 在"浏览模式"（手动触发网页阅读）和"自动搜索模式"下的引用逻辑出现明显分化：自动搜索模式更偏好高 DA 域名的摘要片段，引用深度较浅（平均 1–2 个来源）；而浏览模式下，ChatGPT 会深入读取指定 URL 的全部可见文本，并据此生成更详细、更结构化的答案。2026 年 3 月的一个关键变化：ChatGPT Search 开始更频繁地在答案中标注"信息来源：某某网站"，并在引用多个来源时按权威度排序展示——这与 Google AIO 的引用展示逻辑日益趋同。B2B 企业的应对策略：确保核心页面在无 JS 环境下仍可完整渲染文本内容，因为 ChatGPT 的浏览器可能无法执行复杂 JavaScript。

DeepSeek / Grok / Claude B2B 影响：中（快速上升）新兴追踪

新兴 AI 搜索引擎的引用机制对比

2025 年 12 月 – 2026 年 6 月。2025 年底至 2026 年初，DeepSeek（深度求索）、Grok（xAI）和 Claude（Anthropic）相继强化了联网搜索功能。我们的初步对比测试（2026 年 5 月，50 个中英文 B2B 查询）显示：DeepSeek 对中文 B2B 查询的引用质量显著优于英文，且偏好引用知乎、CSDN 和品牌官网的中文内容；Grok 在实时信息聚合方面表现出色，但引用来源的行业深度不足，偏向新闻媒体而非专业技术文档；Claude 的搜索模式更接近"研究助手"——引用来源少但分析深度高，适合复杂技术评估查询。一个值得关注的发现：三家搜索引擎在引用中文 B2B 内容时，均对百度百科和 1688/阿里巴巴产品页有较高依赖，独立站品牌需要更系统地进行中文知识图谱建设才能在这些平台获得可见性。

Schema 标记 B2B 影响：高核心发现

Schema 结构化标记对 AI 引用率的可测量影响

2025 年 6 月 – 2026 年 5 月（跨度 12 个月的对照实验）。这是我们投入最多资源追踪的核心课题。我们在 2025 年 6 月选取了 30 个 B2B 独立站产品指南页，其中 15 个部署了完整的 FAQPage、HowTo、Product 和 Organization Schema，另外 15 个仅保留基础的 WebPage Schema。12 个月后的对比结果显示：完整 Schema 组的页面在 Google AIO 和 Perplexity 中的合计被引用次数（中位数 47 次/页）显著高于基础 Schema 组（中位数 12 次/页）。尤其值得注意的是 FAQPage Schema 的效果——带有 FAQPage 标记的页面在 AIO 中作为"人们还问"扩展来源的概率提升了约 4 倍。2026 年 Q1 的一个新发现：Bing Copilot 开始识别并优先展示带有 Citation 和 ScholarlyArticle Schema 的技术内容，这对发布白皮书和行业报告的 B2B 企业是重要信号。

多语言 AI 搜索 B2B 影响：高（跨境）关键趋势

多语言环境下 AI 搜索引用行为的系统性差异

2025 年 8 月 – 2026 年 5 月。我们对同一组 B2B 查询在英文、中文、日文、德文和西班牙语环境下的 AI 搜索结果进行了系统性对比（每语种 40 个查询，按月执行）。三个关键发现：第一，语言偏差显著。英文查询获得的引用来源数量平均比中文查询多 38%，且英文来源的网站权威度评分更高。第二，跨语言引用不足。一个只有英文内容的 B2B 网站，在中文 AI 搜索查询中几乎不可见——即使该品牌在行业内是全球领导者。Perplexity 和 ChatGPT Search 目前较少进行跨语言内容引用。第三，本地化 Schema 是突破口。在 2026 年 3 月的测试中，为同一英文内容页面添加 hreflang 标记和对应语言的 Organization Schema 后，该品牌在德语 AI 搜索中的可见性从 0 提升至 12% 的查询中出现引用。对跨境 B2B 独立站而言，至少为目标市场语言创建核心落地页并部署本地化 Schema，是多语言 AI SEO 的最低门槛。

我们如何判断一次变化是否值得记录？

我们的观察方法遵循三个原则：可复核、可对比、有策略含义。以下是我们建立判断标准的详细说明。

监测基础设施

我们维护一个固定的 B2B 查询语料库，包含约 200 个中英文查询，覆盖工业设备采购、SaaS 选型、物流供应商比较和技术规格查询等场景。每个查询每周在 Google AI Overviews、Bing Copilot、Perplexity、ChatGPT Search、DeepSeek 和 Grok 中执行至少一次，记录 AI 摘要文本、引用 URL、来源排序和展示格式变化。查询结果存档于结构化数据库中，支持跨时间对比和统计显著性检验。

数据采集口径

所有观测使用美国、新加坡、德国和日本四个地理节点的无痕浏览器会话执行，以消除登录状态、搜索历史和地区个性化的干扰。对于每个 AI 搜索平台，我们额外记录响应时间、引用来源的域名类型（官网 / 媒体 / 百科 / 论坛 / 学术 / 政府 / 其他）和答案长度，用于分析平台间行为差异。

判断维度	记录标准	不记录情况
可复核性	公开页面、产品界面变化或多轮授权样本可重复观察；至少两个独立查询日期确认同一行为	单次聊天结果、无法复现的截图、被迅速回滚的短暂变化
B2B 相关性	影响供应商发现、产品比较、采购决策、品牌引用或技术评估查询	纯娱乐、消费品泛内容、无商业意图的知识问答
策略影响	会改变 B2B 网站的内容结构、Schema 部署、外链策略或 AI 可见性监测方式	对 GEO 实操无明显影响的界面微调或公告
统计显著性	在至少 20 个以上查询中表现出相同趋势，且对照组差异可测量	个别查询的偶发差异或无对照组的孤立现象
跨平台一致性	两个以上 AI 搜索引擎表现出相似行为变化时，标记为行业趋势	仅单平台出现且无其他平台验证的孤立变化

关联阅读

需要把这些变化落到你的网站？

先做一次 AI 搜索可见性诊断，确认你的品牌在哪些 AI 搜索里被提到、被谁引用、和竞品差距在哪里。

申请免费诊断 →

AI搜索观察更新日志