中文AI 可见度GEO 自查品牌监测

AI 可见度自查实操:5 个 prompt 模板 + 25 分评分卡

BrandLift 远界跃升··8 分钟阅读

不测试 = 不知道自己在 AI 那里是什么形象

大多数品牌从来没认真测过自己在 AI 搜索里被怎么提及——直到某天某位客户 / 老板 / 同事说「我在 ChatGPT 搜了一下你们品牌,它推荐的是 XX 竞品」,才开始警觉。

这篇给你一套「3 小时能跑完、产出一份评分卡」的自查方法。不需要花钱、不需要复杂工具,5 个 prompt 模板 + 一份评分表就够。

测试前的准备

1. 列出 15-20 个核心关键词

分四类来列:

  • 品类推荐型:best portable charger 2026
  • 场景型:portable charger for travel
  • 对比型:Anker vs UGREEN portable charger
  • 价格档型:best portable charger under $50
2. 选 3 个测试平台

ChatGPT(必测)、Perplexity(必测)、Gemini 或 Claude 二选一。Bing Copilot 可作为加测。

3. 准备评分表

用 Google Sheets 建一张表,列:「关键词 | 平台 | 是否提及 | 排名 | 语境质量 | 备注」。

5 个 Prompt 模板

每个模板都给一个示例(用充电宝品类示意)。

Template 1:品类推荐型

Prompt 框架

Recommend the best [品类] in 2026.

示例

Recommend the best portable chargers in 2026 for daily travel use.

测试目标:能否进入 AI 默认推荐列表(通常 5-7 个品牌)。

Template 2:场景型

Prompt 框架

I need [品类] for [具体场景]. What do you recommend?

示例

I'm traveling internationally for a month and need a portable charger that works on planes. What do you recommend?

测试目标:能否在细分场景下被精准推荐。场景型 prompt 比品类型 prompt 难度更高,因为 AI 会过滤掉不适合该场景的品牌。

Template 3:对比型

Prompt 框架

Compare [品牌 A] and [品牌 B] [品类]. Which is better?

示例

Compare Anker and UGREEN portable chargers. Which is better for everyday use?

测试目标:测自己在最直接竞品对比中的位置。如果你的品牌是 A 或 B,看 AI 给出的对比是否公允。如果你的品牌不在 A/B 中,可以测「Recommend an alternative to Anker」类反向 prompt。

Template 4:品牌直接询问型

Prompt 框架

Tell me about [你的品牌] [品类]. Is it any good?

示例

Tell me about ACEFAST portable chargers. Is it any good?

测试目标:AI 对你的品牌的「完整画像」是怎样的——优点、缺点、定位、目标人群。这是发现「AI 怎么定位你」的最直接方法。

Template 5:反向问题型 / 替代品型

Prompt 框架

What are good alternatives to [某头部品牌] [品类] in 2026?

示例

What are good alternatives to Anker portable chargers in 2026?

测试目标:测能否进入「挑战者品牌」列表。对中小品牌特别重要——这类 prompt 的搜索量高,且竞争门槛比「best of」低。

评分卡:5 维度,每维 0-5 分

每个关键词在每个平台上都按以下 5 维评分,总分 25 分。

维度 1:可见性(0-5 分)

  • 0:完全没提到
  • 1:勉强提到一次,无重点
  • 2:作为列表后部品牌出现
  • 3:作为列表中部品牌出现
  • 4:作为列表前 2-3 名出现
  • 5:作为首选或并列首选
维度 2:语境质量(0-5 分)
  • 0:负面提及(avoid / problems with)
  • 1:勉强提及,无评价
  • 2:中性提及(another option)
  • 3:正面提及(good for...)
  • 4:强推荐(recommended / reliable)
  • 5:最高推荐(best for X scenario)
维度 3:信息准确性(0-5 分)
  • 0:所有事实错误
  • 1-2:多处事实错误
  • 3:主要事实正确但有过时信息
  • 4:信息准确,时效性 OK
  • 5:信息准确且包含最新数据
维度 4:竞品参照(0-5 分)
  • 0:AI 把你和不相关品类比
  • 1-2:和品类边缘品牌比
  • 3:和品类主流品牌比
  • 4:和品类头部 2-3 品牌比
  • 5:被列为品类头部对比对象
维度 5:推荐理由具体性(0-5 分)
  • 0:完全没给理由
  • 1:泛泛理由
  • 2-3:有几条具体特征
  • 4:清晰的差异化定位
  • 5:定位 + 适用人群 + 具体场景都明确

总分诊断

15 个关键词 × 3 平台 = 45 次测试,每次 25 分,满分 1,125 分。

  • < 200 分(< 18%):GEO 完全没启动,AI 对你的品牌基本无认知
  • 200-450 分(18-40%):有零散信源,但缺乏系统布局
  • 450-700 分(40-62%):GEO 基础打好,已有稳定引用
  • 700-900 分(62-80%):品类前 5 名水平
  • > 900 分(> 80%):品类领先地位
按维度分别求平均,能定位「哪一维最弱」:
  • 可见性低、语境正常 → 信源数量不够,要加 Reddit / Quora
  • 可见性 OK、语境差 → 有负面声量,要管理负评 + 加正向信源
  • 信息准确性低 → 官网信息陈旧 / Schema 不完整
  • 竞品参照偏弱 → 没有做对比内容,要加 vs 内容
  • 推荐理由不具体 → 品牌定位模糊,要做差异化内容

实测频率建议

  • 完整 45 次测试:每月一次
  • 核心 5 个关键词 × 3 平台 = 15 次测试:每周一次
  • 品牌画像测试(Template 4):每两周一次
低于这个频率,跟不上 AI 的内容更新节奏;高于这个频率,是浪费时间,AI 模型不会每天变。

3 个真实样本(脱敏)

样本 A:DTC 美妆,刚启动 GEO 1 个月

  • 总分:187 / 1,125(17%)
  • 最弱维度:可见性 1.2 / 5(基本不被提及)
  • 诊断:需要先做信源数量铺设,从 Reddit 信源开始
样本 B:3C 品牌,GEO 跑了 4 个月
  • 总分:582 / 1,125(52%)
  • 最弱维度:语境质量 2.8 / 5(中性提及多,强推少)
  • 诊断:信源数量够了,需要做「为什么选我」类内容拉高语境
样本 C:户外品牌,GEO 跑了 8 个月
  • 总分:812 / 1,125(72%)
  • 最弱维度:竞品参照 3.1 / 5(被推荐但很少进入头部对比)
  • 诊断:需要做更多直接 vs 头部品牌的对比内容

把测试变成季度复盘

每季度一次,把三个月的数据画成趋势图:

  • X 轴:周
  • Y 轴:总分 + 5 维度分别
3-4 个月后能清晰看到哪些动作有用、哪些没用。这份数据放在管理层汇报里,比任何「AI 引用率」单一数字都有说服力。

总结

GEO 不能瞎做,要先测出「自己现在是什么状态」。5 个 prompt 模板 + 5 维度评分卡 + 月 / 周 / 双周三层频率,3 小时跑完一轮自查。

不测试就不知道钱花在哪有效——这套自查方法是 GEO 投入产出的基础设施,比任何工具都先做。


需要我们帮你跑一次完整的 AI 可见度自查?获取免费品牌诊断,第一次测试报告免费。

想让你的品牌也被 AI 推荐?

免费获取品牌 AI 可见性诊断报告,3 个工作日内出结果。

获取免费诊断