AI 可见度自查实操:5 个 prompt 模板 + 25 分评分卡
不测试 = 不知道自己在 AI 那里是什么形象
大多数品牌从来没认真测过自己在 AI 搜索里被怎么提及——直到某天某位客户 / 老板 / 同事说「我在 ChatGPT 搜了一下你们品牌,它推荐的是 XX 竞品」,才开始警觉。
这篇给你一套「3 小时能跑完、产出一份评分卡」的自查方法。不需要花钱、不需要复杂工具,5 个 prompt 模板 + 一份评分表就够。
测试前的准备
1. 列出 15-20 个核心关键词
分四类来列:
- 品类推荐型:
best portable charger 2026 - 场景型:
portable charger for travel - 对比型:
Anker vs UGREEN portable charger - 价格档型:
best portable charger under $50
ChatGPT(必测)、Perplexity(必测)、Gemini 或 Claude 二选一。Bing Copilot 可作为加测。
3. 准备评分表
用 Google Sheets 建一张表,列:「关键词 | 平台 | 是否提及 | 排名 | 语境质量 | 备注」。
5 个 Prompt 模板
每个模板都给一个示例(用充电宝品类示意)。
Template 1:品类推荐型
Prompt 框架:
Recommend the best [品类] in 2026.
示例:
Recommend the best portable chargers in 2026 for daily travel use.
测试目标:能否进入 AI 默认推荐列表(通常 5-7 个品牌)。
Template 2:场景型
Prompt 框架:
I need [品类] for [具体场景]. What do you recommend?
示例:
I'm traveling internationally for a month and need a portable charger that works on planes. What do you recommend?
测试目标:能否在细分场景下被精准推荐。场景型 prompt 比品类型 prompt 难度更高,因为 AI 会过滤掉不适合该场景的品牌。
Template 3:对比型
Prompt 框架:
Compare [品牌 A] and [品牌 B] [品类]. Which is better?
示例:
Compare Anker and UGREEN portable chargers. Which is better for everyday use?
测试目标:测自己在最直接竞品对比中的位置。如果你的品牌是 A 或 B,看 AI 给出的对比是否公允。如果你的品牌不在 A/B 中,可以测「Recommend an alternative to Anker」类反向 prompt。
Template 4:品牌直接询问型
Prompt 框架:
Tell me about [你的品牌] [品类]. Is it any good?
示例:
Tell me about ACEFAST portable chargers. Is it any good?
测试目标:AI 对你的品牌的「完整画像」是怎样的——优点、缺点、定位、目标人群。这是发现「AI 怎么定位你」的最直接方法。
Template 5:反向问题型 / 替代品型
Prompt 框架:
What are good alternatives to [某头部品牌] [品类] in 2026?
示例:
What are good alternatives to Anker portable chargers in 2026?
测试目标:测能否进入「挑战者品牌」列表。对中小品牌特别重要——这类 prompt 的搜索量高,且竞争门槛比「best of」低。
评分卡:5 维度,每维 0-5 分
每个关键词在每个平台上都按以下 5 维评分,总分 25 分。
维度 1:可见性(0-5 分)
- 0:完全没提到
- 1:勉强提到一次,无重点
- 2:作为列表后部品牌出现
- 3:作为列表中部品牌出现
- 4:作为列表前 2-3 名出现
- 5:作为首选或并列首选
- 0:负面提及(avoid / problems with)
- 1:勉强提及,无评价
- 2:中性提及(another option)
- 3:正面提及(good for...)
- 4:强推荐(recommended / reliable)
- 5:最高推荐(best for X scenario)
- 0:所有事实错误
- 1-2:多处事实错误
- 3:主要事实正确但有过时信息
- 4:信息准确,时效性 OK
- 5:信息准确且包含最新数据
- 0:AI 把你和不相关品类比
- 1-2:和品类边缘品牌比
- 3:和品类主流品牌比
- 4:和品类头部 2-3 品牌比
- 5:被列为品类头部对比对象
- 0:完全没给理由
- 1:泛泛理由
- 2-3:有几条具体特征
- 4:清晰的差异化定位
- 5:定位 + 适用人群 + 具体场景都明确
总分诊断
15 个关键词 × 3 平台 = 45 次测试,每次 25 分,满分 1,125 分。
- < 200 分(< 18%):GEO 完全没启动,AI 对你的品牌基本无认知
- 200-450 分(18-40%):有零散信源,但缺乏系统布局
- 450-700 分(40-62%):GEO 基础打好,已有稳定引用
- 700-900 分(62-80%):品类前 5 名水平
- > 900 分(> 80%):品类领先地位
- 可见性低、语境正常 → 信源数量不够,要加 Reddit / Quora
- 可见性 OK、语境差 → 有负面声量,要管理负评 + 加正向信源
- 信息准确性低 → 官网信息陈旧 / Schema 不完整
- 竞品参照偏弱 → 没有做对比内容,要加 vs 内容
- 推荐理由不具体 → 品牌定位模糊,要做差异化内容
实测频率建议
- 完整 45 次测试:每月一次
- 核心 5 个关键词 × 3 平台 = 15 次测试:每周一次
- 品牌画像测试(Template 4):每两周一次
3 个真实样本(脱敏)
样本 A:DTC 美妆,刚启动 GEO 1 个月
- 总分:187 / 1,125(17%)
- 最弱维度:可见性 1.2 / 5(基本不被提及)
- 诊断:需要先做信源数量铺设,从 Reddit 信源开始
- 总分:582 / 1,125(52%)
- 最弱维度:语境质量 2.8 / 5(中性提及多,强推少)
- 诊断:信源数量够了,需要做「为什么选我」类内容拉高语境
- 总分:812 / 1,125(72%)
- 最弱维度:竞品参照 3.1 / 5(被推荐但很少进入头部对比)
- 诊断:需要做更多直接 vs 头部品牌的对比内容
把测试变成季度复盘
每季度一次,把三个月的数据画成趋势图:
- X 轴:周
- Y 轴:总分 + 5 维度分别
总结
GEO 不能瞎做,要先测出「自己现在是什么状态」。5 个 prompt 模板 + 5 维度评分卡 + 月 / 周 / 双周三层频率,3 小时跑完一轮自查。
不测试就不知道钱花在哪有效——这套自查方法是 GEO 投入产出的基础设施,比任何工具都先做。
需要我们帮你跑一次完整的 AI 可见度自查?获取免费品牌诊断,第一次测试报告免费。