GEO 技术审计清单:Schema、SSR、爬虫放行与页面可信度
技术问题会让 GEO 直接归零
很多品牌开始做 GEO 时,第一反应是写更多博客、做 Reddit、找评测媒体。这些都重要,但有一个更基础的问题经常被忽略:AI 能不能顺利读取你的官网?
如果官网关键内容依赖客户端渲染、Schema 缺失、CDN 阻挡 AI 爬虫、产品页没有稳定 URL,再多内容也很难进入 AI 的可用信源池。
技术 GEO 的目标不是讨好某一个平台,而是降低机器理解品牌的成本。
审计 1:AI 爬虫能否访问
先检查 robots.txt。很多网站无意中把重要路径屏蔽了,比如:
/blog//products//collections//docs//faq/
建议检查主流 AI 相关爬虫是否被误伤,包括 OpenAI、Perplexity、Google、Bing、Anthropic 等相关 user-agent。不要为了防采集一刀切屏蔽所有非浏览器访问。
还要检查 CDN 和 WAF。Cloudflare、Akamai、Fastly 的安全规则有时会把 AI 爬虫当成异常机器人拦截。表现是:浏览器能打开,但服务器日志里爬虫返回 403、429 或验证码页面。
最简单的检查方法:
- 在服务器日志中筛选 AI / search bot 相关 user-agent
- 看返回状态码是否稳定为 200
- 抽样检查返回内容是否是真实页面,而不是拦截页
- 确认博客、产品页、FAQ 页面都能访问
审计 2:关键内容是否服务端可见
AI 爬虫对 JavaScript 渲染的支持不一致。即使某些爬虫能渲染 JS,成本也更高、延迟更大、失败率更高。
高优先级内容应该在初始 HTML 中可见:
- 产品名称和型号
- 核心参数表
- 价格区间或购买入口
- FAQ
- 评测摘要
- 品牌介绍
- 文章正文
,关键内容全部靠前端请求接口再渲染,AI 可读性会显著下降。
对 Next.js、Nuxt、Shopify Hydrogen 等站点,优先使用 SSR、SSG 或 ISR,让核心内容进入 HTML。交互功能可以客户端渲染,但决策信息不要只存在于浏览器状态里。
审计 3:Schema 是否覆盖核心实体
至少检查 5 类结构化数据:
Organization
用于告诉 AI 你是谁。包括:
- 官方品牌名
- logo
- 官网 URL
- sameAs 社交账号
- 简洁品牌描述
- 所属行业
品牌名、官网、社媒、Amazon 店铺的写法要一致。
Product
用于告诉 AI 你卖什么。包括:
- 产品名
- SKU / 型号
- 品牌
- 图片
- 描述
- 价格或价格区间
- 评分和评论数(如果真实可见)
- 关键属性
不要把营销口号塞进 name 字段。名称应该稳定、清晰、可识别。
FAQPage
用于标注页面上可见的问答。FAQ schema 必须与页面内容一致,不要隐藏问题,不要堆砌与页面无关的问题。
Article / BlogPosting
博客文章必须有发布时间、更新时间、作者、标题、摘要、正文主体。AI 在判断内容新鲜度时会参考这些字段。
BreadcrumbList
帮助 AI 理解站点层级:品牌首页 > 分类页 > 产品页 > 文章页。
审计 4:内容是否有稳定 URL
很多电商站使用筛选参数、活动落地页、短链,导致同一产品出现多个 URL。AI 会把权重分散到多个页面,甚至无法判断哪个是官方页面。
需要做到:
- 每个产品一个 canonical URL
- 文章 URL 不频繁变化
- 下架产品保留说明页或跳转到替代产品
- 多语言页面使用 hreflang
- 避免同一篇内容在多个 URL 重复发布
稳定 URL 是信源积累的前提。
审计 5:页面是否显示新鲜度
AI 对评测、价格、参数、指南类内容非常看重新鲜度。页面上应该明确显示:
- 发布时间
- 最近更新时间
- 数据采集时间
- 价格或规格的适用时间
如果一篇文章没有日期,AI 很难判断它是否仍然可信。尤其是「best products」「comparison」「pricing」「2026 guide」类内容,必须定期更新。
审计 6:站内链接是否形成知识网络
不要把博客文章孤立发布。每篇文章应该连接到:
- 相关产品页
- 相关 FAQ
- 相关对比文章
- 相关案例或数据报告
- 品类入口页
AI 理解品牌时,会根据链接关系判断哪些页面是核心、哪些页面是补充。一个有结构的内容网络,比几十篇互相孤立的文章更容易形成品牌实体。
30 分钟快速自查
如果时间有限,先做这 6 件事:
- 打开 robots.txt,确认博客和产品路径没有被屏蔽
- 用无头请求抓取产品页,看 HTML 中是否有正文和参数
- 用结构化数据测试工具检查 Organization、Product、Article、FAQ
- 检查 10 个核心页面是否有 canonical URL
- 检查博客和产品指南是否显示发布日期 / 更新时间
- 查看服务器日志,确认搜索和 AI 爬虫返回 200
结论
GEO 的技术基建不是锦上添花,而是入场券。
内容决定 AI 是否愿意推荐你,但技术决定 AI 是否能读到、理解并信任你的内容。先把爬虫访问、服务端可见、结构化数据和稳定 URL 做对,再去放大内容和外部信源,投入产出比会高很多。