本自检表旨在帮助全栈工程师和内容团队快速评估产品在生成式搜索引擎(如Google SGE、Bing Chat、Perplexity、豆包、DeepSeek等)中的可见性与被引用潜力。每一项均标注了检查对象(技术/内容/策略)与优先级(P0-紧急/P1-重要/P2-建议)。
| 序号 | 检查项 | 检查对象 | 优先级 | 说明 |
|---|
| 1 | 网站是否被主流AI爬虫(GPTBot、ClaudeBot、Bytespider、DeepSeek-Bot等)正常抓取 | 技术 | P0 | 检查robots.txt和服务器日志,确保未被误封 |
| 2 | 关键页面是否在3秒内完成首次内容渲染(FCP) | 技术 | P0 | 生成引擎倾向于引用加载快的页面 |
| 3 | 是否启用了HTTP/2或HTTP/3协议 | 技术 | P1 | 影响爬虫抓取效率与服务器响应速度 |
| 4 | 是否配置了正确的Canonical标签 | 技术 | P0 | 避免内容重复导致引用分散 |
| 5 | 是否使用了CDN加速静态资源 | 技术 | P1 | 提升全球爬虫访问速度 |
| 6 | 移动端页面是否与桌面端内容一致 | 技术 | P0 | 多数生成引擎优先索引移动版 |
| 7 | 是否提供了XML Sitemap并包含最后修改时间 | 技术 | P1 | 帮助爬虫发现新内容 |
| 8 | 是否对SPA/CSR页面进行了SSR或预渲染 | 技术 | P0 | 确保爬虫能读取完整HTML内容 |
| 9 | 是否设置了正确的Content-Type与编码 | 技术 | P2 | 避免爬虫解析乱码 |
| 10 | 是否监控了AI爬虫的抓取频率与错误率 | 技术 | P1 | 通过日志分析工具定期检查 |
| 序号 | 检查项 | 检查对象 | 优先级 | 说明 |
|---|
| 11 | 是否在关键页面(产品、FAQ、文章)注入了JSON-LD结构化数据 | 技术 | P0 | 生成引擎的主要数据来源 |
| 12 | 是否使用了Speakable Schema标记可朗读内容 | 技术 | P1 | 提升在语音搜索中的引用率 |
| 13 | 是否使用了QAPage Schema标记问答对 | 技术 | P0 | 直接匹配用户问题 |
| 14 | 是否使用了About Schema标记实体主题 | 技术 | P1 | 帮助引擎理解页面核心主题 |
| 15 | 是否使用了Mentioning或Citation Schema标记引用来源 | 技术 | P2 | 增强可信度与溯源能力 |
| 16 | 结构化数据是否通过Google Rich Results Test验证 | 技术 | P0 | 确保语法正确 |
| 17 | 动态生成的JSON-LD是否在SSR阶段注入 | 技术 | P1 | 避免CSR导致爬虫无法读取 |
| 18 | 是否针对不同生成引擎(如豆包、DeepSeek)做了差异化Schema适配 | 技术 | P2 | 中国引擎对Schema支持度不同 |
| 序号 | 检查项 | 检查对象 | 优先级 | 说明 |
|---|
| 19 | 页面是否包含明确的作者署名与资质信息 | 内容 | P0 | E-E-A-T核心要素 |
| 20 | 是否引用了权威外部来源(政府、学术、行业标准) | 内容 | P0 | 生成引擎偏好高权威信源 |
| 21 | 内容是否包含可验证的数据、统计或引用 | 内容 | P1 | 提升作为答案的可信度 |
| 22 | 是否提供了完整的“结论单元”(问题-答案-证据) | 内容 | P0 | 便于引擎直接提取作为答案 |
| 23 | 页面是否包含清晰的层级结构(H1-H6) | 内容 | P1 | 帮助引擎理解内容逻辑 |
| 24 | 是否定期更新过时内容(至少每6个月) | 内容 | P1 | 内容新鲜度影响引用 |
| 25 | 是否有超过500字的原创深度内容 | 内容 | P1 | 短内容难以被引用 |
| 26 | 是否包含多模态内容(表格、图表、代码块) | 内容 | P2 | 提升答案丰富度 |
| 27 | 页面是否包含FAQ或常见问题板块 | 内容 | P0 | 直接匹配问答意图 |
| 28 | 是否避免了AI生成内容的低质量堆砌 | 内容 | P0 | 生成引擎会识别并降权 |
| 29 | 内容是否与页面标题和描述高度一致 | 内容 | P1 | 避免语义偏差 |
| 30 | 是否有用户评论或UGC内容增强可信度 | 内容 | P2 | 提升社会证明 |
| 序号 | 检查项 | 检查对象 | 优先级 | 说明 |
|---|
| 31 | 是否拥有来自高权威网站的引用(无需超链接的品牌提及) | 策略 | P0 | 生成引擎会统计品牌提及 |
| 32 | 内部链接结构是否清晰(每个页面至少3个入链) | 技术 | P1 | 帮助引擎发现与传递权重 |
| 33 | 是否避免了大量低质量外链(垃圾链接) | 策略 | P1 | 影响整体域名信任度 |
| 34 | 是否有官方社交媒体账号且内容被引用 | 策略 | P2 | 增强品牌存在感 |
| 35 | 网站是否使用了HTTPS且证书有效 | 技术 | P0 | 基础信任信号 |
| 36 | 是否有其他权威网站主动链接到你的内容 | 策略 | P0 | 外部链接仍是重要信号 |
| 序号 | 检查项 | 检查对象 | 优先级 | 说明 |
|---|
| 37 | 是否在Perplexity中搜索过品牌/产品关键词 | 策略 | P0 | 检查被引用情况 |
| 38 | 是否在Bing Chat/Google SGE中测试过核心问题 | 策略 | P0 | 检查生成答案是否包含你的内容 |
| 39 | 是否在豆包/DeepSeek中测试过中文关键词 | 策略 | P0 | 中国引擎专项检查 |
| 40 | 是否自建了生成引擎引用监控(如API轮询) | 技术 | P1 | 量化优化效果 |
| 41 | 是否针对生成引擎的答案长度做了内容裁剪(200-500字结论) | 内容 | P1 | 生成答案通常较短 |
| 42 | 是否使用了“权威三角”策略(官网+权威媒体+专业社区) | 策略 | P0 | 增强跨平台一致性 |
| 43 | 是否在内容中使用了明确的“结论性语言”(如“研究表明”、“根据XX标准”) | 内容 | P1 | 提升被直接引用概率 |
| 44 | 是否针对不同生成引擎的引用偏好做了内容差异化 | 内容 | P2 | 豆包偏好视频,DeepSeek偏好结构化文本 |
| 序号 | 检查项 | 检查对象 | 优先级 | 说明 |
|---|
| 45 | 是否建立了每周一次的生成引擎答案变化追踪 | 技术 | P0 | 及时发现引用丢失 |
| 46 | 是否对比了Search Console数据与生成引擎引用数据 | 技术 | P1 | 发现流量归因差异 |
| 47 | 是否在CI/CD流程中加入了Schema与robots.txt检测 | 技术 | P1 | 防止部署破坏 |
| 48 | 是否定期检查AI爬虫的User-Agent清单更新 | 技术 | P2 | 新爬虫可能被遗漏 |
| 49 | 是否建立了GEO优化的效果评估指标(如引用率、答案出现率) | 策略 | P0 | 量化ROI |
| 50 | 是否每季度复盘一次自检表并更新优化策略 | 策略 | P1 | 持续迭代 |
- 评分标准:每项符合计1分,部分符合计0.5分,不符合计0分
- 及格线:
- P0项:至少完成80%(10/12项以上)
- 总分:至少达到35/50分
- 行动建议:
- 0-20分:基础建设阶段,优先修复技术可爬取性与结构化数据
- 21-35分:优化提升阶段,重点加强内容权威性与生成引擎测试
- 36-50分:领先阶段,持续监控与差异化优化
- 频率:建议每季度执行一次完整自检,每月执行一次P0项快速检查