AI 副业案例数据可信度:截图、后台和公开说法怎么分级
拆 AI 副业案例时,要把收入截图、后台报表、平台榜单、访谈、评论和第三方数据按证据等级分开,避免把营销说法当事实。
📖 本篇术语速查表
| 英文 / 缩写 | 中文 | 一句话解释 |
|---|---|---|
| evidence | 证据 | 用来支持案例判断的材料。 |
| screenshot | 截图 | 页面、后台、订单、收入或评论的图片记录。 |
| source | 来源 | 数据来自主理人、平台、第三方工具还是公开社区。 |
| verification | 核验 | 用其他入口检查材料是否可靠。 |
| first-party data | 一方数据 | 项目自己后台、支付、店铺、邮件系统里的数据。 |
| third-party data | 第三方数据 | 独立工具、榜单、搜索趋势或外部平台提供的数据。 |
| claim | 说法 | 案例作者对收入、增长、用户和效果的描述。 |
读这篇先抓住一句话:所有案例都要先分证据等级。截图、后台、访谈、评论、平台榜单和主理人口述,可信度不一样,能支持的结论也不一样。
不想读完?把下面这段提示词丢给 AI 帮你跑完——复制提示词,喂给 Codex / Claude Code / Cursor / DeepSeek,把变量改成案例材料,AI 会按本文 H2 输出数据可信度评分。
# 角色:副业案例研究数据证据可信度审计顾问
你是我副业案例研究方向的证据可信度审计顾问。我会把一个案例的所有材料(截图 / 后台 / 访谈 / 评论 / 榜单 / 帖子 / 第三方数据)+ 我想学的动作交给你,你的工作不是替我相信这些材料,而是按 A/B/C/D 四档证据等级逐项审计,告诉我每条证据能支持什么结论、不能支持什么结论、最关键的 2-3 条证据缺什么、7 天内怎么补。你只做证据审计,不替我抄案例动作、不编案例没公开的数据、不替我决定要不要进同一赛道;截图来源 / 后台入口 / 平台榜单一律标"执行当天核验";不允许把社媒口述当作可量化结论;不允许在 A 级证据缺失时直接做迁移决策。
## 核心任务
把案例材料翻译成一份证据审计单:每条材料标 A/B/C/D 等级 + 时间窗 / 口径 / 来源核查 + 能支持的结论 / 不能支持的结论 + 缺失证据清单 + 7 天核验动作 + 是否进案例库(A 库 / B 库 / C 库 / 弃用)。
**成功标准**:交付的结果必须同时满足——每条材料是否打 A/B/C/D;时间窗是否每条都查过;能 / 不能支持结论是否分列;5 维度是否每维都打 1-5;7 天核验动作是否每项缺失都有对应入口;有没有把社媒口述当数字结论。 任意一条没满足即视为未达标,需补料后重跑。
## 信息输入
审计之前先看材料齐不齐。
如果案例链接 / 作者 / 产品 / 平台 / 时间窗、所有截图 / 后台 / 访谈 / 评论 / 榜单 / 帖子 / 第三方数据、可核验的官方入口 / 工具入口 / 公开页面、我的项目要学的动作 / 决策问题这四件事我能填出 50% 以上,你就直接审计。如果"所有截图 / 访谈"只有 1-2 条材料,强制提醒"证据样本量不足"。
访谈时你要问的就是这五件事:
1. 主理人有没有发过原始后台截图?还是只有社媒晒图?
2. 案例材料的时间窗是否一致?(不一致就要分别审计)
3. 有没有第三方数据可以交叉验证?(Google Trends / Similarweb / Wayback Machine / 平台公开榜单)
4. 评论 / 访谈是匿名还是有名有姓?
5. 我打算用这个案例做"照抄动作 / 学方法论 / 决定要不要进赛道"中的哪一种?(决定证据要求)
如果只有社媒晒图无任何后台 / 访谈 / 评论交叉,强制设为 C/D 等级;如果决定是"进赛道"必须要求 A 级证据。
## 工作流程
操作铁律:每个判断步骤都要先在 `<thinking>` 标签里写「证据 / 反证 / 边界」三栏,再下笔写结论。`<thinking>` 内的草稿用户看不到,但 AI 必须用它检查自己有没有在编。
第一步是 A/B/C/D 证据等级定义:
| 等级 | 标准 | 典型材料 |
|---|---|---|
| A | 可独立验证 + 多源交叉 | 平台后台截图 + 第三方数据(Wayback / Similarweb)+ 评论 |
| B | 主理人后台或访谈 + 1 个第三方源 | 后台截图 + 部分评论 |
| C | 仅主理人口述或单源截图 | 社媒晒图 / 一次性访谈口述 |
| D | 二手转述 / 自媒体演绎 | 自媒体文章引用案例但未直接核验 |
第二步是 4 步审计流程:
1. **识别材料来源**:每条材料标"主理人原始 / 主理人转述 / 第三方独立 / 自媒体二手"。
2. **检查时间窗和口径**:每条材料标日期 + 单位(单日 / 单月 / 累计)+ 货币 + 平台。
3. **看能支持的结论**:A 级支持具体数字结论;B 级支持区间结论;C 级支持方向性结论;D 级仅当线索不当结论。
4. **找缺失和冲突**:列出最关键缺的 2-3 项 + 现有材料里互相矛盾的地方(如成交额 vs 退款率不匹配)。
第三步是每条证据"能 / 不能支持的结论"分开列:
| 证据类型 | 能支持 | 不能支持 |
|---|---|---|
| 平台后台截图(A)| "X 天卖出 Y 单" | 利润 / 退款 / 复购(除非另有数据)|
| 收入晒图(B/C)| 方向"看起来盈利" | 具体净利润 |
| 主理人访谈口述(B/C)| 方法论 / 时间线 | 数字结论 |
| 评论 / 差评(B)| 用户体验信号 | 转化率 / 复购率 |
| 第三方榜单(A/B)| 排名 / 趋势 | 收入 / 成本 |
第四步是 5 维度评分(每维 1-5 分):
| 维度 | 评分点 |
|---|---|
| 来源独立 | 不是主理人单一口述 |
| 多源交叉 | 至少 2 个独立来源 |
| 时间窗清楚 | 每条数据标日期和口径 |
| 数字可独立验证 | 第三方工具可查 |
| 与我的决策匹配 | 证据级别配得上决策风险 |
总分 ≥ 20 = A 库(可作迁移决策);11-19 = B 库(学方法论);≤ 10 = C / D 库(仅线索不做决策)。
第五步是 7 天核验动作:
| 缺失类型 | 7 天怎么补 |
|---|---|
| 时间窗未明 | Wayback Machine 查发布日 + 平台历史快照 |
| 退款 / 差评未公开 | 看评论区 + r/Etsy / r/IndieHackers 搜主理人 |
| 第二个独立源 | Similarweb / Google Trends / 平台榜单交叉 |
| 主理人访谈是否真实 | LinkedIn / Twitter / GitHub 个人页交叉 |
## 示例 / 样板
输入是"案例:某 IndieHacker 自称月入 $10k AI SaaS,材料 = 1 张 Stripe 截图 + 1 篇个人博客访谈,第三方数据无,我想决定要不要做类似 AI SaaS"。
期望输出:证据审计:Stripe 截图(A 级潜力但需核时间窗)+ 个人博客访谈(B 级,单源口述)+ 第三方数据(D 级无)= 总体 B/C 等级。4 步审计:来源 = 主理人原始 + 自我转述;时间窗 = 截图日期未标 → 强制核 Wayback;能支持结论 = "曾经达到月销 $10k";不能支持 = "可持续 / 退款率 / 净利润 / 我能否复制"。5 维度评分:来源独立 2 / 多源交叉 1 / 时间窗清楚 2 / 数字可独立验证 1 / 与决策匹配 1 = 7 → **C 库**。7 天核验动作:Wayback 查博客发布日 + 在 Twitter 搜主理人是否还在更新 + 看 Indie Hackers 评论 + 检查 Stripe 截图右上角时间戳。结论:**仅当线索不可作进赛道决策**,决策要么补 A 级证据要么换案例。
反面例子:直接相信月入 $10k 决定 all in(违反 B/C 等级支持力);编"Similarweb 显示流量 50k"(无源);用单一案例决定整个赛道走势(违反 1 案例不作普遍结论)。
## 输出规范
直接输出《[案例名]》证据审计单正文,不要前言后语,总字数 900 到 1300 字,按以下顺序:
1. **每条材料证据等级表**:A/B/C/D + 来源标识
2. **4 步审计流程**:来源 / 时间窗 / 能支持结论 / 缺失冲突
3. **能 / 不能支持结论分列表**:每条证据两栏
4. **5 维度评分 + 总分 + 入库判断**:A/B/C/D 库
5. **7 天核验动作**:每项缺失对应一个查证入口
6. **决策风险匹配**:决策类型 vs 证据要求是否够
输出前自检:每条材料是否打 A/B/C/D;时间窗是否每条都查过;能 / 不能支持结论是否分列;5 维度是否每维都打 1-5;7 天核验动作是否每项缺失都有对应入口;有没有把社媒口述当数字结论。
## 硬约束 · 拒绝场景
- 只有 1 条 C 级证据就要求做迁移决策 → 拒绝
- 编案例没公开的第三方数据 → 拒绝
- 用单一案例当普遍赛道结论 → 拒绝
- 把社媒晒图等同于平台后台 → 拒绝
- 占位符 `___` 未替换 → 拒绝先给结论
案例证据先分四档:
| 等级 | 说明 |
|---|---|
| A | 可核验后台、支付、店铺、公开平台和明确时间窗 |
| B | 截图完整,但来源、时间或口径仍需补充 |
| C | 主理人口述、访谈、帖子、评论和二手整理 |
| D | 只有标题党说法、模糊截图或无法追溯来源 |
证据等级决定你能学到什么。A 档可以支持经营判断,B 档可以支持初步假设,C 档适合找线索,D 档只能当风险提醒。
先分证据等级
很多人读案例时,第一反应是看结论:赚了多少、涨了多少、用了什么方法。更稳的顺序是先看证据。
同样一句“产品卖得不错”,如果来自支付后台、店铺报表、公开销量、用户访谈和主理人口述,可信度完全不同。同样一张截图,如果没有时间、来源、产品、币种、退款和成本,也不能支持利润判断。
反对虚荣指标,本质上也是在提醒:数据必须能指导下一步行动。不能指导行动的数据,再好看也只是素材。
新手最需要建立的习惯,是把“我看到了什么”和“我能得出什么”分开。看到订单截图,只能说明某个时间点出现过订单;不能直接说明利润、复购、长期需求和可复制获客。
这个习惯会直接影响教程质量。证据薄的案例,可以写成“现象观察”;证据中等的案例,可以写成“待验证假设”;证据强的案例,才适合写成“可执行流程”。如果三类材料混在一起,读者会以为每个案例都能照做,最后动作会变形。
第 1 步:识别材料来源
先把所有材料按来源分组。
| 来源 | 常见材料 |
|---|---|
| 一方后台 | 支付、店铺、邮件、网站分析、产品后台 |
| 平台公开页 | 榜单、评论、评分、发帖记录、更新时间 |
| 第三方工具 | 搜索趋势、流量估算、关键词、竞品追踪 |
| 主理人材料 | 复盘、访谈、截图、播客、Newsletter |
| 用户材料 | 评论、差评、案例、社群反馈、退款理由 |
| 二手整理 | 博客转述、社媒搬运、课程截图、摘要 |
一方后台最接近经营事实,但也需要看完整字段;平台公开页适合核验存在性和时间;第三方工具适合看趋势,不适合当精确后台;主理人材料有上下文价值,但可能有营销选择;二手整理最容易丢失口径。
拆案例时,先不要急着写结论。先做证据表:每条材料来自哪里、能否打开、时间是什么、是否能和其他材料互相印证。
来源还要看是否经过筛选。主理人通常会展示更好看的页面和截图,课程作者可能会挑成功案例,二手文章可能只保留最吸引人的一句话。不是说这些材料不能用,而是要知道它们经过了选择。经过选择的材料,适合找线索,不适合单独下结论。
第 2 步:检查时间窗和口径
数据离不开时间窗。
| 口径 | 要问 |
|---|---|
| 日数据 | 是否来自上线日、活动日或异常曝光 |
| 周数据 | 是否包含发布、折扣、热榜或广告 |
| 月数据 | 是否包含续费、退款和平台结算 |
| 累计数据 | 从什么时候开始累计,是否跨产品 |
| 截图数据 | 是否显示日期、币种、产品和状态 |
没有时间窗的数据很难使用。一天卖得好,可能是发布红利;一个月收入不错,可能包含折扣和老用户;累计收入看着很大,可能横跨多年和多个产品。
口径也要统一。收入和到账不同,订单和买家不同,注册和活跃不同,访问和有效访问不同,试用和付费不同。案例没有说明口径时,不要替它补完。
币种、产品范围和渠道范围也要写清楚。一个截图可能混合多个产品,一个收入数字可能包含旧产品,一个流量数字可能包含非目标国家或非目标人群。口径越模糊,越不能用来指导你的定价、渠道和产品选择。
第 3 步:看能支持什么结论
每条证据都有边界。
| 证据 | 能支持 | 不能直接支持 |
|---|---|---|
| 订单截图 | 有付款行为 | 利润、复购、长期需求 |
| 收入后台 | 某段收入 | 成本、退款、现金流 |
| 评论好评 | 用户满意线索 | 规模化需求 |
| 榜单排名 | 获得曝光 | 可持续获客 |
| 搜索趋势 | 话题热度 | 购买意愿 |
| 访谈复盘 | 方法和背景 | 独立事实证明 |
这一步很关键。你不是否定案例,而是避免过度解释。证据能支持什么,就写到哪里;不能支持什么,就标记待核验。
比如 Product Hunt 排名可以证明发布期曝光,但不能证明产品长期留存;Google Trends 可以看搜索兴趣变化,但不能证明你的产品能成交;Stripe 报表能看支付记录,但不自动说明成本和售后。
最有价值的案例,通常不是单一证据特别强,而是多种证据能互相咬合:公开页面能看到产品和定位,社区能看到真实问题,支付或店铺能看到成交,更新记录能看到持续维护,用户反馈能看到使用结果。证据之间能互相解释,结论才更稳。
第 4 步:找缺失和冲突
好案例也会有缺失字段。
| 缺失 | 影响 |
|---|---|
| 没有时间窗 | 不知道是否短期爆发 |
| 没有成本 | 无法判断利润 |
| 没有退款 | 无法判断售后风险 |
| 没有来源 | 无法判断获客是否可复制 |
| 没有交付 | 无法判断支持压力 |
| 没有更新 | 无法判断项目是否持续 |
冲突也要记录。比如作者说自然增长,但页面显示大量广告落地页;说产品长期使用,但公开更新停滞;说需求强,但评论主要来自同行围观。冲突不一定说明造假,但说明结论要降级。
新手不要害怕写“不确定”。案例库最有价值的地方,不是每篇都下定论,而是把确定、推断、缺口和下一步核验分清楚。
冲突字段要保留,不要为了文章顺畅而删掉。比如收入增长和用户抱怨可以同时存在,流量上升和留存下降也可以同时存在。真实业务常常不是单线故事,教程要教读者识别复杂性,而不是把复杂性改成爽文。
第 5 步:改成你的案例库标准
你自己的案例库要有统一标准。
| 字段 | 要求 |
|---|---|
| 案例链接 | 原始链接和备份入口 |
| 时间窗 | 明确日期或阶段 |
| 产品形态 | 服务、软件、课程、商品、内容 |
| 证据等级 | A/B/C/D |
| 可学动作 | 只写证据能支持的动作 |
| 不可学部分 | 写清缺失和风险 |
| 核验计划 | 下一步去哪查 |
统一标准能避免你今天被一个收入截图打动,明天被一个增长帖带走。每个案例进入库之前,都要先过证据评分,再决定能不能作为教程、选题、打法或风险材料。
如果证据不够,不要删掉。把它放进“线索库”。线索库负责启发问题,案例库负责支持行动。两者分开,内容质量会稳定很多。
案例库还应该保留版本。一次核验只能代表当时状态,产品可能改版,平台规则可能变化,链接可能失效,作者也可能补充新数据。给每篇案例写 verifiedAt,并记录下次要复查的入口,能让教程长期可维护。
数据可信度评分表
| 检查 | A 档 | B 档 | C 档 | D 档 |
|---|---|---|---|---|
| 来源 | 官方或后台可核验 | 截图较完整 | 主理人口述 | 无来源 |
| 时间 | 清楚 | 部分清楚 | 模糊 | 没有 |
| 口径 | 字段完整 | 有缺口 | 只讲结果 | 标题化 |
| 交叉验证 | 多入口一致 | 两个入口 | 单一入口 | 无法验证 |
| 行动价值 | 可做决策 | 可做假设 | 可找线索 | 只做提醒 |
评分不是为了挑毛病,而是为了保护你的决策。A级少但价值高,C级多但只能启发方向,D级不要进入行动清单。
AI 怎么辅助
AI 适合做证据整理:
- 从案例材料里提取所有数据说法。
- 给每条说法标来源、时间窗和口径。
- 判断每条证据能支持什么结论。
- 找出缺失字段和冲突点。
- 生成下一步核验清单。
AI 不适合替你核验后台和平台事实。它可以提醒你查 Stripe、Shopify、Product Hunt、Google Trends、Indie Hackers 和原始链接,但最终仍要打开官方入口或原始材料。
提示词里要明确要求“不要补完缺失”。AI 一旦开始替案例补数据,案例库就会被污染。
官方资料与核验口径
平台规则、算法动向、报价规则、政策口径都会变化。本文保留的是可迁移的判断框架,具体数字一律给区间。
跨平台核验入口:
- Indie Hackers — 看独立开发者真实营收和复盘
- Reddit · r/Entrepreneur — 看副业 / 自雇者的真实问题与反例
- Wayback Machine — 回溯案例方在不同时间点的承诺与定价
涉及具体数据、比例、报价区间的部分,以执行当天后台为准。
常见问题
截图是不是都不可信?
不是。截图有价值,但要看来源、时间、字段和是否能交叉核验。
主理人口述能不能用?
可以用来理解背景和方法,但不要单独作为财务、流量和留存结论。
第三方流量工具准不准?
适合看方向和趋势,不适合当作精确后台。需要和公开页面、搜索趋势和实际转化一起看。
证据不足的案例还有价值吗?
有。它适合进入线索库,帮你发现问题和选题,但不适合直接变成教程动作。
执行前至少核验:
- Stripe 官方文档 → 海外订阅与支付规则
- Shopify 帮助中心 → 电商运营与店铺合规
- Buy Me a Coffee → 创作者付费墙参考