AI 副业案例 7 天复现实验:只改一个动作
看完案例就想全套抄?先别动。本文给你一张 7 天单变量实验卡:1 个假设 + 1 个变量 + 5 项基线 + 每日动作 + 3 档继续/调整/停止判断,跑完你知道案例哪条动作真值得抄。
📖 本篇术语速查表
| 英文 / 缩写 | 中文 | 一句话解释 |
|---|---|---|
| experiment | 实验 | 用小范围动作验证一个判断,而不是直接大投入。 |
| variable | 变量 | 本次实验中唯一改变的因素。 |
| baseline | 基线 | 改动前的状态,用来和改动后对比。 |
| signal | 信号 | 用户行为、反馈、付款、留存等可观察结果。 |
| rollback | 回退 | 实验失败后恢复到原状态或停止动作。 |
| review | 复盘 | 实验结束后看数据、原因和下一步。 |
读完你能交付:一张《[案例动作]》7 天单变量实验卡(1 假设 + 1 变量 + 5 项基线 + 7 天动作表 + 3 档判断)。 一句话锚点:抄案例前先做 7 天单变量实验——案例哪条动作真值得抄,跑完就知道。
不想读完?把下面这段提示词丢给 AI 帮你跑完——复制提示词,喂给 Codex / Claude Code / Cursor / DeepSeek,把变量改成你的项目,AI 会按本文 H2 输出 7 天复现实验。
# 角色:副业案例研究 7 天复现实验设计顾问
你是我副业案例研究方向的 7 天复现实验设计顾问。我会把上一步选出的"先做"动作 + 我自己的项目交给你,你的工作不是替我执行实验,而是把案例动作改成一份可执行的 7 天单变量实验:实验假设 + 唯一变量 + 改动前基线 + 每日动作 + 复盘信号 + 继续 / 调整 / 停止判断标准。你只做实验设计,不替我跑实验、不编案例没公开的转化率、不替我决定要不要进同一赛道;不允许 7 天内改多个变量;不允许在样本不足时强行下结论。
## 核心任务
把 1 个优先动作翻译成一份可执行 7 天实验设计单:1 个明确假设 + 1 个唯一变量 + 1 份改动前基线截图清单 + 每日 1 个具体动作 + 1 个核心观察信号 + 继续 / 调整 / 停止判断阈值 + 样本不足兜底规则。
**成功标准**:交付的结果必须同时满足——假设是否符合"改 X 让 Y 从 A 到 B"格式;变量是否只 1 个;基线是否 5 项齐;每日动作是否每天只 1 件;三判断是否含样本不足兜底;有没有让我"再多改 1 个变量"。 任意一条没满足即视为未达标,需补料后重跑。
## 信息输入
设计之前先看材料齐不齐。
如果从案例选出的 1 个优先动作 / 该动作的证据 / 条件 / 成本 / 风险 / 依赖、我的项目链接 / 目标人群 / 当前基线 / 资源限制这两件事我能填出 60% 以上,你就直接设计。如果"优先动作"或"当前基线"是空的,强制转访谈。
访谈时你要问的就是这五件事:
1. 选的优先动作是什么?必须只 1 个动作,多个的话先回 02 子页排序。
2. 我项目当前的基线指标是什么?(如点击率 / 询单数 / 转化率 / 完课率,具体数字)
3. 期望的实验信号是什么?(如点击率提升 30% / 询单 +5 个 / 转化率从 1% → 2%)
4. 我每天能投入实验的时间?(< 30 分钟 / 30-60 分钟 / 1-2 小时)
5. 7 天内能拿到的样本量大概多少?(< 50 / 50-200 / 200+)
如果样本量 < 50,强制提醒"7 天结果可能样本不足,结论必须降级";如果选了 2+ 动作,强制压到 1 个;如果基线指标没有具体数字,强制先去补基线。
## 工作流程
第一步是写实验假设。格式必须是"我相信改 X 会让 Y 从当前 A 提升到 B"。例如"我相信把落地页标题改成具体场景描述会让点击率从 3% 提升到 5%"。
第二步是锁定唯一变量。在 `<thinking>` 里检查:
| 我打算改的内容 | 单变量吗 |
|---|---|
| 只改标题 | 是 |
| 只改 CTA 文案 | 是 |
| 同时改标题 + CTA + 主图 | 否(违反) |
| 改主图 + 价格 + 文案 | 否(违反) |
不允许同时改 2 个。
第三步是记录改动前基线。必须列出 5 项要保留的"对照证据":
| 基线项 | 保存方式 |
|---|---|
| 当前页面截图 | 全屏截图 + 时间戳 |
| 当前指标数字 | 7 天历史均值 |
| 当前用户原话 | 评论 / DM 5 条 |
| 当前流量来源 | 后台来源占比 |
| 当前转化路径 | 6 步漏斗 |
不留基线就没法判断改动是否真起作用。
第四步是每日动作排表(7 天每天 1 件事 + 1 个观察信号):
| 天 | 动作 | 观察信号 |
|---|---|---|
| Day 0 | 写假设 + 截图基线 + 准备改动版 | 基线 5 项齐 |
| Day 1 | 上线改动版 + 通知现有渠道 | 当天访问 vs 历史均值 |
| Day 2 | 看 24 小时数据 + 收集 1-2 条用户反馈 | 是否有显著变化 |
| Day 3 | 看 48 小时累计 + 不调整变量 | 误差范围 |
| Day 4 | 看 72 小时 + 是否出现负反馈 | 风险预警 |
| Day 5 | 看 96 小时 + 主动问 3 个用户体验 | 用户原话 |
| Day 6 | 数据归档 + 算样本量是否足够 | 样本 ≥ 阈值 |
| Day 7 | 复盘 + 三判断 | 继续 / 调整 / 停止 |
第五步是复盘信号 + 三判断阈值:
| 阈值 | 判断 |
|---|---|
| 指标提升 ≥ 期望值(如 30%)+ 样本 ≥ 50 | **继续**:扩大变量 |
| 指标变化 < 期望值但 > 0 + 样本 ≥ 50 | **调整**:换另一个变量再 7 天 |
| 指标 ≤ 基线 - 10% | **停止**:回滚 + 重新选动作 |
| 样本 < 50 | **样本不足**:再观察 7 天,不下结论 |
## 示例 / 样板
输入是"优先动作 = 改落地页标题为'用 AI 把会议录音 30 分钟整理成行动清单';当前基线点击率 3%;目标点击率 5%;每天可投入 30 分钟;预计 7 天样本约 200"。
期望输出:实验假设 = "我相信把标题从'AI 工具'改成'用 AI 把会议录音 30 分钟整理成行动清单'会让点击率从 3% 提升到 5%(绝对值 + 2pp)"。唯一变量 = 标题(不动主图 / 副标题 / CTA / 价格 / 描述)。改动前基线:① 当前页面全屏截图(含时间戳)② 历史 7 天均值 3.1% ③ 5 条用户 DM(已截图)④ 流量 60% Twitter + 30% 自然搜索 + 10% 朋友 ⑤ 6 步漏斗(UV / 点击 / 询单 / 试用 / 付费 / 复购)。每日动作(Day 0 写假设 + 截图 → Day 1 上线 → Day 2-6 数据 + 反馈 → Day 7 复盘)。三判断:点击率 ≥ 5% 且样本 ≥ 50 → 继续扩量;3-5% → 调整变量;< 2.7% → 停止回滚。
反面例子:同时改标题 + 主图(违反单变量);不留基线截图(无法对比);样本 30 就下结论"实验失败"(违反样本不足兜底);改完 1 天就说"看不出效果停掉"(违反 7 天观察期)。
## 输出规范
直接输出《[动作名]》7 天复现实验设计单正文,不要前言后语,总字数 900 到 1300 字,按以下顺序:
1. **实验假设**:1 句话 "我相信改 X 会让 Y 从 A 提升到 B"
2. **唯一变量锁定**:单变量检查
3. **改动前基线 5 项**:截图 / 数字 / 用户原话 / 流量来源 / 漏斗
4. **每日动作 + 观察信号表**:Day 0 到 Day 7
5. **三判断阈值**:继续 / 调整 / 停止 + 样本不足兜底
6. **样本量预估**:是否 ≥ 50 的检查
输出前自检:假设是否符合"改 X 让 Y 从 A 到 B"格式;变量是否只 1 个;基线是否 5 项齐;每日动作是否每天只 1 件;三判断是否含样本不足兜底;有没有让我"再多改 1 个变量"。
## 硬约束 · 拒绝场景
- 同时改 2+ 变量 → 拒绝
- 不留改动前基线 → 拒绝
- 样本 < 50 仍要求下"成功 / 失败"结论 → 强制降级"样本不足"
- 编造案例的转化提升具体百分比作为期望 → 拒绝
- 占位符 `___` 未替换 → 拒绝先给结论
7 天复现实验要写清五件事:
| 项目 | 要写 |
|---|---|
| 假设 | 我认为这个动作会改善什么 |
| 变量 | 本次只改哪一个东西 |
| 基线 | 改之前是什么状态 |
| 执行 | 七天每天做什么 |
| 复盘 | 用什么信号决定继续、调整或停止 |
没有基线的实验无法对比,没有单变量的实验无法解释,没有复盘标准的实验容易靠感觉收尾。
7 天实验不是 7 天翻盘
7 天实验的目标不是立刻做成一个生意,而是减少一个关键不确定。
比如你从案例里学到“把样品放到价格页前面”,7 天实验只回答一个问题:这样做是否让目标用户更愿意看价格、提具体问题或尝试购买。它不负责证明整个项目成功。
很多新手误会“实验”这个词,以为实验必须带来明显增长。其实早期实验更常见的价值,是发现不能做什么。没人点击、没人回复、问题变差、售后变重,都是真实信号。
的核心是用小闭环学习。7 天只是一个人为边界,帮你把案例动作压成短周期,而不是让你给自己制造不现实期待。
七天也不是固定魔法数字。它适合页面、样品、邮件、FAQ、脚本和小渠道验证;不适合判断长期留存、复购和品牌信任。你要把七天当成第一轮筛选,而不是终局判断。
如果一个动作七天内完全没有信号,要先判断是动作问题,还是入口太弱(入口判断方法参考 转化漏斗信号)。没有足够目标用户看到实验,就不能说明动作无效,只能说明实验条件不足。
第 1 步:把案例动作翻译成因果型假设
假设要写成因果句。
| 模糊写法 | 合格写法 |
|---|---|
| 优化页面 | 如果首屏写清适用人群,咨询会更具体 |
| 提升信任 | 如果加真实样品,价格页点击会增加 |
| 学案例发售 | 如果发三封问题邮件,回复质量会提高 |
| 改交付 | 如果写清修改边界,售后重复问题会减少 |
假设不需要复杂,但必须能被观察。不要写“用户会更喜欢”,要写“用户会多问场景、价格、交付或试用”。喜欢是感受,行为才方便复盘。
一个实验只写一个假设。你同时想验证标题、价格、样品、渠道和交付,就会把一周变成混乱执行。
假设还要写出反证。比如“如果样品能提升信任,那么咨询会更具体”;反证就是“用户看了样品仍然只问折扣或不再行动”。提前写反证,能防止你在实验结束后只挑对自己有利的解释。
合格假设不追求复杂,而是能让你知道下一步该保留、调整还是停止。
第 2 步:锁定 1 个唯一变量(不并行)
变量就是这次唯一改变的东西。
| 变量 | 不要同时改 |
|---|---|
| 标题 | 不同时改价格和页面结构 |
| 样品 | 不同时改渠道和套餐 |
| FAQ | 不同时改服务范围和报价 |
| 邮件 | 不同时改落地页和付款入口 |
| 渠道 | 不同时换产品和承诺 |
单变量不是为了形式整齐,而是为了让结果能解释。你只改样品,咨询质量变好,至少能推断样品对信任有帮助;你同时改样品、价格和渠道,结果好坏都不知道原因。
如果必须改多个东西,就把它们拆成多个小实验。先改能独立观察的变量,再把有效动作组合。
唯一变量也要写进记录里。比如“本周只改价格页顺序,不改价格、不换渠道、不新增样品”。看似啰嗦,但能约束执行。很多实验失败不是方法错,而是执行过程中不断加料,最后无法解释。
如果临时必须改其他东西,比如修正错字或补平台要求,要在记录里标注。这样复盘时不会把结果错误归因到主变量。
第 3 步:用 5 项基线锁住"改动前"
基线是实验前的状态。
| 基线字段 | 例子 |
|---|---|
| 页面 | 首屏、CTA、样品、FAQ、价格 |
| 流量 | 来源、访问、点击、咨询 |
| 用户问题 | 购买前最常问什么 |
| 订单 | 付款、退款、失败付款 |
| 支持 | 修改次数、重复问题、交付时长 |
基线不完整也可以,但要写“未确认”。不要因为没有完整数据就放弃实验,也不要把没有记录的字段当作没问题。
基线最好保留截图和文字记录。七天后你会忘记改动前是什么样,复盘会变成凭感觉。截图、表格和日期能减少记忆偏差。
基线不只看数字,也看用户语言。改动前用户问什么、卡在哪、怎么描述自己的问题,这些都要保留。实验后如果用户问题变具体,哪怕订单还没出现,也可能说明方向变清楚了。
对低流量项目来说,语言信号往往比数字更早出现。不要只盯访问量,也要看评论、私信、邮件回复和咨询质量。
第 4 步:跑 Day 0 到 Day 7 的每日动作表
七天实验可以这样排:
| 天数 | 动作 |
|---|---|
| 第 1 天 | 写假设、确认变量、记录基线 |
| 第 2 天 | 完成改动,保留改动截图 |
| 第 3 天 | 发布或分发到一个明确渠道 |
| 第 4 天 | 收集用户问题和行为 |
| 第 5 天 | 只补解释,不改主变量 |
| 第 6 天 | 整理结果和异常 |
| 第 7 天 | 做继续、调整或停止判断 |
第 5 天很关键。很多人看到数据不动,就忍不住继续改标题、价格和渠道。这样会破坏实验。你可以回答用户问题、记录反馈,但不要随手改主变量。
如果七天内流量太少,就把结论写成“样本不足”。样本不足不是失败,它说明你下一步要先解决入口,而不是对页面动作下结论。
每日动作要克制。第 3 天发布后,不要到处乱发;选一个最匹配渠道,记录入口和用户身份。第 5 天补解释时,不要改核心页面;只把用户问题记录下来。第 7 天复盘时,先看事实,再写解释。
实验纪律比执行强度更重要。没有纪律的勤奋,会把数据弄乱。
第 5 步:用三档判断决定继续/调整/停止
复盘要提前设标准。
| 判断 | 标准 |
|---|---|
| 继续 | 目标用户行为变具体,风险没有明显增加 |
| 调整 | 有兴趣但卡在理解、信任、价格或交付 |
| 停止 | 没有目标用户信号,或售后风险明显变大 |
复盘时不要只看好消息。有人夸你页面清楚,但没人问具体场景,不算强信号;有人点击样品,但看完不再行动,要继续追问原因;有人购买,但马上退款,要回到承诺和交付。
实验结果最有价值的部分,是下一步动作。继续就把变量保留,调整就改一个新变量,停止就回到案例库找别的动作。
复盘时还要写“我学到了什么”。比如你学到用户不懂术语、样品太抽象、价格页太早、目标人群太泛、渠道不匹配。学习结果越具体,下一个实验越准。
不要把实验写成情绪总结。写事实、写判断、写下一步。这样七天实验才能变成 Playbook 版本,而不是又一段记忆。
最后还要写“哪些结论不能下”。比如样本不足时,不能说产品没人要;只测试搜索流量时,不能否定社群渠道;只测试样品页时,不能直接判断完整定价。把不能下的结论写出来,能保护下一轮实验不被误导。
七天实验的复盘最好当天完成。拖得越久,用户原话、执行细节和临时判断越容易丢。当天复盘不求漂亮,只求把事实锁住。
复盘完成后,把下一步写成日历动作,而不是一句“继续观察”。例如下周只改 FAQ、只换一个渠道、只补一份样品。没有下一步的复盘,很快会变成归档材料(沉淀方法参考 Playbook 版本管理)。
7 天实验表
| 字段 | 填写 |
|---|---|
| 案例动作 | ___ |
| 我的假设 | ___ |
| 唯一变量 | ___ |
| 改动前基线 | ___ |
| 每日动作 | ___ |
| 观察信号 | ___ |
| 异常情况 | ___ |
| 最终判断 | 继续 / 调整 / 停止 |
| 下一步 | ___ |
这张表写完,案例才真正进入你的项目。否则它只是阅读笔记。
AI 怎么辅助
AI 适合做四件事:
- 把案例动作改成单变量实验。
- 帮你写假设和基线字段。
- 生成每日执行清单。
- 汇总用户反馈并标出下一步。
- 检查你是否偷偷改了多个变量。
AI 不适合替你判断真实用户行为。页面点击、询单、付款、退款、支持压力都要来自真实记录。
让 AI 复盘时,要求它分“事实、解释、下一步”。事实少,就不要让它写长结论。
官方资料与核验口径
平台规则、算法动向、报价规则、政策口径都会变化。本文保留的是可迁移的判断框架,具体数字一律给区间。
跨平台核验入口:
- Indie Hackers — 看独立开发者真实营收和复盘
- Reddit · r/Entrepreneur — 看副业 / 自雇者的真实问题与反例
- Wayback Machine — 回溯案例方在不同时间点的承诺与定价
涉及具体数据、比例、报价区间的部分,以执行当天后台为准。
常见问题
7 天样本不足 50,能不能勉强下“成功 / 失败”结论?
不能。样本 < 50 强制写“样本不足”,下一步先补流量入口(如换分发渠道或多发一轮),再多观察 7 天,不要把噪声当信号。
改动后 Day 2 数据特别难看,要不要直接停止?
不要。Day 2 数据通常受热度波动影响,必须看完 Day 7 累计。只在出现“硬指标恶化 ≥ 50%”(如付款大量失败、平台警告)时才提前停。
案例动作多到拆不完,怎么挑 1 个做 7 天实验?
挑两个条件都满足的:① 资源依赖最小(不靠案例那 30k 受众也能跑)② 风险最低(错了能快速回滚)。剩下的动作排队,做完这个再排下一个。
Day 7 复盘是“调整”,下一个 7 天实验该改什么?
不要回头改老变量,换“同一根因下的另一个变量”。例如标题改完没显著差异,下一轮换 CTA 文案或主图,而不是再改标题。
执行前至少核验:
- Stripe 官方文档 → 海外订阅与支付规则
- Shopify 帮助中心 → 电商运营与店铺合规
- Buy Me a Coffee → 创作者付费墙参考