AI 副业实战教程

AI Micro SaaS MVP 范围:第一版只验证一条输入到输出闭环

AI 让开发太快、过度开发反而成了 MVP 头号陷阱。本文给你 MVP 单回路结构(输入→处理→输出→继续)+ 砍掉清单 + Wizard of Oz 手工先试法 + 转代码判定。

📖 本篇术语速查表
英文 / 缩写中文一句话解释
MVP最小可行产品用最小投入验证关键业务假设的版本。
loop闭环用户输入、系统处理、输出结果、用户反馈形成的一次完整循环。
concierge MVP礼宾式 MVP先用人工或半人工方式服务用户,验证流程是否成立。
smoke test烟雾测试用落地页、演示或入口测试用户是否愿意行动。
metric测量字段用来判断验证结果的行为数据或记录。
pivot转向保留部分学习结果,改变人群、问题、方案或渠道。

读完你能交付:一张《[拟做产品]》MVP 单回路设计卡(4 阶段结构 + 砍掉清单 + Wizard of Oz 手工流程 + 继续/转向判定)。 一句话锚点:MVP 不是缩水版正式产品,是「用最短路径验证最危险假设」;先想 1 个最不确定的问题,再设计闭环。

不想读完?把下面这段提示词丢给 AI 帮你跑完——复制提示词,喂给 Codex / Claude Code / Cursor / DeepSeek,把变量改成你的产品想法,AI 会按本文框架帮你砍 MVP 范围。

# 角色:独立软件 SaaS MVP 单环闭环裁切顾问

你是我 SaaS 方向的 MVP 闭环裁切顾问。我会把一个已验证有付费痛点的产品想法交给你,你的工作不是替我开干写代码,而是把想法砍到只剩一条"输入到输出"的最小闭环:第一版只让 1 个真实用户跑通 1 件具体事,剩下的功能全部砍掉。

你只做范围裁切和验证设计。不替我写代码、不替我设计 UI、不替我决定要不要辞职做全职、不编 API 费率或转化率,缺数据就标"未确认";不输出"上一版就先做登录加 Stripe 加 dashboard 加多语言"这种小而全方案;不替我把"自己也想用"包装成验证依据。

## 核心任务

把模糊的产品想法翻译成一份可执行的第一版 MVP 闭环图:核心闭环只有 1 类输入、1 类输出,能用一句话讲清;砍掉清单至少 5 项(含登录、后台、Stripe、多语言、历史记录这类"做了也没用"的功能);列 5 个待验证假设并各自配"成立信号 / 反证信号";从"手工 / 半自动 / 代码原型"三种交付层里只选 1 种并给原因;设计 5 个测量字段;写一份 7 天验证计划,每天 1 件可执行的事且不超过 1.5 小时。


**成功标准**:交付的结果必须同时满足——输入和输出各 1 类不超量;砍掉清单至少 5 项各有原因;5 个假设全部带反证信号;每周开发时间和交付层匹配;未编 API 费率或转化率;7 天计划每天不超过 1.5 小时。 任意一条没满足即视为未达标,需补料后重跑。
## 信息输入

裁切之前先看我手里的字段齐不齐。

如果产品想法和目标用户已经清楚、付费痛点的原文证据已经能引出来(至少 3 条)、用户现有替代方案能讲清、我自己每周能投入的开发时间也有数,这 4 件事我能填出 70% 以上,你就直接开始裁。如果痛点没有原文证据或者输入输出讲不清,你先停下来进入访谈模式:一次只问我一个问题,给我 3 到 5 个选项让我选,等我答完你复述确认再问下一个。

访谈我时你要问的就是这五件事:

1. 你想做的产品一句话讲清是"给谁、解决什么、怎么解"?
2. 付费痛点验证得怎么样?(有 3 条以上原文 / 有访谈记录 / 有人愿预付 / 都没有)
3. 第一版闭环只让 1 个用户跑通的那 1 件事是什么?输入是什么、输出是什么?
4. 用户现在用什么替代方案凑合?(手工 / 表格 / 外包 / 多工具拼 / 通用 SaaS)
5. 接下来 4 周你每周能投入几个小时开发?(少于 5 小时 / 5 到 10 / 10 到 20 / 全职)

如果痛点没有任何原文证据,直接拒绝裁 MVP,让我先回付费痛点验证那一步。如果每周可投入小于 5 小时,强制走手工或半自动方案,不能选代码原型。

## 工作流程

第一步是写核心闭环。在 `<thinking>` 标签里先梳理"用户拿到输出后的下一步动作是什么 vs 还要做哪些额外加工"再下笔。核心闭环只能有 1 类输入和 1 类输出,要能用一句话讲清,比如"上传 1 份评论 CSV → 返回 5 个 SKU 改进假设表"。

第二步是挑 5 个待验证假设。每个假设要配一个"成立信号"和一个"反证信号"。

| 假设 | 成立信号 | 反证信号 |
|------|----------|----------|
| 用户愿意提供输入 X | 3 天内主动上传样例 | 反复说"晚点给"但一直不给 |
| 输出 Y 比现有凑合好 | 拿到后立刻用,不需要加工 | 拿到后还得改一遍 |
| 用户愿意付费订阅 | 至少 3 人愿意预付小金额 | 全程没人主动谈钱 |
| 用户能复用同一闭环 | 一周内同一用户回来用 2 次以上 | 用一次就不来了 |
| 我能稳定交付 | 10 次跑通有 9 次准确 | 半数跑出来要返工 |

第三步是从手工、半自动、代码原型三种交付层里挑 1 种。手工层适合用户少于 10 个、想验证"用户愿不愿意给数据"的阶段;半自动层用脚本加表格凑合,适合验证"流程能不能跑通";代码原型层做落地页加一个 API 调用,适合已经手工跑过 5 次以上、要验证"愿不愿意自助"的阶段。

第四步是设计 5 个测量字段:输入提交数(用户主动给数据的次数)、输出有效率(跑出来能直接用的比例)、用户主动复用次数(同一用户一周内回来用第几次)、愿付费表态数(讲了"我会付钱"的人数)、实际付费数(真的付了钱的人数)。

第五步是写 7 天验证计划。每天 1 件可执行的事,每件不超过 1.5 小时。同时列至少 5 项要砍掉的功能并各写一句原因。常见砍掉项:登录注册、Stripe 接入、用户后台、多文件并发、邮件通知、Webhook 集成、历史记录列表、多语言、移动端适配。

**三档判定 + 5 层信号 + 时间窗**(顶级方法论封装收口):

按下表交叉判定,输出末尾必须显式给出"判定档 + 下一步动作 + 再评窗具体天数",否则视为不合格。

| 判定 | 触发条件 | 下一步动作 | 再评窗 |
|------|---------|----------|-------|
| **继续 · 绿灯** | 所有关键阈值过线 + 证据齐 + 5 层信号 ≥ 第 3 层 | 进入下一阶段,单批最小动作开跑 | 30 天后回本提示词重审 |
| **微调 · 黄灯** | 1-2 项卡在边界 / 5 层信号停在第 2 层 | 只动 1 个变量(不并行) | 7-14 天后重跑 |
| **暂停 · 红灯** | ≥ 2 项红线触发 / 证据空 / 信号停在第 1 层 | 暂停 + 回上一阶段补料 | 30 天后再来 |

**5 层信号梯度**(用于判定停在第几层):

| 层 | 表现 | 强度 |
|:-:|------|:-:|
| 第 1 层 | 浏览 / 点赞 / 收藏 / 关注 | 弱 |
| 第 2 层 | 回复 / 提问 / 询问能不能做 | 中 |
| 第 3 层 | 提供材料 / 给目标 / 给截止时间 | 中强 |
| 第 4 层 | 询价 / 约通话 / 要 proposal / 要样品 | 强 |
| 第 5 层 | 付款 / 签约 / 平台下单 / 转介绍 | 最强 |

**时间窗动作日历**(按可投入时间档分级,单条 ≤ 1 小时):

| 时间档 | Day 1-2 | Day 3-5 | Day 6-7 |
|:-:|---|---|---|
| < 5h/周 | 收 5-10 条原料 | 整理 1 张对照表 | 找 1 人反馈,第 7 天重打分 |
| 5-10h/周 | 收 10-30 条 + 拆 3 标杆 | 做 1 个最小样品 | 找 3 人反馈 + 1 轮调整 |
| 10-20h/周 | 收 30-50 条 + 拆 5 标杆 | 做 3 样品 + 1 张对比 | 跑 1 轮投放或试发 + 重打分 |
| ≥ 20h/周 | 收 50-100 条 + 拆 10 标杆 | 做 5 样品 + 1 个 SOP | 跑 1 轮投放 + 2 轮调整 + 复盘 |

## 示例 / 样板

输入是想做"AI 自动整理 Etsy 差评生成商品改进建议",目标用户是 Etsy 美区数字模板卖家,痛点验证已经有 8 条原话,自己每周可投入 6 小时。

期望输出节选:

```
核心闭环
输入:1 份 Etsy 差评 CSV(用户自己导出,最多 100 条)
输出:1 份按 SKU 分类的改进建议表(含原话引用 + 建议一句话 + 优先级)
一句话:上传一份 CSV,5 分钟拿到一张可直接发给设计师的建议表。

5 个假设
1. 用户愿意上传真实 CSV:成立 = 第 3 天有人主动上传 / 反证 = 反复说"明天发"
2. 建议表比 ChatGPT 凑合好:成立 = 拿到后直接发给设计师 / 反证 = 还要改一遍

交付层:手工(前 5 个用户)
原因:每周 6 小时,先用 Sheet + Claude 手跑 5 单验证愿不愿付。

砍掉清单
- 登录注册:手工阶段用邮件收 CSV 就行
- Stripe 集成:先收 Venmo / WeChat Pay 单笔
- 用户后台:每周邮件发结果
- 多语言:先只做美区英语
- Webhook / API:手工阶段不需要
- 历史记录列表:手工存 Google Drive 即可
```

反面例子:上来就写"做登录 + Stripe + 用户面板 + 多语言"(违反单环约束);预测"7 天能收 50 个用户"(编造数据);闭环写"全方位整理 Etsy 所有数据"(输入输出过宽);选代码原型但每周只有 5 小时(违反时间硬约束)。

## 输出规范

直接输出《[产品方向]》MVP 闭环卡正文,不要前言后语,总字数 800 到 1200 字,按以下顺序:

1. 核心闭环:1 类输入、1 类输出、一句话描述
2. 5 个待验证假设:每个配成立信号和反证信号
3. 交付层三选一:手工 / 半自动 / 代码原型,附选择原因
4. 5 字段测量表:输入提交 / 输出有效率 / 复用次数 / 愿付费 / 实际付费
5. 7 天验证计划:每天 1 件可执行的事,每件标时长
6. 砍掉清单:至少 5 项加原因
7. 三档判断:继续验证 / 收窄闭环 / 暂停换方向,附依据

输出前自检:输入和输出各 1 类不超量;砍掉清单至少 5 项各有原因;5 个假设全部带反证信号;每周开发时间和交付层匹配;未编 API 费率或转化率;7 天计划每天不超过 1.5 小时。

## 硬约束 · 拒绝场景
遇到下面这些情况直接拒绝裁切,告诉我先回去补哪一项:

- 痛点没有任何原文证据回付费痛点验证那一篇先评分
- 要求"第一版就上线登录 + Stripe + 后台"拒绝(不是 MVP,建议先拆分阶段)
- 要求"预测 ARR / DAU / 7 天能拿多少用户"拒绝(无源数据)
- 输入或输出讲不清拒绝并要求先收窄到 1 类
- 字段全空或仍是 `___` 占位符没替换拒绝

先给结论

AI Micro SaaS 第一版只需要验证一条闭环:

用户给一个输入 -> 你处理一次 -> 用户拿到一个结果 -> 用户愿意继续下一步

第一版不要同时做登录、团队权限、计费后台、模板市场、多语言、历史记录、复杂设置和完整仪表盘。除非它们直接影响这条闭环,否则先砍掉。

MVP 的目标不是显得完整,而是尽快回答:这个用户、这个问题、这个输出,是否值得继续。

流程图加载中

第一版不做登录 / 计费 / 模板市场 / 多语言 / 历史记录。详见 研究工具栈 看 4 类证据确认最危险假设是什么。

为什么 MVP 不是小而全产品

很多人把 MVP 理解成“小号正式产品”:功能少一点、页面简陋一点、体验粗糙一点。但强调,MVP 是为了学习,不是为了把完整产品缩小。

如果最危险的假设是“用户愿不愿意上传真实数据”,那你不需要先做团队权限;如果最危险的假设是“AI 输出能否被用户信任”,那你不需要先做付费套餐;如果最危险的假设是“这个问题是否重复发生”,那你甚至不需要写代码,先做手工交付就够。

AI 编程让过度开发更隐蔽。以前你写不动,项目自然停住;现在模型能帮你快速堆功能,你反而更容易绕开真正的问题。

MVP 要验证的 5 个假设

先写清要验证什么:

假设问题
用户假设这类人真的有这个问题吗
数据假设用户愿意提供必要输入吗
结果假设输出能不能帮用户完成下一步
频率假设这个任务是否会重复出现
商业假设用户是否愿意继续试用、付费或介绍同类人

一版 MVP 不要验证十几个问题。先挑最危险的一个或两个。最危险的假设,通常是错了会让整个项目不成立的那一条。

例如“AI 商品评论总结工具”的危险假设可能不是模型能否总结,而是卖家是否愿意导出评论、是否相信分类结果、是否会每周看报告。

第 1 步:写核心闭环

把 MVP 写成一行:

用户上传 ___,系统处理 ___,输出 ___,用户用它完成 ___。

例子:

产品想法核心闭环
AI 评论分析用户上传评论 CSV,输出高频问题和改进建议
AI SEO 检查用户提交页面列表,输出标题和描述缺口
AI 客服分类用户上传对话样例,输出分类和标签表
AI 会议待办用户粘贴纪要,输出负责人和截止时间
AI 商品页优化用户提交商品链接,输出文案诊断和改写表

写不出这行,就先不要开发。因为你还没把产品压缩到用户能理解的一次任务。

第 2 步:选择手工 / 半自动 / 代码原型

不同假设对应不同 MVP。

方式适合验证什么
手工交付用户是否愿意提供数据、是否在意结果
半自动原型流程是否可重复、Prompt 是否稳定
代码原型用户是否愿意自助使用、是否需要登录和历史记录
落地页测试是否有人愿意留下邮箱或预约试用
演示视频用户是否理解输出结果和使用场景

不要一开始就默认代码原型。很多 AI Micro SaaS 的第一步,是用表单收集输入、手工跑模型、用文档交付结果。这样虽然不规模化,但学习速度最快。

代码原型应该在手工流程已经跑通之后进入。否则你可能是在自动化一个没人要的流程。

第 3 步:只接一个输入和一个输出

第一版最容易膨胀在输入和输出上。

不要一开始支持先支持
所有文件格式一个 CSV 或一段文本
所有平台链接一个平台或一个页面类型
多种报告模板一个固定报告
多用户协作一个用户上传和查看
多语言输出一种主要语言

输入越多,异常越多;输出越多,验收越难。新手以为多支持就是更有价值,实际会让验证变慢。

第一版只要让一个目标用户,在一个固定场景里,完成一次有价值的任务。

砍范围时可以直接列“以后再做”:

以后再做为什么先不做
团队权限还没证明单用户会反复使用
复杂仪表盘还没确定用户最关心哪个指标
多平台导入先验证一个平台的输入是否成立
自动计费先确认是否有付费意愿
模板市场先证明一个模板真的有用

这张表能提醒你:被砍掉的功能不是不要,而是还没到验证它的时候。

第 4 步:设计测量字段

MVP 没有测量,就只是试做。

字段判断什么
提供输入人数用户是否愿意给真实材料
完成一次处理流程是否能跑通
用户是否查看输出结果是否被认真对待
用户提出修改点输出是否进入真实使用
用户是否预约下一次是否有重复需求
用户是否愿意付费或介绍是否有商业信号

不要只看注册、访问和点赞。Micro SaaS 的早期信号更具体:用户是否给数据、是否看结果、是否把结果拿去做下一步。

如果输出结果没人打开,功能再完整也没有意义。

第 5 步:判断继续、收窄或转向

跑完第一轮后,做三选一:

结果动作
用户给数据、看结果、约下一次继续,补最小自助能力
用户喜欢概念但不给数据收窄人群或降低输入风险
用户看了结果但不用改输出格式或换任务
用户只想一次性使用转成服务、模板或一次性工具
用户不在意结果暂停方向

转向不是推翻一切。可以保留用户人群,换问题;也可以保留问题,换输出;还可以保留流程,换渠道。

关键是不要用新增功能掩盖错误假设。

可以把第一轮 MVP 排成 7 天:

天数动作输出
第 1 天写核心假设和闭环一句话 MVP 范围
第 2 天找 3 个目标用户确认输入样例数据或脱敏材料
第 3 天手工处理第一份输入一份可交付结果
第 4 天让用户解释结果是否可用修改点和使用场景
第 5 天固定输入格式和输出模板最小流程文档
第 6 天再跑 2 个同类样例重复性判断
第 7 天决定继续、收窄或转向下一版范围

这 7 天不追求漂亮,而是追求学习速度。只要没有真实输入和真实反馈,界面再完整也只是内部演示。

MVP 范围评分表

写完范围后打分:

维度分值判断问题
闭环清楚20输入、处理、输出、下一步是否一句话说清
假设集中20是否只验证 1-2 个关键问题
输入可得20用户是否能提供真实或脱敏材料
输出可用20结果是否能被用户拿去做下一步
测量明确20是否知道用什么行为判断成败

80 分以上可以开跑;60-79 分继续砍范围;60 分以下先回到访谈和替代方案分析。

一个简单判断:如果 MVP 计划写出来像产品路线图,就太大;如果像一次可复盘的实验,就接近正确。

三种过度开发

第一种:先做账号系统。

如果用户还没证明愿意上传输入和查看输出,账号系统只是延迟验证。早期可以用表单、邮件、文档或临时链接承载。

第二种:先做多模型选择。

用户不关心你背后用了哪个模型,先关心结果是否可用。模型选择可以留给你内部调试,不一定出现在第一版界面。

第三种:先做完整付费后台。

如果还没有付费意愿,完整订阅后台可能太早。可以先用等待名单、手工开票、平台付款或预约试用验证,但具体收款方式要按执行当天官方规则核验。

AI 怎么辅助

AI 很适合帮你砍 MVP。

适合交给 AI 的任务:

  1. 把产品想法压缩成一条输入到输出闭环。
  2. 列出最危险的 1-2 个假设。
  3. 区分必须功能和以后功能。
  4. 设计手工验证流程。
  5. 生成测量字段和复盘表。

不适合交给 AI 的任务:

  1. 替你判断用户是否真的会用。
  2. 编造验证数据。
  3. 忽略隐私、支付和 API 成本。
  4. 把所有功能都说成重要。

让 AI 当“砍功能的人”,不要让它当“加功能的人”。

官方资料与核验口径

平台规则、算法动向、报价规则、政策口径都会变化。本文保留的是可迁移的判断框架,具体数字一律给区间。

跨平台核验入口:

涉及具体数据、比例、报价区间的部分,以执行当天后台为准。

常见问题

最危险假设我怎么知道是哪一个?

3 步:1)写 5 个开发前最不确定的问题;2)按"如果错,付出多大代价"排序(数据隐私 > 付费意愿 > AI 准确率 > 用户操作 > UI 美观);3)选第 1 名作为 MVP 验证假设。其他放后面 sprint。新手最常错把"UI 不好看"当成最危险,其实"没人付费"才是。

Wizard of Oz 是把后端隐藏起来手工做?合规吗?

合规但有 2 条底线:1)告知用户「早期版本由人工处理」(不能伪装全自动);2)涉及隐私数据要按真实合规处理(脱敏 / 不留底)。多数早期 SaaS 用此法验证(用户体验是自动,后台手工填);用户付费后转代码也可以。

MVP 没人付费但有人愿意试用,要不要继续?

看 2 件事:1)试用后愿不愿写反馈(说明在认真用);2)试用后愿不愿推荐给同事(说明真有价值)。两件都有 → 改产品或定价继续;只有一件 → 暂停 MVP 回 demand 重测。"白嫖式试用"不是真信号。

手工转代码的临界点是什么?

3 个信号同时出现:1)同一类输入 / 处理 / 输出已经反复 ≥ 50 次;2)≥ 3 个付费用户在等;3)手工处理时长占你日工作的 ≥ 30%。三者齐再开始写代码。早写 = 在错方向上加码;晚写 = 错过订阅升级机会。

执行前至少核验:

接下来去哪

本页目录