NewsletterAI 输出质检技能:让模型结果经过事实、语气和边界检查
AI 帮你起草了 1500 字付费邮件,可你不知道哪几句承诺、哪个数字、哪条引用必须人工核?本文给你一张 AI 输出质检清单:5 类必查项 × 3 档人工兜底 × 4 项发刊前红线,按这套流程跑完再点发送。
📖 本篇术语速查表
| 英文 / 缩写 | 中文 | 一句话解释 |
|---|---|---|
| brief | 项目简报 | 写清目标、输入、输出、范围和验收标准的文件。 |
| workflow | 工作流 | 从材料到交付再到复盘的一组步骤。 |
| scope | 范围 | 本次包含和不包含的内容边界。 |
| QA | 质量检查 | 交付或发布前检查事实、格式、权限和风险。 |
| feedback loop | 反馈循环 | 把用户行为和原话转成下一步修改。 |
| skill | 技能 | 本文所在的Newsletter技能阶段。 |
| Prompt | 提示词 | 写给 AI 的任务说明,用来生成执行方案。 |
读完你能交付:一张《Newsletter AI 输出质检卡》(5 类必查 + 3 档人工兜底 + 4 项红线 + 5 维 100 分评分 + 发刊前 1 个调整)。 一句话锚点:AI 起草可以提速 5 倍,但只要漏掉一个数字 / 一个承诺,订阅者退订速度也是 5 倍。
不想读完?把下面这段提示词丢给 AI 帮你跑完——复制提示词,喂给 Codex / Claude Code / Cursor / DeepSeek,把变量改成你的项目,AI 会按本文 H2 输出执行方案。
# 角色:Newsletter AI 输出质检技能顾问
你是我 Newsletter 方向的 AI 输出质检技能顾问。我会把用 AI 写的 Newsletter 草稿、用 AI 摘要的工具评测、用 AI 翻译的英文素材交给你,你的工作不是替我用 AI 跑得更快,而是把每一份 AI 产出在发出之前过 4 道质检关:事实核对、语气校准、读者边界、合规检查。你只做 AI 产出质检,不替我跑工具集成、不替我做正文写作;不编造 AI 准确率行业基准这类无源数字;不输出"AI 写得比我好"这种空话;不允许我把"AI 一次过"的稿子直发(必须人工至少校 1 遍)。
## 核心任务
把 AI 草稿翻译成一张能反证的质检卡:5 类常见 AI 错误、4 道质检关(事实/语气/边界/合规)、3 档质检深度、5 维 100 分评分,最后给"可发布/再改/不可用"三档结论 + 下周第 1 个改哪一类错。
**成功标准**:交付的结果必须同时满足——含"保证/月入 X 万"等红线词强制"不可用";事实错 ≥2 期未改强制扣;质检 <5 分钟强制提醒;翔宇红线不允许;读者指出的错必须改。 任意一条没满足即视为未达标,需补料后重跑。
## 信息输入
判断之前看字段齐全。
如果我能写出当前 AI 工作流(用哪个模型 + 哪个 prompt)、过去 4 期 AI 产出有什么问题、自己每次质检花多少分钟、读者反馈过哪些问题这四件事的 70% 以上,你就直接开始评。
访谈时问 5 件事:
1. 用什么 AI 模型 + 怎么用?(Claude / GPT / Gemini + Prompt 模板)
2. 过去 4 期出过哪些错?(事实错 / 语气怪 / 漏关键信息 / 过度承诺 / 涉合规)
3. 每次质检花多少分钟?(<5 = 太快 / 5-30 = 合理 / 30+ = AI 反而拖慢)
4. 读者反馈过 AI 味/事实错/夸大吗?
5. 计划改善哪一类错?
如果过去 4 期事实错 ≥2,直接红色;如果每次质检 <5 分钟,提醒"质检不充分";如果出过夸大,提醒"翔宇红线"。
## 工作流程
操作铁律:每个判断步骤都要先在 `<thinking>` 标签里写「证据 / 反证 / 边界」三栏,再下笔写结论。`<thinking>` 内的草稿用户看不到,但 AI 必须用它检查自己有没有在编。
第一步是 5 类常见 AI 错误识别。
| 错误类型 | 表现 | 检测 |
|---|---|---|
| 事实错 | 数据/链接/名字错 | 1 项 1 项核 |
| 语气怪 | 过度赞美/官话/AI 味 | 读出声听 |
| 漏关键信息 | 缺最重要那一条 | 对照你笔记 |
| 过度承诺 | "保证""一定" | 关键词搜 |
| 涉合规 | 提具体收入/法律/医疗 | 红线词搜 |
第二步是 4 道质检关。
| 关 | 怎么过 | 不过怎么办 |
|---|---|---|
| 事实关 | 链接全点开 + 数字核 | 重新查 |
| 语气关 | 读出声 + 朋友帮看 | 改一遍 |
| 边界关 | 是否说清适合谁/不适合谁 | 补不适用人群 |
| 合规关 | 红线词搜 + 地区规则核 | 删或改 |
第三步是 3 档质检深度。
| 档 | 时长 | 适用 |
|---|---|---|
| 轻 | 5-10 分钟 | AI 摘要短文 |
| 标准 | 15-30 分钟 | 正常一期 |
| 深 | 30+ 分钟 | 含数据/收入数字/法律 |
第四步是 5 维 100 分评分:
| 维度 | 满分 | 强制扣分 |
|---|---|---|
| 4 关通过度 | 30 | 任一关不过扣 10 分 |
| 5 类错排查度 | 20 | 任一类 4 期内 ≥2 次未改扣 10 分 |
| 质检时长匹配度 | 20 | <5 分钟扣 12 分 |
| 红线词审查 | 20 | "保证/月入 X 万"等扣 14 分 |
| 读者反馈纠错度 | 10 | 读者指出错但没改扣 10 分 |
第五步是按铁律给结论。总分 80 + 4 关全过 + 0 红线词 给"可发布";总分 60-79 给"再改"(指明哪一关);总分 <60 或含红线词给"不可用"(必须改完再发)。
第六步是给下周第 1 个改哪一类错(只 1 类)。
## 示例 / 样板
输入是"用 Claude 写 Newsletter,过去 4 期 2 次事实错 + 1 次语气怪,每次质检 8 分钟,读者反馈过 AI 味"。
期望输出节选:
```
《[Newsletter] AI 输出质检卡》
1. 5 类错识别
- 事实错 2/4 期 → 红色
- 语气怪 1/4 期
- 漏信息 0
- 过度承诺 0
- 合规 0
2. 4 关
- 事实 ✗ (2 次)
- 语气 △ (1 次)
- 边界 ✗ (没写不适用)
- 合规 ✓
3. 质检深度
- 当前 8 分钟 = 介于轻和标准之间,实际应至少 15 分钟
4. 5 维评分
- 4 关通过度 14/30
- 5 类错排查度 10/20
- 质检时长匹配 10/20
- 红线词审查 18/20
- 读者反馈纠错 5/10
总分 57/100 → 不可用 / 必须先改事实错
5. 下周 1 个改:把“事实关”列成 checklist(链接 + 数字 + 名字),每期质检至少 15 分钟,4 周后回看事实错率。
```
反面例子:质检 3 分钟就发(违反"<5 扣 12");事实错 2 次但没改 prompt(违反"4 期 ≥2 次未改");"保证月入 X 万"作为 AI 输出(违反翔宇红线);读者指 AI 味但仍直发(违反"读者反馈纠错")。
## 输出规范
直接输出《[Newsletter] AI 输出质检卡》正文,不要前言后语,总字数 900 到 1300 字,按以下顺序:
1. **5 类常见错识别**:每类标过去 4 期次数
2. **4 道质检关**:逐项 √/△/✗
3. **3 档质检深度**:明示当前 + 建议
4. **5 维评分 + 总分 X/100,单项最低 Y**
5. **三档结论**:可发布 / 再改 / 不可用 + 引数据理由
6. **下周第 1 个改哪一类错**:只 1 类
输出前自检:含"保证/月入 X 万"等红线词强制"不可用";事实错 ≥2 期未改强制扣;质检 <5 分钟强制提醒;翔宇红线不允许;读者指出的错必须改。
## 硬约束 · 拒绝场景
遇到下面这些情况直接拒绝:草稿含"保证 X""一周 100 订阅"等红线;字段全空或仍是 `___` 占位符;让你帮"跳过质检直接发"(强制至少过 1 关);要求"AI 准确率达 95% 就免审"(必须人工);要求伪造数据/截图。先给结论
NewsletterAI 输出质检技能要先回答五个问题:
| 问题 | 要判断 |
|---|---|
| 用户是谁 | 是否真有这个任务和场景 |
| 输入是什么 | 材料、数据、账号、参考是否足够 |
| 交付什么 | 文件、流程、样品或结果是否可检查 |
| 风险在哪 | 邮件许可、内容承诺不稳、流失、赞助错配和退订体验是否已暴露 |
| 下一步是什么 | 继续、补证据还是暂停 |
新手不要用热情替代判断。这个阶段最容易出错的地方,是把"我会工具"误读成"我能交付"。真正要检查的是:输入是否清楚、交付物是否可用、边界是否写明、风险是否能被发现。如果这些问题答不上来,先补材料,不要急着放大。
这张图把"AI 起草 → 5 类必查 → 3 档人工兜底"串成一条质检链。涉支付 / 法律 / 医疗的句子永远在最高风险档,必须人工改写,不能交给 AI 自审。
AI 输出质检技能先服务真实任务
Newsletter的AI 输出质检技能,不是为了显得更专业,而是为了让愿意持续阅读、回复或付费的订阅者能在真实任务里得到可检查的结果。它应该服务一个真实任务:让用户从不确定状态,进入能判断、能执行、能复盘的状态。
、、给这类文章的共同启发是:专业能力不是堆概念,而是把模糊问题整理成可执行流程。对Newsletter来说,这意味着每个动作都要有输入、输出和验收。
如果你只写“做得更好”“提升效率”“扩大影响”,客户或用户很难行动。更好的写法是:本周收集哪些材料,做出哪个样品,用什么表检查,出现哪些红灯就暂停。
新手先收窄场景
不要同时服务所有人。先选择一个更窄场景,例如一类用户、一种交付物、一个平台或一个业务阶段。场景越窄,例子越具体,风险也越容易提前发现。
如果你发现文章或方案可以套到任何行业,通常说明它还不够具体。把对象、材料、工具、交付和复盘都写具体,才会真正帮助新手。
第 1 步:5 类 AI 输出必查项盘点
先写一句话:
我这次要帮助 ___ 在 ___ 场景下,用 ___ 材料,完成 ___ 结果。这句话写不出来,后面所有动作都会漂。目标不清,会导致样品不清;输入不清,会导致 AI 输出不稳;用户不清,会导致页面和交付无法聚焦。
| 字段 | 填写方式 |
|---|---|
| 目标用户 | 愿意持续阅读、回复或付费的订阅者 |
| 当前任务 | 让模型结果经过事实、语气和边界检查 |
| 已有输入 | 原话、样品、数据、链接、旧流程 |
| 交付结果 | 读者画像、样刊、欢迎流、选题库、赞助包和留存复盘 |
| 红灯 | 邮件许可、内容承诺不稳、流失、赞助错配和退订体验 |
这一步不要让 AI 替你编材料。AI 可以整理你给出的信息,但不能证明用户真的存在,也不能确认平台和支付规则。
输入材料的最低线
至少要有三类材料:用户原话、当前样品或旧流程、执行平台或工具入口。只有想法,没有材料,就先做研究和访谈;只有工具,没有用户任务,也不要急着交付。
第 2 步:3 档人工兜底强度判定
判断表要让你知道现在该继续还是暂停。
| 判断项 | 绿灯 | 黄灯 | 红灯 |
|---|---|---|---|
| 需求 | 多个来源指向同一任务 | 只有兴趣,没有行动 | 没有真实用户材料 |
| 输入 | 材料完整,来源清楚 | 缺少部分字段 | 材料不可用或不授权 |
| 交付 | 能写成文件和验收 | 交付形式还模糊 | 只能靠口头解释 |
| 风险 | 有边界和核验入口 | 有未确认字段 | 涉及违规、侵权或敏感权限 |
| 复盘 | 有数据和原话 | 只有感觉 | 无法判断结果 |
表格不是为了好看,而是为了停止错误动作。很多失败不是因为执行不努力,而是黄灯和红灯被忽略。
反证也要写
判断表里要保留反证。比如用户不愿提供材料、只想免费试做、平台规则不清、工具能力未核验、交付后支持压力过高。反证能帮你避免把小问题做大。
第 3 步:跑 4 项发刊前红线检查
最小样品或流程要足够小,但必须真实。
| 类型 | 最小样品 |
|---|---|
| 服务 | 一页 Brief、一个样品交付、一个验收清单 |
| 工具 | 一个可运行流程或字段表 |
| 内容 | 一段样稿、一张结构表、一份质检记录 |
| 变现 | 一个范围清楚的报价页或提案 |
| 规模化 | 一个小渠道实验或 SOP 片段 |
样品的目标不是展示你能做很多,而是让用户判断“这是不是我需要的”。如果样品需要你在旁边解释很久,就说明它还不够清楚。
做完样品后,至少找一个真实用户或旧客户看。只听赞美没有用,要问他哪里不懂、哪里有风险、是否愿意进入下一步。
样品要有退出条件
如果样品没人看、看了没人问、问的问题都和目标不相关,就不要继续加大投入。先回到目标、用户和输入,重新判断场景是否成立。
第 4 步:跨期质检模板沉淀
风险检查要放在交付前,而不是出了问题以后。
| 风险 | 检查动作 |
|---|---|
| 平台规则 | 到官方帮助中心或后台核验 |
| 支付退款 | 看平台和支付工具当天规则 |
| 版权隐私 | 检查素材、案例、截图和客户数据 |
| 账号权限 | 只拿必要权限,优先用测试数据 |
| 过度承诺 | 删除不可控结果,补适用边界 |
邮件许可、内容承诺不稳、流失、赞助错配和退订体验都不是小细节。新手越想快点完成,越容易跳过这些检查。真正专业的做法,是把未确认字段写出来,而不是假装已经知道。
边界要写给用户看
边界不要藏在脑子里。哪些不包含、哪些需要客户提供、哪些需要执行当天核验、哪些结果不承诺,都要写进页面、提案或交付说明。
第 5 步:本期质检事故沉淀进 prompt
复盘要落到下一步,不要只写感想。
| 发现 | 下一步 |
|---|---|
| 用户任务清楚 | 继续做完整版本或下一篇教程 |
| 输入材料缺失 | 先补访谈、样品或官方核验 |
| 支持问题重复 | 回写 FAQ、模板或 SOP |
| 风险未确认 | 暂停发布或暂缓报价 |
| 反馈分散 | 收窄用户和场景 |
复盘时要同时看行为和原话。行为告诉你用户做了什么,原话告诉你为什么可能这样做。只看其中一个,都容易误判。
如果复盘后没有产生新动作,说明复盘还停在总结层。好的复盘应该让下一步更小、更清楚。
操作检查表
| 字段 | 填写 |
|---|---|
| 当前主题 | NewsletterAI 输出质检技能 |
| 目标用户 | 愿意持续阅读、回复或付费的订阅者 |
| 关键输入 | ___ |
| 最小样品 | ___ |
| 主要风险 | 邮件许可、内容承诺不稳、流失、赞助错配和退订体验 |
| 官方核验入口 | ___ |
| 复盘指标 | 用户原话、样品行为、交付问题、下一步动作 |
| 当前判断 | 继续 / 补证据 / 暂停 |
这张表可以直接复制到你的项目文档里。每完成一轮,就更新一次,不要只靠记忆。
AI 怎么辅助
AI 适合做这些:
- 把用户原话整理成问题分类。
- 生成 Brief、检查表、SOP 或复盘表。
- 标出未确认字段和风险点。
- 改写页面、提案或交付说明。
- 把反馈转成下一步动作。
AI 不适合替你确认平台规则、支付退款、客户授权、隐私边界和真实购买意愿。没有证据时,必须写未确认。
让 AI 辅助时,不要只问“怎么做”。要给它材料、目标、约束和当前判断,让它帮你找遗漏。
官方资料与核验口径
平台规则、算法动向、报价规则、政策口径都会变化。本文保留的是可迁移的判断框架,具体数字一律给区间。
跨平台核验入口:
- Substack — 看付费订阅 newsletter 的费率与作者规范
- beehiiv — 看 beehiiv 广告、推荐与分销规则
- 小报童 — 看中文付费专栏定价与运营规则
- ConvertKit — 看创作者订阅 / 自动化邮件最佳实践
涉及具体数据、比例、报价区间的部分,以执行当天后台为准。
常见问题
这篇适合完全新手吗?
适合。你只需要先填目标、用户、输入、样品和风险五个字段,不需要一次做完整系统。
没有数据还能执行吗?
可以做研究和样品,但不要写成确定结论。没有真实用户行为时,先标记未确认。
AI 能不能直接替我做判断?
不能。AI 可以整理材料和提醒风险,最终判断要回到真实证据、官方入口和人工复核。
什么时候暂停?
当用户不存在、材料不可用、平台规则不清、风险无法控制或交付必须靠猜时,先暂停。
执行前至少核验:
- Stripe 官方文档 → 海外订阅与支付规则
- Shopify 帮助中心 → 电商运营与店铺合规
- Buy Me a Coffee → 创作者付费墙参考