WangDL 5c3f493071 docs(startup-plan): 重构项目文档结构,整合所有产品决策
- 删除旧版 v0.1 规划,只保留完全版
- 更新全部 7 大模块文档,补充具体决策和实操内容
- 新增 AI架构设计、营销冷启动调研方案、客服设计详案等子文档
- 新增 潜在问题清单(56项技术+方向问题)
- 整理图片到 images/ 目录
2026-05-12 17:07:28 +08:00

565 lines
10 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

下面这段可以直接写进你的项目文档里。
---
# 知习 AI 工作流与学习 Agent 设计总结
## 一、核心原则
知习的 AI 能力不应该是一套通用聊天接口,也不应该所有业务都共用同一套 AI 工作流。
更合理的设计是:
```text
以产品业务流程为主导
按业务场景划分 AI 工作流
按任务复杂度选择模型
用用户学习画像实现“越用越懂你”
后期再演进为受控的学习 Agent
```
当前阶段不建议一开始就做完全自治 Agent也不建议为每个用户单独部署一个真实 Agent 进程。
更合理的是:
```text
统一 AI Workflow Engine
+ 每个用户独立的学习画像
+ 每个用户独立的长期学习记忆
+ 可复用的 Prompt / Skill / Workflow
= 逻辑上的个人学习 Agent
```
用户感知上可以是“我的专属学习 Agent”但技术实现上不应该是一人一个独立运行的 Agent。
---
## 二、为什么不能所有业务共用一套 AI 工作流
知习里的 AI 任务类型差异很大。
例如:
```text
知识导入
主动回忆分析
费曼解释分析
待巩固项生成
复习卡片生成
长期学习趋势分析
后台风控和成本监控
```
这些任务的输入、目标、模型要求、成本要求都不同。
所以不应该设计成:
```text
所有任务 → 同一个 Prompt → 同一个模型 → 同一种分析结果
```
而应该设计成:
```text
不同业务场景 → 不同 AI Workflow → 不同模型策略 → 不同结构化输出
```
---
## 三、业务分级工作流设计
### 1. 知识导入工作流
目标:把用户输入的内容整理成可学习结构。
```text
上传文档 / 输入内容
→ 文本提取
→ 内容清洗
→ 知识点切分
→ 生成标题 / 摘要 / 标签
→ 用户确认
→ 入库
```
适合模型:
```text
便宜模型
中档模型
规则代码
```
不需要一开始就使用最强模型。
---
### 2. 主动回忆分析工作流
目标:判断用户是否真正理解知识点。
```text
用户提交主动回忆回答
→ 检查回答质量
→ 提取回答覆盖的要点
→ 对比知识点关键点
→ 判断理解程度
→ 找出遗漏 / 误解 / 模糊表达
→ 生成待巩固项
→ 生成复习建议
→ 保存结构化分析结果
```
这是知习最核心的 AI 工作流之一,应该使用主力模型。
适合模型:
```text
主力模型
强模型
必要时结合便宜模型做预处理
```
注意:便宜模型可以做清洗和提取,但核心判断最好由主力模型完成。
---
### 3. 复习工作流
目标:低成本、高频地帮助用户完成间隔复习。
```text
读取到期复习项
→ 生成复习卡片
→ 用户回答
→ 判断掌握情况
→ 更新复习状态
→ 更新 nextReviewAt
```
适合模型:
```text
规则算法
便宜模型
中档模型
少量核心判断使用主力模型
```
复习工作流不应该每一步都调用强模型,否则成本会过高。
---
### 4. 长期学习分析工作流
目标:根据用户一段时间内的学习数据,生成趋势分析和改进建议。
```text
读取最近 7 / 30 天学习记录
→ 统计主动回忆表现
→ 统计薄弱点类型
→ 识别重复错误
→ 分析复习完成率
→ 生成阶段性学习报告
→ 给出下一阶段建议
```
这个工作流可以异步执行,不需要用户实时等待。
适合模型:
```text
中档模型
主力模型
异步队列
```
---
### 5. 后台风控与成本分析工作流
目标:控制 AI 成本、监控异常调用、辅助后台运营。
```text
统计 AI 调用次数
→ 计算 token 和成本
→ 识别异常用户
→ 识别高失败率任务
→ 生成后台告警
→ 辅助管理员排查问题
```
这个工作流主要靠规则和数据库统计,不一定需要强模型。
---
## 四、模型选择原则
模型选择不应该按“哪个最强”来决定,而应该按任务分级。
可以分成四类:
```text
轻任务:便宜模型
核心分析:主力模型
复杂推理:强模型
后台异步任务:可低优先级慢慢跑
```
例如:
```text
简单数据清洗、摘要、标签提取:
使用便宜模型或规则代码。
主动回忆薄弱点分析:
使用 DeepSeek V4 Pro / V4 Flash 这类主力模型。
长期学习趋势分析:
可以异步使用主力模型。
复习卡片生成:
可以使用中档模型或便宜模型。
```
关键原则:
```text
便宜模型负责客观提取和清洗
主力模型负责学习判断和薄弱点诊断
强模型必须能看到原始证据,不能只依赖便宜模型的二次总结
```
避免这种高风险流程:
```text
用户原始回答
→ 便宜模型总结
→ 强模型只看总结后做判断
```
更安全的是:
```text
用户原始回答
+ 知识点原文 / 关键点
+ 便宜模型提取结果
→ 主力模型综合判断
```
---
## 五、用户数据不足时怎么处理
第一版不应该依赖“海量用户数据”。
要区分三种分析:
### 1. 单次回答分析
不需要大量用户数据。
依赖的是:
```text
知识点内容
用户本次回答
知识点关键要点
AI 分析规则
```
这个阶段现在就能做。
---
### 2. 个人学习趋势分析
不需要大量平台用户,但需要同一个用户自己的历史数据。
依赖的是:
```text
最近学习记录
主动回忆提交次数
AI 分析评分变化
待巩固项变化
复习完成率
重复出现的薄弱点
```
这个需要用户持续使用一段时间后才能更准确。
---
### 3. 群体级智能优化
这个需要大量用户数据。
例如:
```text
基于大量用户优化学习路径
预测某类知识点常见错误
优化复习算法
做人群画像
优化会员转化
```
这不是第一版重点。
第一版应该聚焦:
```text
基于用户自己的知识内容、主动回忆回答、AI 分析结果和复习表现,逐步形成个人学习画像。
```
---
## 六、用户学习画像设计
知习后期所谓“个人 Agent 成长”,不应该理解为模型自己训练升级,而应该理解为系统持续积累用户学习画像。
可以记录:
```text
用户常见薄弱类型
用户常错知识点
用户复习完成率
用户主动回忆平均得分
用户偏好的解释方式
用户经常缺失的回答类型
用户最近学习强度
用户重复出现的错误模式
```
这些数据可以组成:
```text
UserLearningProfile
```
有了这个画像后,系统可以逐步做到:
```text
分析时更关注用户常犯错误
复习时优先安排重复薄弱点
生成解释时适配用户偏好
学习报告更贴近用户真实表现
```
这就是“学习 Agent 越来越懂用户”的基础。
---
## 七、Agent 设计原则
知习后期可以做 Learning Agent但应该是受控 Agent不是完全自治 Agent。
推荐定义:
```text
Learning Agent
= 业务工作流
+ 用户学习画像
+ 长期学习记忆
+ 工具调用能力
+ 结构化输出
+ 权限控制
+ 成本控制
+ 审计日志
```
Agent 可以做:
```text
分析用户回答
发现薄弱点
生成待巩固项
安排复习建议
追踪重复错误
生成阶段性学习报告
```
Agent 不应该随意做:
```text
自动删除用户知识库
自动修改订阅
自动退款
自动封号
自动无限调用 AI
自动访问其他用户数据
```
所有关键操作都必须有权限控制、日志记录和后台审计。
---
## 八、推荐演进路线
### V0固定业务工作流
先不做 Agent。
只打通最核心的一条链路:
```text
用户提交主动回忆回答
→ AI 分析理解程度
→ 生成待巩固项
→ 生成复习建议
→ 记录 token 和费用
→ 前端展示结果
```
---
### V1用户学习画像
开始记录用户长期学习表现。
```text
薄弱点类型
复习完成率
主动回忆得分
重复错误
知识点掌握变化
```
这时系统开始具备“越来越懂用户”的基础。
---
### V2逻辑 Learning Agent
在统一工作流引擎上加载用户画像和历史记忆。
```text
统一 Workflow Engine
+ 用户学习画像
+ 用户历史学习记录
+ 用户薄弱点
= 用户专属学习 Agent 体验
```
对用户来说,它像一个个人学习 Agent。
但技术上不是每人一个独立进程,而是共享引擎 + 用户级记忆。
---
### V3受控技能成长
后期可以引入类似 Agent Skill 的能力。
但不要让 Agent 自由生成并上线技能,而应该:
```text
系统生成候选 Skill
→ 后台审核
→ 灰度发布
→ 监控效果
→ 正式启用
```
这样既能成长,又能保持产品稳定和安全。
---
## 九、后端概念设计
后端可以逐步抽象出三个核心概念:
```text
Workflow业务工作流
AgentProfile用户学习画像
Skill可复用分析策略
```
可以预留的数据结构方向:
```text
ai_workflows
- id
- key
- name
- businessType
- version
- status
ai_workflow_steps
- id
- workflowId
- stepKey
- modelTier
- promptKey
- order
- inputSchema
- outputSchema
user_learning_profiles
- userId
- weakTypes
- preferredExplanationStyle
- recallAccuracyAvg
- reviewCompletionRate
- repeatedMistakes
- updatedAt
ai_skills
- id
- key
- description
- workflowKey
- version
- isActive
- source
- createdAt
```
第一版不一定全部建表,但设计上要预留这些方向。
---
## 十、当前最应该落地的第一版
当前不应该一上来做完整 Agent 系统。
第一版最适合落地的是:
```text
主动回忆分析 Workflow V1
+ AI Usage Logs
+ Prompt Version
+ Structured JSON Result
+ User Learning Profile V1
```
具体流程:
```text
1. 用户提交主动回忆回答
2. 后端保存原始回答
3. 规则检查回答是否为空、过短、重复
4. 便宜模型或规则提取回答覆盖点
5. 主力模型分析薄弱点和理解程度
6. 返回结构化 JSON
7. 生成待巩固项
8. 生成复习建议
9. 记录模型、token、费用、耗时、promptVersion
10. 更新用户学习画像
11. 前端展示 AI 分析结果
```
这条链路跑通后,知习就不再是一个 AI 聊天壳,而是开始具备真正的主动学习系统能力。
---
## 一句话总结
```text
知习的 AI 设计应该从“业务分级工作流”开始,而不是一开始做完全自治 Agent后期通过用户学习画像、长期记忆和受控 Skill 系统,逐步演进成每个用户感知上的专属学习 Agent。
```
这个方向也符合当前项目阶段:现在最重要的是先把 iOS App 和后端真实打通,并围绕最小学习闭环逐步接入真实 AI 分析能力。