给管理者设计一个主动型 AI 助手：从产品思考到 POC

市面上的 AI 助手都是"你问我答"——用户发起对话，AI 做出响应。

但管理者的日常不是这样的。他们需要有人主动提醒哪些数据异常了、主动推送明天汇报需要的材料、主动判断什么时候该打扰你。

这篇文章记录了我设计一个"主动型 AI 助手"产品的完整思考过程。从产品定义到架构设计，从用户故事到商业模式，从 POC 规划到风险评估。

产品定义

一句话定义：用户专属的工作管家，根据所掌握的数据，主动跟用户进行对话。

关键词拆解：

专属——不是通用助手，而是为某一个人服务的"分身"
主动——不等用户提问，而是根据自己的判断选择沟通时机
对话——以自然语言为主要交互方式
适应——根据对话历史不断调整沟通方式、侧重点和频率

这个产品我暂时叫它 Companion。选这个名字是因为它表达的是"私人的、值得信赖的、长期陪伴的"。在产品没成熟之前，可能需要一个更克制的名字（比如 WorkMate），避免用户觉得被"过度干预"。

解决什么问题

管理者每天面对大量的信息、数据和决策。他们需要：

从碎片中提炼——20 个人的工时、多个项目的预算、各种系统的数据，散落在不同的地方
在正确的时间获得正确的信息——不是每天打开 10 个系统看数据，而是在需要的时候被推送
有人帮忙"盯着"——项目超支了没？有人忘记提交周报了没？哪些指标在恶化？

用户故事

用两组对比来说明这个产品想达到的效果：

没有助手时

一名管理者需要在周一检查团队的工时填写情况。经过对 20 个人逐一查看，发现有人填多了、有人没填写。逐一提醒后，忘了一个人，又忘记复查。下周同样的问题依然存在。

周二要汇报，汇报前才发现上周的资源数据不对，需要到多个系统分别查数据汇总，手忙脚乱。

项目投入即将超支，每天去看经营看板，但难以判断在哪里止损。

有了助手后

周五，助手在约定时间发消息，说明当前团队填写情况，并询问是否需要直接提醒未填写的人。当所有人填完，助手通知管理者。到了周一如果还有人没填，助手再次提醒。并记录每个人忘记填写的次数——当次数达到一定阈值，主动向管理者建议是否需要沟通。

第一次准备汇报材料时，管理者告诉助手模板要求。助手说明哪些数据能自动获取、哪些需要人工补充。后续再需要准备材料，助手会在约定时间主动发送。

项目有超支趋势时，助手主动询问是否需要关注。如果管理者说不用，助手会问"到什么程度需要关注"，然后在达到阈值时再次提醒。如果管理者说完全不用关注，助手就不会再打扰。

核心设计思路：拟人

这个产品最核心的设计理念是拟人——不是技术层面的拟人（语气像人），而是行为层面的拟人（判断像人）。

市面上打着"主动"卖点的 AI，更多是在闲聊层面做到了"可以主动搭话"。每次对话不具备智能的延续性，每次都是一段短期记忆范围内的交互。

我的设计关注的周期是无限长——助手在任意时间都可以基于对用户的长期理解做出判断。比如：

用户第二天要请假，但每天有阅读财务报表的习惯。助手主动问：请假这天还要推送报表吗？
假期回来后，助手推送报表的同时，附上前一天管理者可能关心的事项

为什么不用模型微调

理论上，通过不断微调大模型也能达到类似的"拟人"效果。但成本、时效和变更三个维度都有问题：

维度	模型微调	动态偏好方案
成本	企业级微调 50~100w+，个人更不可控	应用层技术 + API 调用
时效	训练周期长，环境可能在训练完前就变了	准实时更新
变更	工作内容变化需重新训练	数据库记录可低成本裁剪和迁移

关键区别在于：微调把"个性化"固化在模型里，而这个方案把"个性化"放在可操作的数据库里。人员离职，微调的模型变成沉没成本；而数据库里的偏好记录可以被迁移或销毁。

产品架构

产品设计中，因为涉及 Agent 的存在，可能有多个大模型协作。为了减少对用户的打扰：

单次对话尽可能少地调用 Agent
多 Agent 任务时，每个 Agent 完成后跟用户确认结果
已确认的节点在后续对话中跳过

POC 阶段的关键技术点：

Prompt 设计（长期关键成功要素）
模型的结构化输出（POC 关键成功要素）
向量数据库存储用户偏好
使用 LangChain 或 PydanticAI 确保结构化数据质量

分阶段规划

POC：概念验证（~1 个月）

提供一个飞书/企微机器人，让 2-3 名用户加入测试
给机器人提供特定领域的业务数据
必须验证：助手能否自主定义有效的事务规则
对话意外终止占比 < 10%
至少 1 名用户表示愿意继续

成熟产品：某个角色的分身

支持更多用户选择性添加
可以注入到内部任意系统，共享用户的权限
丰富工具池，让助手更"有用"
性能和成本优化

长期产品：和员工"共同工作"

设备级行为同步（员工选择哪些可被观察）
多重人格（不同场合不同话术）
伦理挑战：隐私、组织滥用、员工离职后分身的归属权

商业模式思考

场景	定价策略
企业内部	按月付费（鼓励快速形成"人格"）或按资源用量
ToB	隔离部署，闭源售卖 + 付费售后
ToC	流量计费，等待大模型成本下降

核心成本来自三个方面：大模型 token、数据库存储、服务器资源。

局限性

诚实地说：

大模型是大脑——产品的上限取决于模型能力的演进
冷启动期——新用户需要"磨合"时间，这段时间助手可能显得"低智"
上下文窗口——长期记忆的有效管理是持续挑战
隐私侵入性——如果应用不当可能引发用户反感
市面上没有类似产品的原因——大模型的易用性是近一年才普及的；面向个人的产品如果做得不够好，很难被接受

风险评估

最大的两个风险：

成本风险：主动型助手的 token 消耗远大于被动问答型。数据维护量也更大。好消息是这两个成本都在快速下降。
隐私风险：自驱的助手需要收集大量数据和用户习惯，可能触发隐私问题。需要脱敏方案和免责协议。

如果这个方案可行，它可能会改变一些事情：企业会更偏向结构化数据建设而非体验建设；员工可能会因为花了精力培养一个独一无二的合作伙伴，而把它当作留下来的重要理由。

当然，这也可能带来新的问题——当 AI 真的变成了你的"分身"，你和它之间的关系该怎么定义？

这个问题，可能需要比技术更长的时间来回答。