RAG 不是记忆
当前 AI 产品中"记忆"这个词被严重滥用。
大多数所谓的"AI 记忆"本质上是 RAG(Retrieval-Augmented Generation):
- 存一堆文档 → 查询时检索相关片段 → 塞入 prompt
这不是记忆。这是每次对话都重新翻一遍笔记本。
真正的记忆应该有什么特征?
- 分层: 工作记忆 vs 长期记忆 vs 程序记忆
- 遗忘: 不重要的会衰减
- 关联: 记忆之间有连接
- 进化: 对同一事物的理解会随时间深化
The Trinity:三位一体架构
Mindbase 的核心设计是 Brain/Body/Memory 三层:
Brain: 定义"如何思考"
Brain 不存数据——它定义对数据的理解方式:
| 组件 | 职责 | 类比 |
|---|---|---|
| Taxonomy | 事实的分类体系 | "这属于什么类型的知识" |
| Optimization | 认知策略优化 | "什么时候该召回什么" |
| Reasoning | 推理模式 | "从已知推导未知" |
关键设计: Brain 不是固定的——它会根据用户的使用模式自我调整。如果某类知识被频繁使用,Brain 会调高它的权重。
Body: 定义"如何行动"
Body 是执行层——把 Brain 的认知决策变成具体操作:
- Runtime Agents: 在不同场景中执行不同策略的代理
- Behavior Graph: 用图结构编排复杂的多步行为
- 对话管理: 管理上下文窗口和记忆注入
Memory: 定义"如何记忆"
Memory 是存储层——但不只是"存":
九类事实模型
Mindbase 从用户交互中提取 9 类事实:
| 类型 | 说明 | 示例 |
|---|---|---|
| Preference | 偏好 | "喜欢简洁的代码风格" |
| State | 当前状态 | "正在做 AI 训练营" |
| Goal | 目标 | "Q3 要完成设计系统" |
| Decision | 决策 | "选择 Vue 而不是 React" |
| Experience | 经验 | "限流第一天就要加" |
| Relationship | 关系 | "和某人是合作关系" |
| Knowledge | 领域知识 | "知识图谱用三元组表示" |
| Habit | 习惯 | "每天早上先看日历" |
| Context | 情境 | "在某企业做一线经理" |
每次对话都在积累事实 — 不是用户主动"存",是系统自动"学"。
时间衰减:让 AI 学会遗忘
为什么需要遗忘? 因为:
- 人的状态会变("正在做 X" 三个月后可能已经不做了)
- 偏好会变("喜欢极简风格" 可能演化为"需要更多细节")
- 过时信息会干扰决策
时间衰减 + 重新使用重置权重 = 自然的知识演化。
混合检索:不只是向量搜索
检索记忆时不用单一方法——混合三种:
| 方法 | 优势 | 劣势 |
|---|---|---|
| 向量检索 | 语义相似性好 | 精确匹配差 |
| 关键词检索 | 精确 | 不理解语义 |
| 时间权重 | 偏好新鲜信息 | 可能错过重要旧信息 |
最终排序 = relevance_score × freshness_score × usage_frequency
和个人 AI 工作台的关系
Mindbase 和我的工作台是互补关系:
| 维度 | 工作台 | Mindbase |
|---|---|---|
| 数据模型 | 结构化文件 (Markdown+YAML) | 事实图谱 (Graph) |
| 存储方式 | 文件系统 | 数据库 (向量+图) |
| 适用场景 | 确定性管理流程 | 模糊的个人认知 |
| 查询方式 | grep + 路径 | 语义检索 + 推理 |
工作台管确定的事(项目状态、会议记录、人员档案)。 Mindbase 管模糊的事(个人偏好、经验教训、渐进式理解)。
设计原则
| 原则 | 说明 |
|---|---|
| 分层而非平铺 | 不同类型的记忆用不同策略 |
| 自动提取 | 用户不需要主动"保存",系统自动学习 |
| 时间感知 | 记忆有新鲜度,旧的自然衰减 |
| 可验证 | 每条事实可追溯到来源对话 |
| 隐私本地 | 核心数据不离开本地 |
核心洞察:AI 的"记忆"不应该是"一个大搜索引擎"——它应该像人的记忆一样有层次、有遗忘、有关联、有进化。Mindbase 的 Trinity 架构试图让 AI 不只是"存了你说过的话"——而是真正"理解了你是谁"。