“生化危机”女主用Claude手搓满分AI,一年0.7美元反杀大厂
背景:AI记忆系统成为瓶颈
- AI在对话过程中存在“健忘”问题,每次新开会话都会丢失历史信息,影响长期项目协作与用户体验。
- 当前主流大模型依赖云端存储或外部数据库,不仅成本高昂,而且隐私与数据控制权难以保障。
- MemPalace项目源于Milla与工程师Ben Sigman对AI“缺乏灵魂与积累”的反思,最终孵化为全球首个满分通过长期记忆基准测试的AI记忆系统。
技术亮点:记忆宫殿结构化方法
MemPalace的核心灵感来自“记忆术”(Method of Loci)——一种古老的思维组织技巧。
- 层级结构:
- 翼楼(Wing):代表项目、人物或主题。
- 房间(Room):按功能分类,如“认证系统”、“数据库选型”。
- 走廊(Hall):连接不同房间,表示记忆之间的关系。
- 衣柜(Closet):摘要索引。
- 抽屉(Drawer):保存原始对话内容。

-
本地化存储:
- 所有记忆存储于本地ChromaDB,无需调用API或上云。
- 提高数据隐私性,降低使用成本。
-
AAAK格式:
- 所有记忆以结构化文本(AAAK)存储,适用于任何主流大模型(如Claude、GPT、Gemini)。
- AAAK可被模型直接解析,无需解码器或微调。
测试成绩:LongMemEval满分刷屏SOTA
- 在最严苛的长期记忆评估基准LongMemEval中,MemPalace以500题全对的成绩,首次实现AI记忆系统满分。
- 在22,000+条真实对话数据中测试,原始搜索召回率为60.9%,通过翼楼+房间过滤后提升至94.8%。
- 这一成绩打破了由各大厂主导的AI记忆系统测试记录,成为当前AI记忆能力的新标杆。
成本优势:一年仅需0.7美元
- MemPalace每次启动仅加载170个token的关键事实,大幅减少计算资源消耗。
- 数据存储和检索均在本地完成,避免了传统AI模型频繁调用API产生的高昂费用。
- 项目成本极低,仅需每年0.7美元即可维持一个大模型的永久记忆能力。
社区反响与项目争议
- MemPalace发布后迅速在GitHub上获得关注,17.9k星标、2k Fork,引发广泛讨论。
- 有开发者指出,AAAK为有损压缩,LongMemEval中AAAK模式仅获得84.2%的成绩。
- 项目曾被质疑“自动做事实校验”和“30倍无损压缩”,作者主动发布公开信澄清并修改描述。
- 尽管存在争议,但其本地免费、隐私保护和高效记忆等核心优势仍被广泛认可。
项目意义与未来展望
- MemPalace的出现证明:小团队、低成本也能做出领先大厂的技术成果。
- 该系统不仅为AI提供永久记忆能力,还为AI协作、项目管理、知识存储开辟了新路径。
- Milla Jovovich与Ben Sigman的跨界合作,打破了传统认知中AI开发仅限技术圈的界限。
- 随着社区的深入参与,MemPalace有望演化为AI长期记忆系统的基础框架之一。