“生化危机”女主用Claude手搓满分AI,一年0.7美元反杀大厂

背景:AI记忆系统成为瓶颈

  • AI在对话过程中存在“健忘”问题,每次新开会话都会丢失历史信息,影响长期项目协作与用户体验。
  • 当前主流大模型依赖云端存储或外部数据库,不仅成本高昂,而且隐私与数据控制权难以保障。
  • MemPalace项目源于Milla与工程师Ben Sigman对AI“缺乏灵魂与积累”的反思,最终孵化为全球首个满分通过长期记忆基准测试的AI记忆系统。

技术亮点:记忆宫殿结构化方法

MemPalace的核心灵感来自“记忆术”(Method of Loci)——一种古老的思维组织技巧。

  • 层级结构
    • 翼楼(Wing):代表项目、人物或主题。
    • 房间(Room):按功能分类,如“认证系统”、“数据库选型”。
    • 走廊(Hall):连接不同房间,表示记忆之间的关系。
    • 衣柜(Closet):摘要索引。
    • 抽屉(Drawer):保存原始对话内容。

“生化危机”女主用Claude手搓满分AI,一年0.7美元反杀大厂

  • 本地化存储

    • 所有记忆存储于本地ChromaDB,无需调用API或上云。
    • 提高数据隐私性,降低使用成本。
  • AAAK格式

    • 所有记忆以结构化文本(AAAK)存储,适用于任何主流大模型(如Claude、GPT、Gemini)。
    • AAAK可被模型直接解析,无需解码器或微调。

测试成绩:LongMemEval满分刷屏SOTA

  • 在最严苛的长期记忆评估基准LongMemEval中,MemPalace以500题全对的成绩,首次实现AI记忆系统满分。
  • 在22,000+条真实对话数据中测试,原始搜索召回率为60.9%,通过翼楼+房间过滤后提升至94.8%。
  • 这一成绩打破了由各大厂主导的AI记忆系统测试记录,成为当前AI记忆能力的新标杆。

成本优势:一年仅需0.7美元

  • MemPalace每次启动仅加载170个token的关键事实,大幅减少计算资源消耗。
  • 数据存储和检索均在本地完成,避免了传统AI模型频繁调用API产生的高昂费用。
  • 项目成本极低,仅需每年0.7美元即可维持一个大模型的永久记忆能力。

社区反响与项目争议

  • MemPalace发布后迅速在GitHub上获得关注,17.9k星标、2k Fork,引发广泛讨论。
  • 有开发者指出,AAAK为有损压缩,LongMemEval中AAAK模式仅获得84.2%的成绩。
  • 项目曾被质疑“自动做事实校验”和“30倍无损压缩”,作者主动发布公开信澄清并修改描述。
  • 尽管存在争议,但其本地免费、隐私保护和高效记忆等核心优势仍被广泛认可。

项目意义与未来展望

  • MemPalace的出现证明:小团队、低成本也能做出领先大厂的技术成果
  • 该系统不仅为AI提供永久记忆能力,还为AI协作、项目管理、知识存储开辟了新路径。
  • Milla Jovovich与Ben Sigman的跨界合作,打破了传统认知中AI开发仅限技术圈的界限。
  • 随着社区的深入参与,MemPalace有望演化为AI长期记忆系统的基础框架之一。