流式意图检测+永久记忆,NUS&NTU发布Pask:把贾维斯AI拉进现实
近年来,人工智能代理(AI Agent)的发展逐步从“被动响应”转向“主动理解”,以更贴近人类交互方式的方式提供服务。新加坡国立大学(NUS)和南洋理工大学(NTU)联合发布的新项目Pask,正是这一趋势的前沿代表。该研究提出了一个全新的通用范式,旨在将传统的大语言模型从被动问答模式升级为主动智能代理,核心在于流式意图检测(Streaming Intent Detection)与长期记忆机制(Long-term Memory Mechanism)的结合。
核心架构:三大模块构建主动智能代理
Pask系统由三个核心模块构成,分别为:
-
需求检测模块(Demand Detection, DD)
作为整个系统的第一步,也是最核心的模块,DD通过实时感知用户行为,例如语音、文字输入、甚至视觉信息,来识别用户当前可能存在的隐性或显性需求。例如,当用户听到一个陌生术语时,系统能即时识别并主动解释。 -
长期记忆模块(Memory Module, MM)
MM负责存储和管理用户的个性化信息,随着时间推移不断更新和进化,形成“长期上下文”。这种记忆不仅包括用户的基本信息,还能记录用户的行为模式、偏好、历史对话等内容,使AI能够“越来越懂你”。 -
主动系统模块(Proactive Agent System, PAS)
PAS作为底层执行逻辑,持续运行并协调DD和MM,确保系统在没有用户明确提问时也能主动提供有用信息或建议。例如在用户查阅某篇论文时,PAS可能自动推荐相关研究或解释术语。
技术突破:实时感知与深度个性化
传统AI代理通常依赖用户的显式输入(如提问、指令),而Pask突破性地实现了流式意图检测,即通过持续监听用户行为,预测并响应其潜在需求。这种机制使得AI可以在用户尚未“说出口”之前,就进行有意义的干预。

与此同时,永久记忆机制的引入让用户数据不再只是短期缓存,而是形成持续积累的个人知识图谱。研究强调,Pask并非构建一个独立的记忆库,而是作为用户个人知识的统一入口和协同代理层,实现对多平台、多设备数据的智能编排。
这种结合意味着,Pask可以在多个场景中提供无缝的主动服务,例如:
- 用户观看视频时,AI能实时检测其注意力变化并解释关键信息。
- 在阅读过程中,AI能预判用户可能的疑问并自动提供注解。
- 对话中,AI不仅响应问题,还能根据记忆主动提出有价值的观点。
应用前景与行业影响
Pask的提出为多个领域带来了新的可能性:
- 教育领域:在语言学习或课程理解中,AI能根据学习者的习惯与进度,提供定制化提示和内容。
- 医疗健康:长期记忆机制可以辅助AI追踪用户的健康状况,结合实时行为预测健康风险。
- 企业办公:作为个人助理,Pask能主动整理会议纪要、提醒待办事项,甚至跨平台协调任务。
研究者指出,Pask并非要替代现有工具,而是构建一个主动AI编排层,连接用户已有的应用与数据,成为“最懂你的统一入口”。
技术理念:从“I know what I don’t know”到“I don’t know what I don’t know”
Pask的设计哲学也体现了AI代理范式的一次转变。传统AI遵循“I know what I don't know”——在遇到未知问题时主动请求用户补充信息。而Pask更强调“I don't know what I don't know”,即AI主动探索用户尚未意识到的信息需求,这需要其具备超越用户当前认知的能力。
换句话说,AI不再等待用户提问,而是学会在用户需要之前给出帮助。研究人员强调,AI的真正价值不在于一次回答是否准确,而在于它是否能在关键时刻提供用户“正需要”的信息,使用户产生“就是这个”的共鸣。
开源与未来发展
该研究成果已以论文形式发布在Arxiv上(论文链接:https://arxiv.org/abs/2604.08000),并有望在多个开源项目中集成。Pask的架构设计具有良好的可扩展性,未来或将在智能家居、车载系统、AR/VR等更多实时交互场景中落地。
随着AI从工具逐步演变为“助理”甚至“伙伴”,Pask所代表的这种主动智能范式,或将引领下一代AI代理的发展方向。