Episode Details
Back to Episodes
【第636期】δ-mem:大语言模型的高效在线关联记忆机制
Published 3 days, 8 hours ago
Description
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
δ-mem: Efficient Online Memory for Large Language Models
Summary
大语言模型在长期助手和智能体系统中越来越需要积累和复用历史信息。仅仅扩展上下文窗口成本高昂,且往往无法保证有效的上下文利用率。
我们提出了 δ-mem,这是一种轻量级的记忆机制,它通过一个紧凑的联想记忆在线状态(online state of associative memory),来增强被冻结的全注意力主干网络(frozen full-a...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
δ-mem: Efficient Online Memory for Large Language Models
Summary
大语言模型在长期助手和智能体系统中越来越需要积累和复用历史信息。仅仅扩展上下文窗口成本高昂,且往往无法保证有效的上下文利用率。
我们提出了 δ-mem,这是一种轻量级的记忆机制,它通过一个紧凑的联想记忆在线状态(online state of associative memory),来增强被冻结的全注意力主干网络(frozen full-a...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动