Podcast Episodes
Back to Search
【第509期】GDPO:多奖励强化学习的解耦归一化策略优化
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你有自己的论文要解读,或者推荐论文,请留言。
今天的主题是:
GDPO: Group reward-Decoupled Normalization Policy…
4 months, 1 week ago
【第508期】SAGA:科学发现中的动态目标演化自主智能体
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你有自己的论文要解读,或者推荐论文,请留言。
今天的主题是:
Accelerating Scientific Discovery with Autonomous…
4 months, 1 week ago
【第507期】mHC:流形约束超连接的大规模稳定训练
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
mHC: Manifold-Constrained Hyper-Connections
Summary
近年来,以 Hyper-Connections…
4 months, 1 week ago
【第506期】深度序列模型中的几何记忆谜题
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Deep sequence models tend to memorize geometrically; it is unclear why.
Su…
4 months, 1 week ago
【第505期】TTT-E2E:长文本建模的端到端测试时训练模型
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
End-to-End Test-Time Training for Long Context
Summary
我们将长上下文语言建模表述为一个持续学习…
4 months, 2 weeks ago
【第504期】Engram:大语言模型条件存储与扩展查表机制
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large …
4 months, 2 weeks ago
【第503期】突破最短路径Dijkstra 算法的算法研究
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Breaking the Sorting Barrier for Directed Single-Source Shortest Paths
Sum…
4 months, 2 weeks ago
【第502期】Polymarket无风险套利
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets
Summ…
4 months, 2 weeks ago
【第501期】基于可验证奖励强化学习的未来事件预测
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Outcome-based Reinforcement Learning to Predict the Future
Summary
带有可验证奖励的…
4 months, 2 weeks ago
【第500期】平衡工作证明:多重哈希关联挖矿理论
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Proof of Balanced Work: The Theory of Mining Hash Products
Summary
我们提出了一种新…
4 months, 2 weeks ago