Podcast Episodes

【第509期】GDPO：多奖励强化学习的解耦归一化策略优化

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
如果你有自己的论文要解读，或者推荐论文，请留言。
今天的主题是：
GDPO: Group reward-Decoupled Normalization Policy…

4 months, 1 week ago

Short Long

View Episode

【第508期】SAGA：科学发现中的动态目标演化自主智能体

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
如果你有自己的论文要解读，或者推荐论文，请留言。
今天的主题是：
Accelerating Scientific Discovery with Autonomous…

4 months, 1 week ago

Short Long

View Episode

【第507期】mHC：流形约束超连接的大规模稳定训练

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
mHC: Manifold-Constrained Hyper-Connections
Summary
近年来，以 Hyper-Connections…

4 months, 1 week ago

Short Long

View Episode

【第506期】深度序列模型中的几何记忆谜题

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
Deep sequence models tend to memorize geometrically; it is unclear why.
Su…

4 months, 1 week ago

Short Long

View Episode

【第505期】TTT-E2E：长文本建模的端到端测试时训练模型

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
End-to-End Test-Time Training for Long Context
Summary
我们将长上下文语言建模表述为一个持续学习…

4 months, 2 weeks ago

Short Long

View Episode

【第504期】Engram：大语言模型条件存储与扩展查表机制

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large …

4 months, 2 weeks ago

Short Long

View Episode

【第503期】突破最短路径Dijkstra 算法的算法研究

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。

今天的主题是：

Breaking the Sorting Barrier for Directed Single-Source Shortest Paths

Sum…

4 months, 2 weeks ago

Short Long

View Episode

【第502期】Polymarket无风险套利

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets
Summ…

4 months, 2 weeks ago

Short Long

View Episode

【第501期】基于可验证奖励强化学习的未来事件预测

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
Outcome-based Reinforcement Learning to Predict the Future
Summary
带有可验证奖励的…

4 months, 2 weeks ago

Short Long

View Episode

【第500期】平衡工作证明：多重哈希关联挖矿理论

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
今天的主题是：
Proof of Balanced Work: The Theory of Mining Hash Products
Summary
我们提出了一种新…

4 months, 2 weeks ago

Short Long

View Episode

Podcast Episodes

【第509期】GDPO：多奖励强化学习的解耦归一化策略优化

【第508期】SAGA：科学发现中的动态目标演化自主智能体

【第507期】mHC：流形约束超连接的大规模稳定训练

【第506期】深度序列模型中的几何记忆谜题

【第505期】TTT-E2E：长文本建模的端到端测试时训练模型

【第504期】Engram：大语言模型条件存储与扩展查表机制

【第503期】突破最短路径Dijkstra 算法的算法研究

今天的主题是：

【第502期】Polymarket无风险套利

【第501期】基于可验证奖励强化学习的未来事件预测

【第500期】平衡工作证明：多重哈希关联挖矿理论

Love PodBriefly?