Podcast Episodes

Back to Search
【第509期】GDPO:多奖励强化学习的解耦归一化策略优化
【第509期】GDPO:多奖励强化学习的解耦归一化策略优化

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你有自己的论文要解读,或者推荐论文,请留言。
今天的主题是:
GDPO: Group reward-Decoupled Normalization Policy…

4 months, 1 week ago

Short Long
View Episode
【第508期】SAGA:科学发现中的动态目标演化自主智能体
【第508期】SAGA:科学发现中的动态目标演化自主智能体

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你有自己的论文要解读,或者推荐论文,请留言。
今天的主题是:
Accelerating Scientific Discovery with Autonomous…

4 months, 1 week ago

Short Long
View Episode
【第507期】mHC:流形约束超连接的大规模稳定训练
【第507期】mHC:流形约束超连接的大规模稳定训练

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
mHC: Manifold-Constrained Hyper-Connections
Summary
近年来,以 Hyper-Connections…

4 months, 1 week ago

Short Long
View Episode
【第506期】深度序列模型中的几何记忆谜题
【第506期】深度序列模型中的几何记忆谜题

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Deep sequence models tend to memorize geometrically; it is unclear why.
Su…

4 months, 1 week ago

Short Long
View Episode
【第505期】TTT-E2E:长文本建模的端到端测试时训练模型
【第505期】TTT-E2E:长文本建模的端到端测试时训练模型

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
End-to-End Test-Time Training for Long Context
Summary
我们将长上下文语言建模表述为一个持续学习…

4 months, 2 weeks ago

Short Long
View Episode
【第504期】Engram:大语言模型条件存储与扩展查表机制
【第504期】Engram:大语言模型条件存储与扩展查表机制

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large …

4 months, 2 weeks ago

Short Long
View Episode
【第503期】突破最短路径Dijkstra 算法的算法研究
【第503期】突破最短路径Dijkstra 算法的算法研究

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。

今天的主题是:

Breaking the Sorting Barrier for Directed Single-Source Shortest Paths

Sum…

4 months, 2 weeks ago

Short Long
View Episode
【第502期】Polymarket无风险套利
【第502期】Polymarket无风险套利

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets
Summ…

4 months, 2 weeks ago

Short Long
View Episode
【第501期】基于可验证奖励强化学习的未来事件预测
【第501期】基于可验证奖励强化学习的未来事件预测

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Outcome-based Reinforcement Learning to Predict the Future
Summary
带有可验证奖励的…

4 months, 2 weeks ago

Short Long
View Episode
【第500期】平衡工作证明:多重哈希关联挖矿理论
【第500期】平衡工作证明:多重哈希关联挖矿理论

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
Proof of Balanced Work: The Theory of Mining Hash Products
Summary
我们提出了一种新…

4 months, 2 weeks ago

Short Long
View Episode

Love PodBriefly?

If you like Podbriefly.com, please consider donating to support the ongoing development.

Support Us