Episode Details

【第522期】TTT-Discover：通过测试时训练实现科学发现

Published 3 months, 3 weeks ago

Description

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
如果你有自己的论文要解读，或者推荐论文，请留言。
今天的主题是：
Learning to Discover at Test Time
Summary
我们如何利用 AI 为某个科学问题发现新的最先进（state-of-the-art）解法？此前关于测试时扩展（test-time scaling）的工作，例如 AlphaEvolve，是通过提示一个冻结（不再训练）的 LLM 来进行搜索。我们的做法是在测试阶段进行强化学习，使 LLM 在解决问题时仍然可以继续训练，但训练经验专门来自当前这个测试问题。
这种持续学习（continual learning）的形式非常特殊，因为它的目标并不是在平均意义上产生许多不错的解，而是找到一个非常优秀的解；并且是专门解决...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动

Episode Details

【第522期】TTT-Discover：通过测试时训练实现科学发现

Description

Listen Now

Love PodBriefly?