Podcast Episodes
Back to Search
【第266期】OLMo 2
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
2 OLMo 2 Furious
Summary
这篇文档介绍了 OLMo 2,一种由 AllenAI 开发的开源语言模型系列。它详细阐述了 OLMo 2 相较于其…
10 months ago
【第265期】ARQ: for LLM Instruction Following
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Attentive Reasoning Queries: A Systematic Method for Optimizing Instruction-Foll…
10 months ago
【第264期】Block Diffusion Language Models
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Mod…
10 months, 1 week ago
【第263期】SEARCH-R1: RL for Reasoning and Search in LLMs
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcemen…
10 months, 1 week ago
【第262期】PLAN-AND-ACT:Long-Horizon Tasks Plan Agents
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks
Summary
这篇文章介绍了一…
10 months, 1 week ago
【第261期】LMM-R1: Reasoning Enhancement for LMM
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rul…
10 months, 1 week ago
【第260期】Vision-R1: Reasoning in Multimodal LLM
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Model…
10 months, 1 week ago
【第259期】Agentic Reward Modeling
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Agentic Reward Modeling: Integrating Human Preferences with Verifiable Correctne…
10 months, 1 week ago
【第258期】Forecasting Rare Language Model Behaviors
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Forecasting Rare Language Model Behaviors
Summary
这些资料提出了预测大型语言模型在大规模部署时可能出现的罕见不良行…
10 months, 1 week ago
【第257期】UPFT:The First Few Tokens Are All You Need
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised P…
10 months, 2 weeks ago