Podcast Episodes

Back to Search

WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning

Episode 1152

🤗 Upvotes: 54 | cs.LG, cs.CL

Authors:
Kuan Li, Zhongwang Zhang, Huifeng Yin, Rui Ye, Yida Zhao, Liwen Zhang, Lit…

9 months, 2 weeks ago

Short Long

View Episode

Towards General Agentic Intelligence via Environment Scaling

Episode 1151

🤗 Upvotes: 51 | cs.CL

Authors:
Runnan Fang, Shihao Cai, Baixuan Li, Jialong Wu, Guangyu Li, Wenbiao Yin, Xinyu W…

9 months, 2 weeks ago

Short Long

View Episode

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

Episode 1150

🤗 Upvotes: 49 | cs.CL

Authors:
Zile Qiao, Guoxin Chen, Xuanzhong Chen, Donglei Yu, Wenbiao Yin, Xinyu Wang, Zhen…

9 months, 2 weeks ago

Short Long

View Episode

ReSum: Unlocking Long-Horizon Search Intelligence via Context Summarization

Episode 1149

🤗 Upvotes: 47 | cs.CL

Authors:
Xixi Wu, Kuan Li, Yida Zhao, Liwen Zhang, Litu Ou, Huifeng Yin, Zhongwang Zhang, …

9 months, 2 weeks ago

Short Long

View Episode

Single-stream Policy Optimization

Episode 1148

🤗 Upvotes: 24 | cs.LG, cs.AI, stat.ML

Authors:
Zhongwen Xu, Zihan Ding

Title:
Single-str…

9 months, 2 weeks ago

Short Long

View Episode

OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

Episode 1147

🤗 Upvotes: 75 | cs.CV

Authors:
Yang Zhou, Yifan Wang, Jianjun Zhou, Wenzheng Chang, Haoyu Guo, Zizun Li, Kaijing…

9 months, 2 weeks ago

Short Long

View Episode

UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning

Episode 1146

🤗 Upvotes: 35 | cs.LG, cs.AI

Authors:
Zhengxi Lu, Jiabo Ye, Fei Tang, Yongliang Shen, Haiyang Xu, Ziwei Zheng, W…

9 months, 2 weeks ago

Short Long

View Episode

InternScenes: A Large-scale Simulatable Indoor Scene Dataset with Realistic Layouts

Episode 1145

🤗 Upvotes: 23 | cs.CV, cs.RO

Authors:
Weipeng Zhong, Peizhou Cao, Yichen Jin, Li Luo, Wenzhe Cai, Jingli Lin, Ha…

9 months, 2 weeks ago

Short Long

View Episode

IntrEx: A Dataset for Modeling Engagement in Educational Conversations

Episode 1144

🤗 Upvotes: 22 | cs.CL

Authors:
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, Gabriele Pergola

Title:…

9 months, 2 weeks ago

Short Long

View Episode

The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs

Episode 1143

🤗 Upvotes: 21 | cs.AI

Authors:
Akshit Sinha, Arvindh Arun, Shashwat Goel, Steffen Staab, Jonas Geiping

…

9 months, 2 weeks ago

Short Long

View Episode

Podcast Episodes

WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning

Towards General Agentic Intelligence via Environment Scaling

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

ReSum: Unlocking Long-Horizon Search Intelligence via Context Summarization

Single-stream Policy Optimization

OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning

InternScenes: A Large-scale Simulatable Indoor Scene Dataset with Realistic Layouts

IntrEx: A Dataset for Modeling Engagement in Educational Conversations

The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs

Love PodBriefly?