Podcast Episodes

Back to Search

Learning to Retrieve from Agent Trajectories

Episode 1742

🤗 Upvotes: 55 | cs.IR, cs.AI, cs.CL

Authors:
Yuqi Zhou, Sunhao Dai, Changle Qu, Liang Pang, Jun Xu, Ji-Rong Wen

…

2 months, 3 weeks ago

Short Long

View Episode

ACES: Who Tests the Tests? Leave-One-Out AUC Consistency for Code Generation

Episode 1741

🤗 Upvotes: 47 | cs.LG

Authors:
Hui Sun, Yun-Ji Zhang, Zheng Xie, Ren-Biao Liu, Yali Du, Xin-Ye Li, Ming Li

…

2 months, 3 weeks ago

Short Long

View Episode

GBQA: A Game Benchmark for Evaluating LLMs as Quality Assurance Engineers

Episode 1740

🤗 Upvotes: 37 | cs.SE, cs.AI

Authors:
Shufan Jiang, Chios Chen, Zhiyang Chen

Title:
GBQA…

2 months, 3 weeks ago

Short Long

View Episode

Beyond Accuracy: Unveiling Inefficiency Patterns in Tool-Integrated Reasoning

Episode 1739

🤗 Upvotes: 33 | cs.PF, cs.SE

Authors:
Qisheng Su, Shiting Huang, Zhen Fang, Ziyan Chen, Zehui Chen, Feng Zhao

…

2 months, 3 weeks ago

Short Long

View Episode

ThinkTwice: Jointly Optimizing Large Language Models for Reasoning and Self-Refinement

Episode 1738

🤗 Upvotes: 32 | cs.AI

Authors:
Difan Jiao, Qianfeng Wen, Blair Yang, Zhenwei Tang, Ashton Anderson

T…

2 months, 3 weeks ago

Short Long

View Episode

Vanast: Virtual Try-On with Human Image Animation via Synthetic Triplet Supervision

Episode 1737

🤗 Upvotes: 31 | cs.CV

Authors:
Hyunsoo Cha, Wonjung Woo, Byungjun Kim, Hanbyul Joo

Title:
…

2 months, 3 weeks ago

Short Long

View Episode

MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models on a Single GPU

Episode 1736

🤗 Upvotes: 26 | cs.CL, cs.DC, cs.OS

Authors:
Zhengqing Yuan, Hanchi Sun, Lichao Sun, Yanfang Ye

Titl…

2 months, 3 weeks ago

Short Long

View Episode

Watch Before You Answer: Learning from Visually Grounded Post-Training

Episode 1735

🤗 Upvotes: 26 | cs.CV, cs.AI, cs.CL

Authors:
Yuxuan Zhang, EunJeong Hwang, Huaisong Zhang, Penghui Du, Yiming Ji…

2 months, 3 weeks ago

Short Long

View Episode

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

Episode 1734

🤗 Upvotes: 152 | cs.CV

Authors:
DataFlow Team, Bohan Zeng, Daili Hua, Kaixin Zhu, Yifan Dai, Bozhou Li, Yuran Wa…

2 months, 3 weeks ago

Short Long

View Episode

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

Episode 1733

🤗 Upvotes: 91 | cs.CV, cs.CL

Authors:
Bin Wang, Tianyao He, Linke Ouyang, Fan Wu, Zhiyuan Zhao, Tao Chu, Yuan Qu…

2 months, 3 weeks ago

Short Long

View Episode

Podcast Episodes

Learning to Retrieve from Agent Trajectories

ACES: Who Tests the Tests? Leave-One-Out AUC Consistency for Code Generation

GBQA: A Game Benchmark for Evaluating LLMs as Quality Assurance Engineers

Beyond Accuracy: Unveiling Inefficiency Patterns in Tool-Integrated Reasoning

ThinkTwice: Jointly Optimizing Large Language Models for Reasoning and Self-Refinement

Vanast: Virtual Try-On with Human Image Animation via Synthetic Triplet Supervision

MegaTrain: Full Precision Training of 100B+ Parameter Large Language Models on a Single GPU

Watch Before You Answer: Learning from Visually Grounded Post-Training

OpenWorldLib: A Unified Codebase and Definition of Advanced World Models

MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale

Love PodBriefly?