Podcast Episodes

Back to Search

Concerto: Joint 2D-3D Self-Supervised Learning Emerges Spatial Representations

Episode 1332

🤗 Upvotes: 147 | cs.CV

Authors:
Yujia Zhang, Xiaoyang Wu, Yixing Lao, Chengyao Wang, Zhuotao Tian, Naiyan Wang, …

8 months ago

Short Long

View Episode

Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning

Episode 1331

🤗 Upvotes: 79 | cs.LG, cs.AI, cs.CL

Authors:
Ling Team, Bin Han, Caizhi Tang, Chen Liang, Donghao Zhang, Fan Yua…

8 months, 1 week ago

Short Long

View Episode

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

Episode 1330

🤗 Upvotes: 68 | cs.LG, cs.AI, cs.CL

Authors:
Zhiheng Xi, Xin Guo, Yang Nan, Enyu Zhou, Junrui Shen, Wenxiang Che…

8 months, 1 week ago

Short Long

View Episode

LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

Episode 1329

🤗 Upvotes: 44 | cs.CL

Authors:
Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, Ning Shang, Fan Yang, Dongyao Chen, Mao…

8 months, 1 week ago

Short Long

View Episode

Language Models are Injective and Hence Invertible

Episode 1328

🤗 Upvotes: 42 | cs.LG, cs.AI

Authors:
Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, Andrea Santilli, …

8 months, 1 week ago

Short Long

View Episode

GigaBrain-0: A World Model-Powered Vision-Language-Action Model

Episode 1327

🤗 Upvotes: 34 | cs.RO, cs.CV

Authors:
GigaBrain Team, Angen Ye, Boyuan Wang, Chaojun Ni, Guan Huang, Guosheng Zh…

8 months, 1 week ago

Short Long

View Episode

LightMem: Lightweight and Efficient Memory-Augmented Generation

Episode 1326

🤗 Upvotes: 86 | cs.CL, cs.AI, cs.CV, cs.LG, cs.MA

Authors:
Jizhan Fang, Xinle Deng, Haoming Xu, Ziyan Jiang, Yuq…

8 months, 1 week ago

Short Long

View Episode

Efficient Long-context Language Model Training by Core Attention Disaggregation

Episode 1325

🤗 Upvotes: 70 | cs.LG, cs.DC

Authors:
Yonghao Zhuang, Junda Chen, Bo Pang, Yi Gu, Yibo Zhu, Yimin Jiang, Ion Sto…

8 months, 1 week ago

Short Long

View Episode

World-in-World: World Models in a Closed-Loop World

Episode 1324

🤗 Upvotes: 68 | cs.CV

Authors:
Jiahan Zhang, Muqing Jiang, Nanru Dai, Taiming Lu, Arda Uzunoglu, Shunchi Zhang, …

8 months, 1 week ago

Short Long

View Episode

UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-Image Generation

Episode 1323

🤗 Upvotes: 59 | cs.CV

Authors:
Yibin Wang, Zhimin Li, Yuhang Zang, Jiazi Bu, Yujie Zhou, Yi Xin, Junjun He, Chun…

8 months, 1 week ago

Short Long

View Episode

Podcast Episodes

Concerto: Joint 2D-3D Self-Supervised Learning Emerges Spatial Representations

Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning

BAPO: Stabilizing Off-Policy Reinforcement Learning for LLMs via Balanced Policy Optimization with Adaptive Clipping

LoongRL:Reinforcement Learning for Advanced Reasoning over Long Contexts

Language Models are Injective and Hence Invertible

GigaBrain-0: A World Model-Powered Vision-Language-Action Model

LightMem: Lightweight and Efficient Memory-Augmented Generation

Efficient Long-context Language Model Training by Core Attention Disaggregation

World-in-World: World Models in a Closed-Loop World

UniGenBench++: A Unified Semantic Evaluation Benchmark for Text-to-Image Generation

Love PodBriefly?