Podcast Episodes

Back to Search

On Token's Dilemma: Dynamic MoE with Drift-Aware Token Assignment for Continual Learning of Large Vision Language Models

Episode 1692

🤗 Upvotes: 30 | cs.LG, cs.AI

Authors:
Chongyang Zhao, Mingsong Li, Haodong Lu, Dong Gong

Title:
…

3 months ago

Short Long

View Episode

GEditBench v2: A Human-Aligned Benchmark for General Image Editing

Episode 1691

🤗 Upvotes: 27 | cs.CV

Authors:
Zhangqi Jiang, Zheng Sun, Xianfang Zeng, Yufeng Yang, Xuanyang Zhang, Yongliang W…

3 months ago

Short Long

View Episode

Make Geometry Matter for Spatial Reasoning

Episode 1690

🤗 Upvotes: 25 | cs.CV, cs.AI

Authors:
Shihua Zhang, Qiuhong Shen, Shizun Wang, Tianbo Pan, Xinchao Wang

…

3 months ago

Short Long

View Episode

PRBench: End-to-end Paper Reproduction in Physics Research

Episode 1689

🤗 Upvotes: 23 | cs.CL, hep-lat, hep-ph, physics.comp-ph, physics.optics

Authors:
Shi Qiu, Junyi Deng, Yiwei Deng…

3 months ago

Short Long

View Episode

PixelSmile: Toward Fine-Grained Facial Expression Editing

Episode 1688

🤗 Upvotes: 100 | cs.CV, cs.AI

Authors:
Jiabin Hua, Hengyuan Xu, Aojie Li, Wei Cheng, Gang Yu, Xingjun Ma, Yu-Gan…

3 months ago

Short Long

View Episode

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Episode 1687

🤗 Upvotes: 90 | cs.LG, cs.CL, cs.CV

Authors:
Yicheng Zou, Dongsheng Zhu, Lin Zhu, Tong Zhu, Yunhua Zhou, Peiheng…

3 months ago

Short Long

View Episode

Calibri: Enhancing Diffusion Transformers via Parameter-Efficient Calibration

Episode 1686

🤗 Upvotes: 40 | cs.CV

Authors:
Danil Tokhchukov, Aysel Mirzoeva, Andrey Kuznetsov, Konstantin Sobolev

…

3 months ago

Short Long

View Episode

RealRestorer: Towards Generalizable Real-World Image Restoration with Large-Scale Image Editing Models

Episode 1685

🤗 Upvotes: 39 | cs.CV

Authors:
Yufeng Yang, Xianfang Zeng, Zhangqi Jiang, Fukun Yin, Jianzhuang Liu, Wei Cheng, …

3 months ago

Short Long

View Episode

MACRO: Advancing Multi-Reference Image Generation with Structured Long-Context Data

Episode 1684

🤗 Upvotes: 26 | cs.CV

Authors:
Zhekai Chen, Yuqing Wang, Manyuan Zhang, Xihui Liu

Title:
…

3 months ago

Short Long

View Episode

Voxtral TTS

Episode 1683

🤗 Upvotes: 24 | cs.AI

Authors:
Alexander H. Liu, Alexis Tacnet, Andy Ehrenberg, Andy Lo, Chen-Yo Sun, Guillaume …

3 months ago

Short Long

View Episode

Podcast Episodes

On Token's Dilemma: Dynamic MoE with Drift-Aware Token Assignment for Continual Learning of Large Vision Language Models

GEditBench v2: A Human-Aligned Benchmark for General Image Editing

Make Geometry Matter for Spatial Reasoning

PRBench: End-to-end Paper Reproduction in Physics Research

PixelSmile: Toward Fine-Grained Facial Expression Editing

Intern-S1-Pro: Scientific Multimodal Foundation Model at Trillion Scale

Calibri: Enhancing Diffusion Transformers via Parameter-Efficient Calibration

RealRestorer: Towards Generalizable Real-World Image Restoration with Large-Scale Image Editing Models

MACRO: Advancing Multi-Reference Image Generation with Structured Long-Context Data

Voxtral TTS

Love PodBriefly?