Episode Details

Back to Episodes
【第475期】bBoN:让AI操作赶上人

【第475期】bBoN:让AI操作赶上人

Published 5 months, 2 weeks ago
Description
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
今天的主题是:
The Unreasonable Effectiveness of Scaling Agents for Computer Use
Summary
计算机使用代理(CUAs)在自动化日常数字任务方面具有潜力,但其不稳定性和高方差阻碍了其在长时程、复杂任务中的应用。我们提出 Behavior Best-of-N(bBoN),一种通过生成多条 rollout 并使用描述代理行为的行为叙事对其进行选择,从而实现对代理进行可扩展性的方式。该方法同时支持广泛探索与基于原理的轨迹选择,显著提升了鲁棒性和成功率。
在 OSWorld 上,我们的 bBoN 扩展方法达成了新的 SOTA(State of the Art):69.9%,显著优于先前方法,...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
Listen Now

Love PodBriefly?

If you like Podbriefly.com, please consider donating to support the ongoing development.

Support Us