Podcast Episodes
Back to Search
【第300期】(中文)NdLinear:多维深度学习新范式
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
NdLinear: Don't Flatten! Building Superior Neural Architectures by Preserving N-…
11 months ago
【第299期】(中文)SWE-PolyBench:多语言代码智能体基准测试
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
SWE-PolyBench: A multi-language benchmark for repository level evaluation of cod…
11 months ago
【第298期】(中文)DocAgent:自动化代码文档生成的多智能体系统
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
DocAgent: A Multi-Agent System for Automated Code Documentation Generation
Summar…
11 months, 1 week ago
【第297期】(中文)AgentA/B:基于LLM的自动化可扩展网页A/B测试
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents
Summa…
11 months, 1 week ago
【第296期】(中文)d1: 扩散LLM的强化学习推理
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learn…
11 months, 1 week ago
【第295期】(中文)GUI-R1: GUI智能体的强化微调
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
GUI-R1: A Generalist R1-Style Vision-Language Action Model For GUI Agents
Summary…
11 months, 1 week ago
【第294期】(中文)NoProp:无需反向传播或前向传播的神经网络训练方法
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
NoProp: Training Neural Networks without Back-propagation or Forward-propagation…
11 months, 1 week ago
【第293期】(中文)LightPROF:知识图谱上大型语言模型的轻量推理框架
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
LightPROF: A Lightweight Reasoning Framework for Large Language Model on Knowled…
11 months, 1 week ago
【第292期】(中文)AI Scientist-v2:代理树搜索自动化科学发现
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic T…
11 months, 1 week ago
【第291期】(中文)attention sinks:LLMs倾向于将大部分注意力集中在第一个token
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法方向,让大家跟着AI一起进步。
今天的主题是:
Why do LLMs attend to the first token?
Summary
本研究探讨大型语言模型 (LLMs) 中“注意力槽”(attentio…
11 months, 2 weeks ago