Episode Details

Back to Episodes
【第612期】DeepSeek-V4:高效百万长度上下文智能语言模型

【第612期】DeepSeek-V4:高效百万长度上下文智能语言模型

Published 3 weeks, 6 days ago
Description
Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence
Summary
我们提出 DeepSeek-V4 系列的预览版本,包括两款强大的混合专家(Mixture-of-Experts, MoE)语言模型:
* DeepSeek-V4-Pro:1.6T 参数(其中 49B 参数在推理时激活)
* DeepSeek-V4-Flash:284B 参数(其中 13B 参数在推理时激活)
...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动
Listen Now

Love PodBriefly?

If you like Podbriefly.com, please consider donating to support the ongoing development.

Support Us