Episode Details

【第612期】DeepSeek-V4：高效百万长度上下文智能语言模型

Published 3 weeks, 6 days ago

Description

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。
如果你想要解读自己的论文，获得更多曝光度。请联系小助手微信：seventy3_podcast 加群。
合作邮箱：zhiwudazhanjiangshi#gmail.com
今天的主题是：
DeepSeek-V4: Towards Highly Efficient Million-Token Context Intelligence
Summary
我们提出 DeepSeek-V4 系列的预览版本，包括两款强大的混合专家（Mixture-of-Experts, MoE）语言模型：
* DeepSeek-V4-Pro：1.6T 参数（其中 49B 参数在推理时激活）
* DeepSeek-V4-Flash：284B 参数（其中 13B 参数在推理时激活）
...去小宇宙查看完整单集简介
前往小宇宙评论区与主播互动

Episode Details

【第612期】DeepSeek-V4：高效百万长度上下文智能语言模型

Description

Listen Now

Love PodBriefly?