新闻资讯

DeepSeek发布新版本模型:优化推理效率,API降价超50%

DeepSeek发布新版本模型,调用API成本降低超50%。

9月29日,DeepSeek正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。

值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。

据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。

据了解,DeepSeek Sparse Attention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响,把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中,需要设计和实现很多新的GPU算子,使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

DeepSeek表示,得益于新模型服务成本的大幅降低,官方API价格也相应下调,开发者调用DeepSeek API的成本将降低50%以上。从价格来看,输入缓存命中从0.5元降至0.2元/百万tokens,缓存未命中从4元降至2元/百万tokens,输出由12元降至3元/百万tokens。

除了DeepSeek,国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布,目前,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模型。

此前9月18日,梁文锋带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》,创始人梁文锋位于署名之列。

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。

  • 首批L3车型“合规上路”,中国自动驾驶能否迎来“ChatGPT时刻”?
  • “实在是还不起了”!零首付黄金分期实际是高利贷?揭秘背后套路…
  • 模塑科技索赔时效告急,已有胜诉先例需尽快加入
  • 一周新车盘点 | 雷克萨斯发布LFA概念车 锐胜M8正式上市
  • 美国加码封锁委内瑞拉 国际油价应声上涨
  • 渣打:预计美联储9月降息50个基点 因非农数据显示就业市场降温
  • 扬州爱奇艺乐园将于2026年2月8日开园
  • 月活增长超内地市场,美图“避开巨头”去海外
  • 红魔11 Pro系列游戏手机正式发布,售价4999元起
  • 汽车早报|多家车企公布8月销量数据 阿维塔明年将推出百万级大六座旗舰产品
  • 图集|流逝的达古冰川2025
  • TUMI 2026 年春季色彩系列演绎“邂逅地中海”,Salomon萨洛蒙推出全球首个24小时跑者空间|是日美好事物
  • 宏观政策集成效应持续显现,PPI同比降幅连续三个月收窄
  • 共和党大动员 特朗普警告若输掉中期选举他将再次面临弹劾
  • 同步追责首案!涉ST立方财务造假案,中兴财光华遭立案,6家上市公司应声“换所”
  • 关键词: