DeepSeek-V3.1 发布，迈向 Agent 时代的第一步 - 小链

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

#DeepSeek #LLM #A4

评论

只有登录用户才可以评论

本文介绍了DeepSeek-V3.1的发布及其主要功能改进。文章包含以下几个方面：

混合推理架构实现模型同时支持思考模式与非思考模式。
提高了思考效率，Think版本可以在更短时间内给出答案。
增强了Agent能力，通过Post-Training优化，提高工具使用和智能体任务表现。
官方App与网页端模型升级为DeepSeek-V3.1，增加了“深度思考”按钮供用户切换模式。
DeepSeek API升级，deepseek-chat对应非思考模式，deepseek-reasoner对应思考模式，扩展了上下文长度至128K。
增加了对Anthropic API格式的支持，简化接入Claude Code框架。
编程智能体测评显示，DeepSeek-V3.1相比之前的DeepSeek系列模型表现更佳。
搜索智能体测评结果显示，DeepSeek-V3.1在多项任务上取得显著提升，尤其在复杂搜索测试和多学科难题测试中。
思考效率提升，V3.1-Think在输出Token数量减少20%-50%的情况下，表现与R1-0528持平。
非思考模式下输出长度减少，保持模型性能的情况下，提高了输出效率。
基础模型和后训练模型已开源，并提供了Huggingface和魔搭的下载链接。
对DeepSeek开放平台API接口调价，并取消了夜间优惠时段。

瓦白 2025-08-24 19:43:23