小链
添加
登录
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
#DeepSeek
#LLM
#A4
评论
只有
登录
用户才可以评论
本文介绍了DeepSeek-V3.1的发布及其主要功能改进。文章包含以下几个方面:
混合推理架构实现模型同时支持思考模式与非思考模式。
提高了思考效率,Think版本可以在更短时间内给出答案。
增强了Agent能力,通过Post-Training优化,提高工具使用和智能体任务表现。
官方App与网页端模型升级为DeepSeek-V3.1,增加了“深度思考”按钮供用户切换模式。
DeepSeek API升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,扩展了上下文长度至128K。
增加了对Anthropic API格式的支持,简化接入Claude Code框架。
编程智能体测评显示,DeepSeek-V3.1相比之前的DeepSeek系列模型表现更佳。
搜索智能体测评结果显示,DeepSeek-V3.1在多项任务上取得显著提升,尤其在复杂搜索测试和多学科难题测试中。
思考效率提升,V3.1-Think在输出Token数量减少20%-50%的情况下,表现与R1-0528持平。
非思考模式下输出长度减少,保持模型性能的情况下,提高了输出效率。
基础模型和后训练模型已开源,并提供了Huggingface和魔搭的下载链接。
对DeepSeek开放平台API接口调价,并取消了夜间优惠时段。
瓦白
2025-08-24 19:43:23
本文介绍了DeepSeek-V3.1的发布及其主要功能改进。文章包含以下几个方面: 1. 混合推理架构实现模型同时支持思考模式与非思考模式。 2. 提高了思考效率,Think版本可以在更短时间内给出答案。 3. 增强了Agent能力,通过Post-Training优化,提高工具使用和智能体任务表现。 4. 官方App与网页端模型升级为DeepSeek-V3.1,增加了“深度思考”按钮供用户切换模式。 5. DeepSeek API升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,扩展了上下文长度至128K。 6. 增加了对Anthropic API格式的支持,简化接入Claude Code框架。 7. 编程智能体测评显示,DeepSeek-V3.1相比之前的DeepSeek系列模型表现更佳。 8. 搜索智能体测评结果显示,DeepSeek-V3.1在多项任务上取得显著提升,尤其在复杂搜索测试和多学科难题测试中。 9. 思考效率提升,V3.1-Think在输出Token数量减少20%-50%的情况下,表现与R1-0528持平。 10. 非思考模式下输出长度减少,保持模型性能的情况下,提高了输出效率。 11. 基础模型和后训练模型已开源,并提供了Huggingface和魔搭的下载链接。 12. 对DeepSeek开放平台API接口调价,并取消了夜间优惠时段。
保存
取消
本文介绍了DeepSeek-V3.1的发布及其主要功能改进。文章包含以下几个方面: