添加 登录

评论

只有登录用户才可以评论

总结

DeepSeek-AI 宣布发布 DeepSeek-R1,并开源了模型权重,该模型在性能上与 OpenAI o1 正式版相匹配,同时还开源了超越 OpenAI o1-mini 的小模型,并对许可证和用户协议进行了调整,以及发布了新的 API 服务和定价策略。, , , ,

摘要

DeepSeek-AI 正式发布了 DeepSeek-R1,并同步开源了模型权重,遵循 MIT License,允许用户通过蒸馏技术使用 R1 训练其他模型。DeepSeek-R1 上线了 API 服务,支持思维链输出,并且官网与 App 也同步更新上线。DeepSeek-R1 在后训练阶段大规模采用了强化学习技术,极大提升了模型推理能力,在数学、代码、自然语言推理等任务上,性能与 OpenAI o1 正式版相当。DeepSeek-AI 公开了 DeepSeek-R1 的训练技术,以促进技术社区的交流与创新。此外,DeepSeek-AI 还蒸馏了 6 个小模型,其中 32B 和 70B 模型在多项能力上实现了与 OpenAI o1-mini 相当的效果。为了推动开源社区和行业生态的发展,DeepSeek-AI 将模型开源协议统一为 MIT License,并允许用户进行模型蒸馏。用户可以通过 DeepSeek 官网或官方 App 的“深度思考”模式调用最新版 DeepSeek-R1。新的 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。, , , , , , , , ,

观点

  1. DeepSeek-R1 的发布和开源:DeepSeek-AI 发布了 DeepSeek-R1,并开源了其权重,这有助于技术社区的创新和交流。,
  2. 性能与 OpenAI o1 的对比:DeepSeek-R1 在推理能力上与 OpenAI o1 正式版保持一致,尤其在数学、代码和自然语言推理任务上。
  3. 小模型的超越:通过 DeepSeek-R1 蒸馏出的小模型在某些能力上超越了 OpenAI o1-mini。
  4. 许可证和用户协议的调整:DeepSeek-AI 统一采用 MIT License,并允许用户进行模型蒸馏,这有助于降低开发者的理解成本并鼓励开源与共享。, ,
  5. API 服务和定价:DeepSeek-R1 API 服务的定价策略旨在为用户提供成本效益较高的服务。
瓦白 2025-01-25 23:58:21

发布到 A4 周刊

瓦白 2025-01-25 23:56:23