国内大型模型公司DeepSeek发布了详细的升级公告,其中解释了特定的DeepSeek-R1升级情况。根据DeepSeek公告,5月29日,DeepSeek R1模型完成了小型升级,当前版本是Deviceek-R1-0528。用户通过官方网站,应用程序或迷你程序输入对话接口后,他们可以启用“深思熟虑”功能来体验最新版本。 API也会同时更新,并且呼叫方法保持不变。该公告指出,DeepSeek-R1-0528使用2024年12月发布的DeepSeek V3基本模型作为基础,但它已在培训后的过程中投入了更多的计算能力,从而大大改善了模型思维和推理的深度。在许多基准评估(例如数学,编程和一般逻辑)中,更新的OFR1模型在所有国内模型中都取得了最高的成绩,并且已经变得接近其他领先的国际总体绩效模型,例如O3和Gemini-2.5-Pro。与R1的旧版本相比,复杂识别任务中新版本的新版本的性能已大大改善。例如,在AIE2025测试中,新版本的模型的准确性从旧版本的70%增加到87.5%。这种发展是由于该模型在推理过程中的思维深度的改善所致:在AIE2025测试集中,旧模型平均每个问题使用12k代币,而新模型则使用每个问题平均使用23K令牌,这表明它在ProcessProblemblemblemblemalblemalblemalblemblemboarmblemboarmblemblemboarmblemblemblemblemblemalblemblemalblemblemblemblectic问题上变得更加详细。 DeepSeek表示,DeepSeek-R1-0528思想链将是研究推理模型的研究和行业中小型模型的发展的重要意义。 DeepSeek R1的新版本将用于“愚蠢”问题。与旧版本相比,更新的模型在诸如重写和抛光,摘要和阅读理解等方案中,幻觉率降低了约45-50%,这可以有效地提供更准确和可靠的结果。根据R1的旧版本,更新的R1模型将针对论证论文,小说,散文和其他流派进行了进一步优化,并且可以输出长长的长度和更完整的结构,同时显示出更接近人类偏好的写作样式。根据该公告,当前模型的超级风格的结果与Openai O1-High相当,但仍然有一个带有O3-High和Claude4十四行诗的空间。在此R1更新之后,官方网站上的模型上下文的长度仍然为64K。如果用户需要更长的上下文长度,他们可以通过其他第三方平台调用128K上下文长度的R1-0528型号开放版本。与旧版本的DeepSeek-R1结合使用,此升级是开放资源E模型,该模型允许用户使用模型输出并通过约会模型来训练其他模型。此前,Deepeek于5月28日向官方微信集团发布了一条消息,据说Deviceekr1模型完成了“试用升级的小版本”。欢迎使用官方的网页,应用程序和迷你程序测试(开放深思熟虑),API接口方法和使用将保持不变。根据Netizens测试,此升级的影响是惊人的。从社交媒体的评论来看,与网络人最相关的是在DeepSeekr1更新之后思考的时间更长。根据评论,DeepSeek单个任务的处理时间最多可以30-60分钟。 。