
DeepSeek 推出了 R1-0528,這是這家中國初創(chuàng)公司于今年 1 月發(fā)布的 R1 推理模型的重大升級。就在一個月前,阿里巴巴集團(tuán)控股的 Qwen3 在 LiveBench(開源人工智能模型在線基準(zhǔn)測試)中擊敗了原版 DeepSeek R1。
DeepSeek 升級后的 R1-0528 模型如今在性能上與 OpenAI 和谷歌的領(lǐng)先 AI 模型并駕齊驅(qū)。此次回歸表明,中國大型科技公司和新興科技公司正在以驚人的速度改進(jìn)其 AI 工具。
DeepSeek 在聲明中表示,R1-0528 展現(xiàn)出了更佳的推理和創(chuàng)造性寫作能力。此次更新還帶來了更強(qiáng)大的編碼能力。最重要的是,該公司聲稱該模型現(xiàn)在產(chǎn)生的“幻覺”減少了 50%。
DeepSeek 解釋說,這些升級來自于在后訓(xùn)練階段投入的額外計算能力,工程師在主要訓(xùn)練過程之后對模型進(jìn)行微調(diào)。在后訓(xùn)練階段,工程師的目標(biāo)是提高模型的效率,并增強(qiáng)其準(zhǔn)確性和安全性。
R1-0528 目前排名僅次于 OpenAI 的 o3 和 o4-mini
在衡量 AI 模型性能的 LiveCodeBench 上,R1-0528目前排名僅次于 OpenAI 的 o4-mini 和 o3 模型。
Hugging Face 的人工智能研究員 Adina Yakefu 表示:“DeepSeek 的最新升級在推理能力上更加敏銳,數(shù)學(xué)和代碼能力更強(qiáng),并且正在接近 Gemini 和 O3 等頂級模型?!?/p>
她補(bǔ)充說,新版本在“推理和減少幻覺方面取得了重大進(jìn)展”,并證明這家初創(chuàng)公司不僅僅是在追趕,而且還在積極競爭。
在華盛頓限制對華先進(jìn)芯片和其他技術(shù)出口之后,中國取得了快速進(jìn)展。然而,中國企業(yè)仍在不斷完善其系統(tǒng)。本月早些時候,百度和騰訊描述了他們在無法獲得尖端半導(dǎo)體的情況下如何使其模型更高效運(yùn)行的方法。
英偉達(dá)首席執(zhí)行官黃仁勛周三批評了出口管制?!懊绹恼呓⒃谥袊鵁o法制造人工智能芯片的假設(shè)之上,”他表示?!斑@個假設(shè)一直值得懷疑,現(xiàn)在顯然是錯誤的。問題不在于中國是否會擁有人工智能。它已經(jīng)擁有了?!?/p>
DeepSeek 將阿里巴巴 Qwen3 8B 模型的性能提高了 10%
DeepSeek 還表示,它將 R1-0528 中使用的推理步驟提煉為阿里巴巴的Qwen38B 基礎(chǔ)模型。據(jù)該公司稱,這一過程創(chuàng)建了一個全新的、更小的模型,其性能比 Qwen3 高出 10% 以上。同時,該模型的體積縮小了 30 倍。
該公司表示:“我們相信 DeepSeek-R1-0528 的思路對于推理模型的學(xué)術(shù)研究和小型模型的工業(yè)工作具有重要意義?!?/p>
根據(jù) 路透社DeepSeek 的一位代表在微信群中表示,此次調(diào)整是一次“小規(guī)模的試用升級”,目前已開放公開測試。為了應(yīng)對更激烈的競爭,谷歌降低了部分 Gemini 接入等級,而 OpenAI 則推出了成本更低的 o3 Mini 型號。
Cryptopolitan 學(xué)院:厭倦了市場波動?了解 DeFi 如何助你建立穩(wěn)定的被動收入。立即注冊






.png)





















