DeepSeek論文登《自然》期刊
首通過評審大語言模型研究
【明報專訊】國產人工智能(AI)企業深度求索(DeepSeek)最新發表關於旗下大語言模型DeepSeek-R1的論文,登上國際頂級科學學術期刊《自然》(Nature)17日出版的最新一期封面(圖)。《自然》稱該研究是第一個通過同行評審的大語言模型相關研究,DeepSeek在論文中表明,其成功並非建立在競爭對手成果之上。
強調成功非建立於對手成果之上
這篇題為「DeepSeek-R1透過強化學習激勵大型語言模型推理」的論文1月已和DeepSeek-R1一同向全球公開,講述DeepSeek的研究者如何通過「強化學習」(Reinforcement Learning)提升大型語言模型的推理能力。
DeepSeek團隊2月將論文提交至《自然》,歷經5個月審查獲期刊接收,參與評審的8名外部專家提出過百條意見,審稿文件篇幅接近論文本身的3倍。DeepSeek團隊在回應同行評審意見時,增加對技術細節的說明,包括模型訓練的數據類型及其安全性。DeepSeek在9月正式發表的版本中增加許多內容。在論文的補充資料部分,DeepSeek強調訓練數據源自互聯網公開資料,沒有故意加入OpenAI生成的合成數據。內地媒體報道時稱「DeepSeek首次回應蒸餾OpenAI質疑」。
《自然》發表評論文章鼓勵更多AI企業公開相關研究。俄亥俄州立大學計算機與工程系副教授Huan Sun表示,嚴格的同行評審流程有助於驗證模型的有效性和實用性。