新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 李飛飛團隊低成本AI模型實為基于阿里云Qwen模型監(jiān)督微調(diào)而成

李飛飛團隊低成本AI模型實為基于阿里云Qwen模型監(jiān)督微調(diào)而成

作者: 時間:2025-02-07 來源:SEMI 收藏

2月7日消息,日前有報道稱等斯坦福大學和華盛頓大學的研究人員以不到50美元的云計算費用,成功訓練出了一個名為s1的人工智能推理模型。該模型在數(shù)學和編碼能力測試中的表現(xiàn),據(jù)稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

本文引用地址:http://www.butianyuan.cn/article/202502/466683.htm

然而,經(jīng)《科創(chuàng)板日報》記者調(diào)查后發(fā)現(xiàn),s1模型的訓練并非從零開始,其基座模型為阿里通義千問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模型中提煉出來的1000個樣本,然后對千問模型進行微調(diào)而成。



關鍵詞: 李飛飛 openAI

評論


相關推薦

技術專區(qū)

關閉