“我們堅持開源！”阿里云發(fā)布“地表最強”中文大模型：半年一迭代、性能翻倍？

發(fā)布人：傳感器技術(shù) 時間：2024-05-09 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

作者 | 褚杏娟高衛(wèi)華

5 月 9 日，在通義大模型發(fā)布一周年之際，阿里云大模型生態(tài)迎來一次重大升級，主要有“四個最”：

通義千問 2.5 正式發(fā)布，“模型性能全面趕超 GPT-4 Turbo，成為地表最強中文大模型”；
Qwen1.5-110B 參數(shù)開源模型在多個基準(zhǔn)測評收獲最佳成績，超越 Llama-3-70B，成為開源領(lǐng)域最強中文大模型；
ModelScope 魔搭成為中國最大的開源社區(qū)；
通義大模型通過阿里云服務(wù)企業(yè)超 9 萬，成最受中國企業(yè)歡迎大模型。

同時，阿里云對通義大模型的品牌也進行了升級，正式將“通義千問 APP”更名為“通義 APP”，集成通義大模型全棧能力，免費為所有用戶提供服務(wù)。阿里表示，通義 APP 將把通義實驗室前沿的文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等能力“All in one”，成為每個人的全能 AI 助手。

大模型系列更新

從初代模型升級至 2.5 版本的路，阿里云僅僅走了一年。

去年 10 月底，阿里云 CTO 周靖人在 2023 年云棲大會上，發(fā)布了參數(shù)量提升到千億級別的通義千問 2.0。當(dāng)時，阿里表示，目前通義千問的綜合性能已經(jīng)超過 GPT-3.5，相比 4 月發(fā)布的 1.0 版本，通義千問 2.0 在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識記憶、幻覺抵御等能力上均有顯著提升。

如今，相比通義千問 2.1 版本，通義千問 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分別提升了 9%、16%、19%、10%。在權(quán)威基準(zhǔn) OpenCompass 上，通義千問 2.5 得分追平 GPT-4 Turbo，這也是該基準(zhǔn)首次錄得國產(chǎn)大模型取得如此出色的成績。

在多模態(tài)模型和專有能力模型方面，通義千問視覺理解模型 Qwen-VL-Max 在多個多模態(tài)標(biāo)準(zhǔn)測試中超越 Gemini Ultra 和 GPT-4V，目前已在多家企業(yè)落地應(yīng)用。

通義還發(fā)布了最新款開源模型：1100 億參數(shù)的 Qwen1.5-110B，該模型在 MMLU、TheoremQA、GPQA 等基準(zhǔn)測評中超越了 Meta 的 Llama-3-70B 模型。在 HuggingFace 推出的開源大模型排行榜 Open LLM Leaderboard 上，Qwen1.5-110B 沖上榜首。

“生態(tài)非常重要，我們會堅持開源體系、堅持我們的開源模式。”周靖人透露。

“現(xiàn)在已經(jīng)是 2024 年了，我相信開源對整個全球技術(shù)領(lǐng)域的貢獻是毋庸置疑的?！敝芫溉苏f道，“阿里云不是簡簡單單的開源，我們是要開源最強的模型。”

去年 8 月，通義宣布加入開源行列，隨之啟動馬不停蹄的開源狂飆，沿著“全模態(tài)、全尺寸”開源路線陸續(xù)推出十多款模型。小尺寸模型如 0.5B、1.8B、4B、7B、14B，可便捷地在手機、PC 等端側(cè)設(shè)備部署；大尺寸模型如 72B、110B 能支持企業(yè)級和科研級的應(yīng)用，都曾登頂 Open LLM Leaderboard 榜首。

“阿里云是全球唯一一家既持續(xù)做模型開發(fā)，又做大量模型開局模式的企業(yè)?！敝芫溉吮硎?，Llama 3 等在一定程度上把競爭拉得很高。坦誠地講，不是所有閉源的公司都能做過開源模型。做閉源的，至少要能夠超過開源模型水準(zhǔn)，才能今天有機會參與。另一方面，實踐中，大模型能力并不是越強越好，還要考慮成本等方面因素，所以阿里云希望把選擇權(quán)給到企業(yè)和開發(fā)者。

通義千問代碼大模型 CodeQwen1.5-7B 則是 HuggingFace 代碼模型榜單 Big Code 的頭名選手，具備優(yōu)秀的代碼生成能力、長序列建模能力、代碼修改能力和 SQL 能力，還是國內(nèi)用戶規(guī)模第一的智能編碼助手通義靈碼的底層模型。

現(xiàn)場，阿里還宣布推出通義靈碼的企業(yè)版，滿足企業(yè)用戶的定制化需求，幫助企業(yè)提升研發(fā)效率。

據(jù)介紹，通義靈碼熟練掌握 Java、Python、Go、JavaScript、TypeScript、C/C++、C# 等 200 多種編程語言，可以輔助寫代碼、讀代碼、查 Bug、優(yōu)化代碼等。根據(jù)官方數(shù)據(jù)，2023 年 10 月發(fā)布至今，通義靈碼的插件下載量已超 350 萬，每日推薦代碼超 3000 萬次，被開發(fā)者采納的代碼超億行。

“最受中國企業(yè)歡迎的大模型”

根據(jù)阿里云公布的最新數(shù)據(jù)，通義大模型通過阿里云服務(wù)企業(yè)超 9 萬，通義開源模型累計下載量突破 700 萬。通義落地應(yīng)用進程加速，現(xiàn)已進入 PC、手機、汽車、航空、天文、礦業(yè)、教育、醫(yī)療、餐飲、游戲、文旅等領(lǐng)域，成為最受中國企業(yè)歡迎的大模型。

周靖人表示，各行各業(yè)、各個企業(yè)都是特殊的，非常明確的就是讓基礎(chǔ)模型直接對接業(yè)務(wù)需求是很難的，因此現(xiàn)在的大模型落地一定要結(jié)合業(yè)務(wù)的場景。

小米旗下的人工智能助手“小愛同學(xué)”已與阿里云通義大模型達成合作，強化其在圖片生成、圖片理解等方面的多模態(tài) AI 生成能力，并在小米汽車、手機等多類設(shè)備落地。此外，微博、眾安保險、完美世界游戲等企業(yè)也宣布接入通義大模型，將大模型應(yīng)用于社交媒體、保險、游戲等領(lǐng)域。

更早之前，新東方、同程旅行、長安汽車、西部機場集團、親寶寶等企業(yè)也都與通義大模型達成合作。中國科學(xué)院國家天文臺人工智能組基于通義千問開源模型開發(fā)了新一代天文大模型“星語 3.0”，這是大模型首次應(yīng)用于天文觀測領(lǐng)域；陜煤建新煤礦等十余座礦山推出由通義大模型支持的新型礦山重大風(fēng)險識別處置系統(tǒng)，成為大模型在礦山場景的首次規(guī)?；涞?。

截至目前，通義大模型通過阿里云服務(wù)企業(yè)超過 9 萬、通過釘釘服務(wù)企業(yè)超過 220 萬。與此同時，海內(nèi)外大量中小企業(yè)和開發(fā)者以下載開源模型的方式使用通義，在 HuggingFace、魔搭 ModelScope 等開源社區(qū)，通義開源大模型的累計下載量超過了 700 萬。

在阿里云體系里，把模型能力和業(yè)務(wù)場景結(jié)合起來的紐帶就是百煉平臺。本次大會上，百煉升級成為阿里云承載云 +AI 能力的重要平臺，提供一站式、全托管的大模型定制與應(yīng)用服務(wù)。開發(fā)者可通過“拖拉拽”5 分鐘開發(fā)一款大模型應(yīng)用，幾小時“煉”出一個專屬模型，把精力專注于應(yīng)用創(chuàng)新。

周靖人介紹，當(dāng)下企業(yè)應(yīng)用大模型存在三種范式：一是對大模型開箱即用，二是對大模型進行微調(diào)和持續(xù)訓(xùn)練，三是基于模型開發(fā)應(yīng)用，其中最典型的需求是 RAG，以企業(yè)數(shù)據(jù)對大模型進行知識增強。圍繞這些需求，百煉打造了模型中心和應(yīng)用中心，提供最豐富的模型和最易用的工具箱。

百煉提供了提示詞模版、擁抱開源框架，包括提供開放靈活可配置的檢索增強應(yīng)用服務(wù)、提供實時 API 等，此外還提供可視化流程，提供微調(diào)和評測。

此外，百煉集成了上百款大模型，除了通義、Llama、ChatGLM 等系列，還托管百川等系列三方模型，覆蓋國內(nèi)外主流廠商，聯(lián)動魔搭開源社區(qū)，同時支持企業(yè)上架通用或行業(yè)模型，給開發(fā)者提供足夠多的模型選擇。

問世一年多來，通義大模型發(fā)展出了文生圖、智能編碼、文檔解析、音視頻理解等能力，企業(yè)客戶和開發(fā)者可以通過 API 調(diào)用、模型下載等方式接入通義，個人用戶可從通義 APP、官網(wǎng)和小程序免費使用通義家族全棧服務(wù)。

未來，阿里云的 AI 之路會走得如何，我們也拭目以待。

來源：AI前線

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

“我們堅持開源！”阿里云發(fā)布“地表最強”中文大模型：半年一迭代、性能翻倍？

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

“我們堅持開源！”阿里云發(fā)布“地表最強”中文大模型：半年一迭代、性能翻倍？

相關(guān)推薦

技術(shù)專區(qū)

“我們堅持開源！”阿里云發(fā)布“地表最強”中文大模型：半年一迭代、性能翻倍？