新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

作者：時間：2023-12-12 來源：量子位

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

一條神秘磁力鏈接引爆整個 AI 圈，現(xiàn)在，正式測評結果終于來了：

本文引用地址：http://www.butianyuan.cn/article/202312/453814.htm

首個開源 MoE 大模型 Mixtral 8x7B，已經達到甚至超越了 Llama 2 70B 和 GPT-3.5 的水平。

（對，就是傳聞中 GPT-4 的同款方案。）

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

并且由于是稀疏模型，處理每個 token 僅用了 12.9B 參數(shù)就做到了這般成績，其推理速度和成本也與 12.9B 的密集模型相當。

消息一出，再次在社交媒體上掀起討論熱潮。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

OpenAI 創(chuàng)始成員 Andrej Karpathy 第一時間趕到現(xiàn)場整理起了筆記，還高亮出了重點：這家“歐版 OpenAI”透露出的最強模型，還只是“中杯”。

p.s. Mixtral 8×7B 甚至只是小杯……

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

英偉達 AI 科學家 Jim Fan 則贊說：

每個月都會有十幾個新的模型冒出來，但真正能經得住檢驗的卻寥寥無幾，能引發(fā)大家伙熱烈關注的就更少了。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

并且這波啊，不僅是模型背后公司 Mistral AI 大受關注，也帶動 MoE（Mixture of Experts）再次成為開源 AI 社區(qū)的最火議題。

HuggingFace 官方就趁熱發(fā)布了一篇 MoE 的解析博文，同樣打出了“轉發(fā)如潮”的效果。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

值得關注的是，Mistral AI 的最新估值已經沖破 20 億美元，在短短 6 個月中增長了 7 倍多……

基本超越 Llama 2 70B

說起來，Mistral AI 這家公司也是不走尋常路。隔壁大廠前腳剛轟轟烈烈搞發(fā)布會，慢慢悠悠發(fā)模型，他們可倒好，直接來了個程序顛倒：

先甩鏈接開放下載，又給 vLLM 項目（一個大模型推理加速工具）提了 PR，最后才想起來發(fā)布技術博客給自家模型整了個正經官宣。

△ 模型一開始是醬嬸發(fā)布的

那么還是先來看看，官方給出了哪些信息，與這兩天吃瓜群眾自己扒出來的細節(jié)有何不同。

首先，官方自信地表示：

Mixtral 8×7B 在大多數(shù)基準測試中都優(yōu)于 Llama 2 70B，推理速度快了 6 倍。
它是最強大的、具有寬松許可的開放權重模型，也是最佳性價比之選。

具體來說，Mixtral 采用了稀疏混合專家網(wǎng)絡，是一個 decoder-only 的模型。在其中，前饋塊會從 8 組不同的參數(shù)組中進行選擇 ——

也就是說，實際上，Mixtral 8×7B 并不是 8 個 7B 參數(shù)模型的集合，僅僅是 Transformer 中的前饋塊有不同的 8 份。

這也就是為什么 Mixtral 的參數(shù)量并不是 56B，而是 46.7B。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

其特點包括以下幾個方面：

在大多數(shù)基準測試中表現(xiàn)優(yōu)于 Llama 2 70B，甚至足以擊敗 GPT-3.5
上下文窗口為 32k
可以處理英語、法語、意大利語、德語和西班牙語
在代碼生成方面表現(xiàn)優(yōu)異
遵循 Apache 2.0 許可（免費商用）

具體測試結果如下：

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

另外，在幻覺問題方面，Mixtral 的表現(xiàn)也由于 Llama 2 70B：

在 TruthfulQA 基準上的成績是 73.9% vs 50.2%；在 BBQ 基準上呈現(xiàn)更少的偏見；在 BOLD 上，Mixtral 顯示出比 Llama 2 更積極的情緒。

此次與 Mixtral 8×7B 基礎版本一起發(fā)布的，還有 Mixtral 8x7B Instruct 版本。后者經過 SFT 和 DPO 優(yōu)化，在 MT-Bench 上拿到了 8.3 的分數(shù)，跟 GPT-3.5 差不多，優(yōu)于其他開源大模型。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

目前，Mistral 官方已經宣布上線 API 服務，不過還是邀請制，未受邀用戶需要排隊等待。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

值得關注的是，API 分為三個版本：

小小杯（Mistral-tiny），對應模型是 Mistral 7B Instruct；
小杯（Mistral-small），對應模型是這次發(fā)布的 Mixtral 8×7B；
中杯（Mistral-medium），對應的模型尚未公布，但官方透露其在 MT-Bench 上的得分為 8.6 分。

有網(wǎng)友直接把 GPT-4 拉過來對比了一下?？梢钥吹?，中杯模型在 WinoGrande（常識推理基準）上的得分超過了 GPT-4。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

價格方面，小小杯到中杯的輸入和輸出價格分別是每一百萬 token0.14~2.5 歐元和 0.42~7.5 歐元不等，嵌入模型則是 0.1 歐元每百萬 token（1 歐元約合 7.7 人民幣）。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

而在線版本，目前還只能到第三方平臺（Poe、HuggingFace 等）體驗。

能看懂中文，但不太愿意說

雖然官方通告中并沒有說支持中文，但我們實測（HuggingFace Chat 中的在線版，模型為 Instruct 版本）發(fā)現(xiàn)，Mixtral 至少在理解層面上已經具備一定中文能力了。

生成層面上，Mixtral 不太傾向于用中文來回答，但如果指明的話也能得到中文回復，不過還是有些中英混雜的情況。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

面對更多的“弱智吧”問題，Mixtral 的回答雖中規(guī)中矩，但看上去至少已經理解了字面含義。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

數(shù)學方面，面對經典的雞兔同籠問題，Mixtral 的回答從過程到結果都完全正確。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

即使是高等數(shù)學問題，比如復雜的函數(shù)求導，Mixtral 也能給出正確答案，更難能可貴的是過程沒什么問題。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

而此次的官方通告中專門強調了 Mixtral 的代碼能力很強，所以也受到了我們的重點考察。

一道困難難度的 LeetCode 下來，Mixtral 給出的代碼一次就通過了測試。

給你一個未排序的整數(shù)數(shù)組 nums，請你找出其中沒有出現(xiàn)的最小的正整數(shù)。
請你實現(xiàn)時間復雜度為 O (n) 并且只使用常數(shù)級別額外空間的解決方案。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

但隨著我們繼續(xù)提問，Mixtral 的回答一不小心暴露了自己可能專門針對 LeetCode 做過訓練，而且還是中文版 LC。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

為了更加真實地展示 Mixtral 的代碼能力，我們轉而讓它編寫實用程序 —— 用 JS 寫一個 Web 版計算器。

經過幾輪調整之后，雖然按鈕的布局有些奇怪，但基本的四則運算已經可以完成了。

此外我們會發(fā)現(xiàn)，如果在同一個對話窗口中不斷補充新的要求，Mixtral 的表現(xiàn)可能會有所下降，出現(xiàn)代碼格式混亂等問題，開啟新一輪對話后則會恢復正常。

開源大模型超越 GPT-3.5！爆火 MoE 實測結果出爐，網(wǎng)友：OpenAI 越來越沒護城河了

除了 API 和在線版本，Mistral AI 還提供了模型下載服務，可以用

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： OpenAI ChatGPT AI

評論

相關推薦

大嘴業(yè)話-AI目前市場分析

視頻人工智能，AI，ChatGPT，互聯(lián)網(wǎng)技術 | 2023-04-25

蘋果承認：AI模型使用谷歌定制芯片訓練

智能計算蘋果 AI 谷歌定制芯片 | 2024-07-30

蘋果表示其AI模型是在谷歌的定制芯片上訓練的

智能計算 AI | 2024-07-30

釋說芯語16：硬科技：構建企業(yè)未來之路（附PPT）

jackwang | 2018-10-22

iCAN-4017 AI功能模塊

資源下載周立功單片機功能模塊 iCAN-4017 AI | 2007-03-30

如何快速搭建手寫體識別演示系統(tǒng)

視頻 digikey AI 手寫體識別 | 2022-07-29

AI驅動的嵌入式聲音和振動識別

視頻 ADI AI 嵌入式 OtoSense | 2018-10-23

萬家樂JSYZ5-AI燃氣熱水器電路圖

設計方案電路圖熱水器燃氣 JSYZ5-AI 萬家樂 | 2013-01-17

HBM4持續(xù)加速：AI時代競爭新焦點

網(wǎng)絡與存儲 HBM AI 內存 | 2024-07-25

摩根士丹利：僅 GB200 AI 服務器業(yè)務，就為英偉達創(chuàng)造 2100 億美元年收入

智能計算 GB200 AI 英偉達 GPU | 2024-07-26

瑞薩電子AI單元解決方案成功提高GE醫(yī)療（日本）日野工廠的生產力

winni945 | 2018-09-12

iPhone 16將不會預裝AI功能？計劃通過iOS 18.1發(fā)布

iPhone AI iOS | 2024-07-30

消息稱 OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

“破局AI開發(fā)，釋放邊緣算力開發(fā)者訪談”，干貨滿滿！

視頻 intel AI OpenVINO | 2021-06-10

CSR8670CSR8675智能語音Alexa藍牙方案開發(fā)

資源下載 AI 智能語音 | 2017-12-14

加大調整力度，教育部支持高校布局集成電路、AI 等專業(yè)

智能計算教育 AI 集成電路 | 2024-07-25

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計算 openAI SearchGPT 谷歌 | 2024-07-26

2021春晚黑科技，火爆全網(wǎng)的\"打工牛\"是什么來頭？

視頻 AI 機器人 | 2021-02-26

EEPW2018年6月刊(5G)

資源下載 5G AI | 2018-06-11

海聯(lián)達（Aigale）Ai-HD1 無線全高清套件拆解

zhuwei0710 | 2013-04-28

電子元件培訓教材

資源下載 NBA 電子元件識別電阻識別電容識別 AI MI SMT DIP 靜電防護 | 2008-09-20

繼上次海聯(lián)達Ai-ap100拆機之電源改造

zhuwei0710 | 2013-04-03

人工智能是如何幫助阻止造假者的？

謝丫丫 | 2018-08-14

EEPW2018年3月刊(工業(yè)物聯(lián)網(wǎng))

資源下載工業(yè)物聯(lián)網(wǎng) AI | 2018-03-12

為什么OpenAI今年可能會虧損50億美元？

智能計算 OpenAI 虧損 ChatGPT | 2024-07-25

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

WTC-AI型太陽能熱水器電路圖

設計方案電子電路圖，WTC-AI 太陽能熱水器電路熱水器 | 2012-07-30

國際奧委會：最大限度發(fā)揮 AI 工具影響力，體育人才選拔方式有望得到革新

智能計算 AI 奧運會體育 | 2024-07-26

焦點

推薦視頻

技術專區(qū)

關閉