新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > 深言科技聯(lián)合清華大學(xué)開源 LingoWhale-8B 模型:免費(fèi)商用,號稱性能超 GPT-3.5 Turbo

深言科技聯(lián)合清華大學(xué)開源 LingoWhale-8B 模型:免費(fèi)商用,號稱性能超 GPT-3.5 Turbo

作者: 時間:2023-11-03 來源:IT之家 收藏

IT之家 11 月 3 日消息,據(jù)官方公眾號消息,由與清華大學(xué) NLP 實(shí)驗(yàn)室共同研發(fā)的語鯨 LingoWhale-8B 模型目前已面向社會開源,對學(xué)術(shù)研究完全開放,允許免費(fèi)商用。

本文引用地址:http://butianyuan.cn/article/202311/452462.htm

IT之家經(jīng)過查詢得知,LingoWhale-8B 模型是擁有約 80 億參數(shù)的中英雙語大語言模型,在 C-Eval、MMLU、CMMLU 等多個權(quán)威的公開評測基準(zhǔn)上,在 10B 以下開源模型據(jù)稱“達(dá)到領(lǐng)先效果”。

不過官方同時聲稱,受模型參數(shù)量影響,固有的幻覺問題、數(shù)學(xué)計(jì)算能力相對較弱、生成內(nèi)容有無法預(yù)見性等問題在 LingoWhale-8B 模型中仍然存在。

在性能方面,截至 10 月 24 日,在中文領(lǐng)域權(quán)威評測 C-Eval 中,LingoWhale-8B 模型的性能僅次于 GPT-4。在 C-Eval、CMMLU、GAOKAO 測評中,性能超過 GPT-3.5Turbo,在 10B 以下尺寸模型中性能處于領(lǐng)先位置。

圖片

官方給予了一些典型示例,以介紹 LingoWhale-8B 模型的特點(diǎn)。

圖片

圖片

官方據(jù)此表示,LingoWhale-8B 模型具有一定數(shù)學(xué)運(yùn)算能力。

在以上示例中,LingoWhale-8B 模型能夠根據(jù)上文正確地列式并進(jìn)行運(yùn)算,包括函數(shù)求導(dǎo)、函數(shù)值計(jì)算、切線方程計(jì)算等操作,并最終得到結(jié)果。

而在代碼聲稱方面,官方也同時提供了一些演示:

圖片

LingoWhale-8B 具有強(qiáng)大的代碼理解與生成能力,能夠更好地生成代碼并解決具體的問題。在本示例中,LingoWhale-8B 模型生成了詳細(xì)的 python 代碼以及注釋信息,幫助用戶更好地理解并使用生成的代碼。

在邏輯方面,官方也同樣進(jìn)行了舉例:

圖片

LingoWhale-8B 模型具有解決復(fù)雜邏輯推理任務(wù)的能力。在以上的例子中,LingoWhale-8B 將復(fù)雜的邏輯問題進(jìn)行拆解,按步驟進(jìn)行分析并解決問題。

上下文對話

樣例:

圖片

在以上示例中,LingoWhale-8B 模型表現(xiàn)出了較強(qiáng)的角色扮演、方案設(shè)計(jì)、長文本理解以及多輪對話能力,能夠根據(jù)用戶需求制定方案并組織結(jié)構(gòu)化的輸出,應(yīng)對更加復(fù)雜的任務(wù)場景。

知識百科

樣例 1:

圖片

圖片

官方表示,在上面兩個例子中,相較于 GPT-3.5,LingoWhale-8B 模型生成的結(jié)果更加準(zhǔn)確詳實(shí)。

經(jīng)過在大規(guī)模高質(zhì)量語料上的預(yù)訓(xùn)練,LingoWhale-8B 模型掌握了多個領(lǐng)域的知識,包括科學(xué)、歷史、文學(xué)、藝術(shù)等,能夠理解并回答各種知識相關(guān)問題,提供準(zhǔn)確詳細(xì)的答案。

IT之家的小伙伴們可以在官方 GitHub 頁面中獲取更多詳細(xì)信息:點(diǎn)此訪問




關(guān)鍵詞: 深言科技 AI 大模型

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉