新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 最強(qiáng)開源大模型亮相:開發(fā)2個(gè)月,花費(fèi)約1000萬(wàn)美元

最強(qiáng)開源大模型亮相:開發(fā)2個(gè)月,花費(fèi)約1000萬(wàn)美元

作者: 時(shí)間:2024-03-28 來源:網(wǎng)易科技 收藏

3月28日消息,美國(guó)當(dāng)?shù)貢r(shí)間周三,企業(yè)軟件公司宣布推出了新的,聲稱這一模型在開源人工智能領(lǐng)域的效率和性能上樹立了新的行業(yè)標(biāo)準(zhǔn)。

本文引用地址:http://www.butianyuan.cn/article/202403/456927.htm

宣稱,模型擁有1320億個(gè)參數(shù),在語(yǔ)言理解、編程和數(shù)學(xué)技能等關(guān)鍵領(lǐng)域的基準(zhǔn)測(cè)試中,其性能超過了其他領(lǐng)先的,包括Meta的Llama 2-70B和法國(guó)初創(chuàng)企業(yè)Mixtral AI的模型。

無標(biāo)題.jpg

雖然在某些原始功能上還無法與OpenAI的GPT-4相比,但高管表示,DBRX無疑是一個(gè)功能遠(yuǎn)超GPT-3.5的替代產(chǎn)品,并且成本只是GPT-3.5的一小部分。

無標(biāo)題.jpg

Databricks的首席執(zhí)行官阿里·戈德西(Ali Ghodsi)在新聞發(fā)布會(huì)上表示:“我們非常高興能向全世界展示DBRX,并帶動(dòng)整個(gè)行業(yè)向更強(qiáng)大、更高效的開源人工智能方向前進(jìn)。雖然GPT-4這類基礎(chǔ)模型無疑是極其優(yōu)秀的通用工具,但Databricks專注于為客戶量身打造模型,這些模型能深入解析他們的專有數(shù)據(jù)。DBRX的發(fā)布正體現(xiàn)了我們實(shí)現(xiàn)該目標(biāo)的決心?!?/p>

創(chuàng)新的“專家混合”架構(gòu)

Databricks的研究團(tuán)隊(duì)揭示了DBRX模型的關(guān)鍵創(chuàng)新之處——“專家混合”架構(gòu)。這一架構(gòu)使DBRX與其他競(jìng)爭(zhēng)模型顯著不同,后者往往利用所有參數(shù)生成每個(gè)單詞。相較而言,DBRX巧妙地整合了16個(gè)專家子模型,并在實(shí)時(shí)處理中為每個(gè)token準(zhǔn)確挑選最相關(guān)的四個(gè)子模型。

這種設(shè)計(jì)的巧妙之處在于,它使DBRX在任何時(shí)刻只需激活360億個(gè)參數(shù),因而實(shí)現(xiàn)了更高的性能輸出。這不僅顯著提高了模型的處理速度,還大幅降低了運(yùn)行成本,使其更為高效和經(jīng)濟(jì)。

這一創(chuàng)新策略是基于Mosaic團(tuán)隊(duì)在早期Mega-MoE項(xiàng)目上的進(jìn)一步研究而開發(fā)的。Mosaic團(tuán)隊(duì)是去年被Databricks收購(gòu)的一個(gè)研究部門。

戈德西高度評(píng)價(jià)了Mosaic團(tuán)隊(duì)的貢獻(xiàn),他表示:“多年來,Mosaic團(tuán)隊(duì)在更高效訓(xùn)練基礎(chǔ)人工智能模型方面取得了顯著進(jìn)步。正是他們的努力讓我們能夠迅速開發(fā)出如DBRX這般卓越的人工智能模型。實(shí)際上,開發(fā)DBRX只用了約兩個(gè)月時(shí)間,成本大概在1000萬(wàn)美元左右。”

推進(jìn)Databricks的企業(yè)AI戰(zhàn)略

通過將DBRX開源,Databricks的目標(biāo)不僅是在前沿人工智能研究領(lǐng)域確立其領(lǐng)導(dǎo)者地位,而且還希望促進(jìn)其創(chuàng)新架構(gòu)在整個(gè)行業(yè)中的更廣泛采用。此外,DBRX也致力于支持Databricks的核心業(yè)務(wù)——為客戶定制和托管基于其專有數(shù)據(jù)集的人工智能模型。

在如今的市場(chǎng)環(huán)境中,很多Databricks的客戶都依賴于OpenAI及其他供應(yīng)商提供的GPT-3.5等模型來支撐其業(yè)務(wù)運(yùn)作。然而,將敏感的企業(yè)數(shù)據(jù)托管給第三方,常常會(huì)激起關(guān)于安全性和合規(guī)性的一系列擔(dān)憂。

針對(duì)這一點(diǎn),戈德西表示:“我們的客戶相信,Databricks能夠妥善處理跨國(guó)界數(shù)據(jù)監(jiān)管的問題。他們已在Databricks平臺(tái)上存儲(chǔ)并管理了龐大數(shù)據(jù)量?,F(xiàn)在,有了DBRX以及Mosaic的定制模型功能,客戶們能夠在保障數(shù)據(jù)安全的同時(shí),充分利用先進(jìn)人工智能技術(shù)帶來的諸多益處?!?/p>

在日益激烈的競(jìng)爭(zhēng)中占據(jù)一席之地

隨著DBRX的推出,Databricks在核心數(shù)據(jù)和人工智能平臺(tái)業(yè)務(wù)領(lǐng)域面臨著激烈的競(jìng)爭(zhēng)。競(jìng)爭(zhēng)對(duì)手諸如數(shù)據(jù)倉(cāng)庫(kù)巨頭Snowflake已通過推出自有的人工智能服務(wù)Cortex,復(fù)制了Databricks的部分功能。同時(shí),亞馬遜、微軟和谷歌等領(lǐng)先的云計(jì)算服務(wù)供應(yīng)商也正紛紛在其技術(shù)堆棧中集成生成式人工智能功能。

Databricks借助其開創(chuàng)性的開源項(xiàng)目DBRX,自詡具備最前沿的人工智能研究能力,旨在確立自身作為該領(lǐng)域領(lǐng)導(dǎo)者的地位,并吸引頂尖的數(shù)據(jù)科學(xué)人才。這一策略也反映了人們對(duì)大型科技公司將人工智能模型商業(yè)化的越來越多的抵制,許多人批評(píng)這些商業(yè)模型像“黑盒子”,缺乏透明度和可解釋性。

DBRX面臨的真正挑戰(zhàn)在于市場(chǎng)的接受程度以及它為Databricks客戶所創(chuàng)造的具體價(jià)值。在企業(yè)越來越多尋求利用人工智能推動(dòng)業(yè)務(wù)增長(zhǎng)和創(chuàng)新的同時(shí),還要保持對(duì)自有數(shù)據(jù)的控制,Databricks賭注于其尖端研究與企業(yè)級(jí)平臺(tái)的完美融合能夠讓它在競(jìng)爭(zhēng)中脫穎而出。

Databricks已經(jīng)向大型科技公司及開源社區(qū)的競(jìng)爭(zhēng)對(duì)手拋出了挑戰(zhàn),要求他們?cè)趧?chuàng)新上與其一較高下。人工智能領(lǐng)域的競(jìng)爭(zhēng)日趨激烈,而Databricks已明確宣布其志在成為這場(chǎng)競(jìng)爭(zhēng)的關(guān)鍵力量。



評(píng)論


技術(shù)專區(qū)

關(guān)閉