最強開源大模型亮相：開發(fā)2個月，花費約1000萬美元

作者：時間：2024-03-28 來源：網(wǎng)易科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

3月28日消息，美國當?shù)貢r間周三，企業(yè)軟件公司Databricks宣布推出了新的開源人工智能模型DBRX，聲稱這一模型在開源人工智能領域的效率和性能上樹立了新的行業(yè)標準。

本文引用地址：http://butianyuan.cn/article/202403/456927.htm

Databricks宣稱，DBRX模型擁有1320億個參數(shù)，在語言理解、編程和數(shù)學技能等關鍵領域的基準測試中，其性能超過了其他領先的開源人工智能模型，包括Meta的Llama 2-70B和法國初創(chuàng)企業(yè)Mixtral AI的模型。

無標題.jpg

雖然DBRX在某些原始功能上還無法與OpenAI的GPT-4相比，但Databricks高管表示，DBRX無疑是一個功能遠超GPT-3.5的替代產(chǎn)品，并且成本只是GPT-3.5的一小部分。

無標題.jpg

Databricks的首席執(zhí)行官阿里·戈德西（Ali Ghodsi）在新聞發(fā)布會上表示：“我們非常高興能向全世界展示DBRX，并帶動整個行業(yè)向更強大、更高效的開源人工智能方向前進。雖然GPT-4這類基礎模型無疑是極其優(yōu)秀的通用工具，但Databricks專注于為客戶量身打造模型，這些模型能深入解析他們的專有數(shù)據(jù)。DBRX的發(fā)布正體現(xiàn)了我們實現(xiàn)該目標的決心。”

創(chuàng)新的“專家混合”架構

Databricks的研究團隊揭示了DBRX模型的關鍵創(chuàng)新之處——“專家混合”架構。這一架構使DBRX與其他競爭模型顯著不同，后者往往利用所有參數(shù)生成每個單詞。相較而言，DBRX巧妙地整合了16個專家子模型，并在實時處理中為每個token準確挑選最相關的四個子模型。

這種設計的巧妙之處在于，它使DBRX在任何時刻只需激活360億個參數(shù)，因而實現(xiàn)了更高的性能輸出。這不僅顯著提高了模型的處理速度，還大幅降低了運行成本，使其更為高效和經(jīng)濟。

這一創(chuàng)新策略是基于Mosaic團隊在早期Mega-MoE項目上的進一步研究而開發(fā)的。Mosaic團隊是去年被Databricks收購的一個研究部門。

戈德西高度評價了Mosaic團隊的貢獻，他表示：“多年來，Mosaic團隊在更高效訓練基礎人工智能模型方面取得了顯著進步。正是他們的努力讓我們能夠迅速開發(fā)出如DBRX這般卓越的人工智能模型。實際上，開發(fā)DBRX只用了約兩個月時間，成本大概在1000萬美元左右?！?/p>

推進Databricks的企業(yè)AI戰(zhàn)略

通過將DBRX開源，Databricks的目標不僅是在前沿人工智能研究領域確立其領導者地位，而且還希望促進其創(chuàng)新架構在整個行業(yè)中的更廣泛采用。此外，DBRX也致力于支持Databricks的核心業(yè)務——為客戶定制和托管基于其專有數(shù)據(jù)集的人工智能模型。

在如今的市場環(huán)境中，很多Databricks的客戶都依賴于OpenAI及其他供應商提供的GPT-3.5等模型來支撐其業(yè)務運作。然而，將敏感的企業(yè)數(shù)據(jù)托管給第三方，常常會激起關于安全性和合規(guī)性的一系列擔憂。

針對這一點，戈德西表示：“我們的客戶相信，Databricks能夠妥善處理跨國界數(shù)據(jù)監(jiān)管的問題。他們已在Databricks平臺上存儲并管理了龐大數(shù)據(jù)量?，F(xiàn)在，有了DBRX以及Mosaic的定制模型功能，客戶們能夠在保障數(shù)據(jù)安全的同時，充分利用先進人工智能技術帶來的諸多益處。”

在日益激烈的競爭中占據(jù)一席之地

隨著DBRX的推出，Databricks在核心數(shù)據(jù)和人工智能平臺業(yè)務領域面臨著激烈的競爭。競爭對手諸如數(shù)據(jù)倉庫巨頭Snowflake已通過推出自有的人工智能服務Cortex，復制了Databricks的部分功能。同時，亞馬遜、微軟和谷歌等領先的云計算服務供應商也正紛紛在其技術堆棧中集成生成式人工智能功能。

Databricks借助其開創(chuàng)性的開源項目DBRX，自詡具備最前沿的人工智能研究能力，旨在確立自身作為該領域領導者的地位，并吸引頂尖的數(shù)據(jù)科學人才。這一策略也反映了人們對大型科技公司將人工智能模型商業(yè)化的越來越多的抵制，許多人批評這些商業(yè)模型像“黑盒子”，缺乏透明度和可解釋性。

DBRX面臨的真正挑戰(zhàn)在于市場的接受程度以及它為Databricks客戶所創(chuàng)造的具體價值。在企業(yè)越來越多尋求利用人工智能推動業(yè)務增長和創(chuàng)新的同時，還要保持對自有數(shù)據(jù)的控制，Databricks賭注于其尖端研究與企業(yè)級平臺的完美融合能夠讓它在競爭中脫穎而出。

Databricks已經(jīng)向大型科技公司及開源社區(qū)的競爭對手拋出了挑戰(zhàn)，要求他們在創(chuàng)新上與其一較高下。人工智能領域的競爭日趨激烈，而Databricks已明確宣布其志在成為這場競爭的關鍵力量。

新聞中心

最強開源大模型亮相：開發(fā)2個月，花費約1000萬美元

評論

相關推薦

技術專區(qū)

新聞中心

最強開源大模型亮相：開發(fā)2個月，花費約1000萬美元

評論

相關推薦

技術專區(qū)

最強開源大模型亮相：開發(fā)2個月，花費約1000萬美元