開源之爭:馬斯克起訴OpenAI后宣布開源Grok
馬斯克宣布將在本周開源xAI的聊天機器人Grok,并且再度炮轟OpenAI是個謊言(OpenAI is a lie)。他曾在去年吐槽稱,OpenAI中的“Open”本意是開放源代碼,它是作為非營利性開放源代碼創(chuàng)建的,而現(xiàn)在它卻成了一個追求最大利潤的封閉源代碼。
本文引用地址:http://butianyuan.cn/article/202403/456249.htm早在去年11月,馬斯克在參與一場播客時就公開表示,OpenAI的“閉源”行為不可取,xAI的Grok將采取開源路線。
馬斯克旗下的AI
2023年7月,馬斯克成立了人工智能公司xAI。同年11月,xAI團隊正式發(fā)布其首個AI大模型產品Grok。目前的Grok跟此前OpenAI發(fā)布的GPT-3.5形式差不多,但是測試結果顯示,它在數(shù)學、代碼和多學科知識評測中比GPT-3.5表現(xiàn)得更好。
Grok背靠馬斯克旗下的老牌社交媒體平臺X(前身為Twitter),使用了X上的大量數(shù)據(jù)進行訓練,且可以實時訪問X平臺的所有信息。馬斯克曾表示這是收購推特的附加福利,可以用來“喂養(yǎng)”人工智能,接受現(xiàn)實中人類發(fā)言和對話信息的訓練。另外,他還有來自特斯拉的導航和視頻數(shù)據(jù),可能將使其團隊開發(fā)的聊天機器人不限于文本生成。
目前并不清楚Grok背后哪些模型會開源,但通常來說,發(fā)布開源模型有助于社區(qū)展開大規(guī)模的測試和反饋,意味著模型本身的迭代速度也能加快。
當然,馬斯克將xAI的大模型開源,本身也有可能一種運營手段。假設馬斯克“說到做到”,外界將得以見到Grok背后的代碼,同時將其與Meta的Llama 2、法國的Mistral等開源賽道的主要玩家相互比較。
開源之爭
今年2月29日,馬斯克在舊金山法院起訴了OpenAI及其首席執(zhí)行官山姆·奧特曼,提出了包括違反合同、違反信托義務和不公平商業(yè)行為在內的索賠。馬斯克稱,OpenAI選擇了不公開其研究和技術,實際上已成為受微軟控制的閉源子公司,違背了其成立時的初衷,即為人類福祉而非利益開發(fā)人工智能。
除了一系列違約指控外,馬斯克還特意要求法院裁定OpenAI恢復開源;OpenAI方面也拿出證據(jù)稱,馬斯克在郵件中曾認可OpenAI的不開源決定。
2023年3月,OpenAI發(fā)布了AI語言模型GPT-4,并分享了GPT-4的大量測試結果以及一些有趣的演示,但基本上沒有提供有關用于訓練系統(tǒng)的數(shù)據(jù)、用于創(chuàng)建該系統(tǒng)的特定硬件或方法的信息。當時,馬斯克就開源問題稱OpenAI是作為開源的非營利性公司創(chuàng)立,目的是與谷歌抗衡,而現(xiàn)在卻成為封閉源代碼的公司 —— “如今落入了無情的壟斷企業(yè)之手”。對此,奧特曼表示自己沒有從這家初創(chuàng)公司大舉獲利,他理解馬斯克的批評是真實的擔憂,但是認為他還沒有完全認識到人工智能安全問題的復雜性。
全球科技巨頭在生成式人工智能的發(fā)展中已經(jīng)分化為開源和閉源兩種。
· 開源模型即開放源代碼,將模型的源代碼和技術細節(jié)公開,允許用戶根據(jù)自身需要對模型進行使用和修改,目前,Meta的LLaMA、StabilityAI的Stable Diffusion、國內阿里的通義千問都屬于開源模型。
· 閉源模型則與之相反,不開放源代碼和技術細節(jié),且不允許用戶對模型本身進行更改。目前,OpenAI的ChatGPT、谷歌的Gemini、國內的百度文心一言都屬于閉源模型。
總體而言,閉源模式更有利益保護知識產權和商業(yè)利益,讓模型提供方對模型的研發(fā)和優(yōu)化擁有更多的控制權,確保模型的質量和安全;而開源模式則讓技術得以共享,繁榮了開發(fā)者生態(tài),能夠吸引眾多人才加入,推動大模型加速迭代和創(chuàng)新。
不過也有研究顯示,相較于開源來說,閉源模型相對更成熟、數(shù)據(jù)質量更有保障。業(yè)內的一個普遍共識是,目前閉源大模型的能力和性能總體領先于開源大模型。
評論