ChatGPT vs Google Bard：技術(shù)差異的比較

發(fā)布人：ygtu 時間：2023-08-04 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

Google Bard和ChatGPT之間最大的區(qū)別在于，在撰寫本文時，Bard知道ChatGPT，但ChatGPT卻不知道Bard。但是我可以玩ChatGPT，而Google Bard對我們大多數(shù)人來說仍然遙不可及。

推薦：使用NSDT場景編輯器助你快速搭建可二次編輯的3D應(yīng)用場景

ChatGPT 與 Google Bard之戰(zhàn)的開始

ChatGPT和Google Bard都是AI聊天機(jī)器人。這項(xiàng)技術(shù)的最簡單版本已經(jīng)存在于您的智能手機(jī)上 - 您鍵入“好”，您的手機(jī)預(yù)測您可能想要使用的下一個單詞是“早晨”。

ChatGPT最初由OpenAI開發(fā)，然后由Microsoft投資，達(dá)到令人瞠目結(jié)舌的10億美元（除了早期的1億美元投資）。谷歌對他們的搜索壟斷可能已經(jīng)結(jié)束感到有些恐慌，作為回應(yīng)，他們推出了Bard，他們的技術(shù)版本有一些缺陷。在第一次現(xiàn)場演示中，Bard犯了幾個事實(shí)錯誤。至少可以說，谷歌很尷尬。

ChatGPT和Google Bard比智能手機(jī)預(yù)測文本復(fù)雜一些，但要了解兩個AI聊天機(jī)器人之間的差異，這就是你需要知道的。

讓我們更深入地了解這兩個AI引擎之間的技術(shù)差異。

AI與Bard之間的對決：底層技術(shù)是什么？？

您可以在這里快速、輕松地了解兩種引擎之間的技術(shù)差異。正是如此。如果您想要更細(xì)致的外觀，請隨時進(jìn)一步滾動。

	查特	Bard
型	GPT-3.5	LaMDA，或?qū)υ拺?yīng)用程序的語言模型
神經(jīng)網(wǎng)絡(luò)架構(gòu)	變壓器	變壓器
訓(xùn)練數(shù)據(jù)	Web 文本，主要是一個名為“常見抓取”的數(shù)據(jù)集，將于 2021 年年中截止	1萬字的公共對話數(shù)據(jù)和網(wǎng)絡(luò)文本
目的	成為通用的文本生成聊天機(jī)器人	專門用于幫助輔助搜索
參數(shù)	175 億個參數(shù)	137 億個參數(shù)
造物主	開放人工智能	谷歌
優(yōu)勢	- 現(xiàn)在向所有人開放 - 更靈活，能夠使用開放式文本 - 訓(xùn)練數(shù)據(jù)在 2021 年截止	- 訓(xùn)練數(shù)據(jù)到現(xiàn)在 - 專門針對對話進(jìn)行訓(xùn)練，因此當(dāng)您使用它說話時聽起來更人性化
弱點(diǎn)	- 對話沒有那么令人信服 - 沒有仔細(xì)微調(diào)	- 目前不可用 - 可能不太適合一般文本創(chuàng)建

現(xiàn)在您已經(jīng)有了 TL;DR，讓我們更深入地了解所有這些指標(biāo)。

什么是ChatGPT？

ChatGPT 于 30 年 2022 月 4 日突然出現(xiàn)。到 2022 年 2023 月 100 日，該服務(wù)的每日用戶已超過 <> 萬。<> 年 <> 月，這一數(shù)字激增至 <> 億多用戶。

它立即流行起來的基本原因是它可以以一種聽起來幾乎人性化的方式為您提供許多主題的可靠回復(fù)，并且任何有互聯(lián)網(wǎng)連接的人都可以訪問它。

ChatGPT由OpenAI創(chuàng)建，OpenAI是一家位于舊金山的AI實(shí)驗(yàn)室，專注于創(chuàng)建友好的AI。聊天機(jī)器人位于 GPT-3.5 上，這是一個大型語言模型，當(dāng)給定文本時，可以繼續(xù)提示。

除此之外，ChatGPT 還得到了一些額外的培訓(xùn)——人類培訓(xùn)師通過與模型交互來改進(jìn)模型，并“獎勵”模型以獲得更高質(zhì)量的答案。

訓(xùn)練數(shù)據(jù)

GPT-3.5 是在一個巨大的網(wǎng)絡(luò)文本數(shù)據(jù)集上進(jìn)行訓(xùn)練的，其中包括一個名為 Common Crawl 的流行數(shù)據(jù)集。常見爬網(wǎng)包含 PB 級的 Web 數(shù)據(jù)，其中包含原始網(wǎng)頁數(shù)據(jù)、元數(shù)據(jù)提取和文本提取。例如，它包括來自StrataScratch的我們自己的URL集合。認(rèn)為 ChatGPT 是使用我們每天訪問的網(wǎng)站進(jìn)行訓(xùn)練是不是很瘋狂？

Common Crawl 負(fù)責(zé) 60% 的訓(xùn)練數(shù)據(jù)，但 GPT-3.5 也從其他來源獲取數(shù)據(jù)。

什么是Google Bard？

Bard是Google對ChatGPT受歡迎的回應(yīng)。與ChatGPT不同，Bard由Google自己的模型LaMDA提供支持，LaMDA是對話應(yīng)用程序語言模型的縮寫。與 ChatGPT 不同，它并不那么令人興奮，原因很簡單，大多數(shù)人還無法訪問它。盡管谷歌確實(shí)在二月初舉辦了一個充滿錯誤的Bard演示，但現(xiàn)在它只提供給少數(shù)人。

谷歌的Bard的主要優(yōu)勢是它對互聯(lián)網(wǎng)開放。問ChatGPT總統(tǒng)是誰，它不知道。這是因?yàn)橛?xùn)練數(shù)據(jù)在 2021 年年中左右被切斷。與此同時，Bard今天利用互聯(lián)網(wǎng)上的信息。問問Bard，理論上，Bard應(yīng)該能夠從今天互聯(lián)網(wǎng)上可用的數(shù)據(jù)中提取出來，告訴你總統(tǒng)是誰。

雖然你還不能試一試，但很容易看出Bard如何在幾個關(guān)鍵方面從 ChatGPT 中脫穎而出。

訓(xùn)練數(shù)據(jù)

首先，LaMDA接受了對話訓(xùn)練，專門用于在對話中交談，而不僅僅是像GPT-n模型那樣生成文本。雖然 ChatGPT 毫不掩飾其訓(xùn)練數(shù)據(jù)，但我們對 Bard 接受訓(xùn)練的數(shù)據(jù)知之甚少。

我們可以通過查看LaMDA的研究論文來推斷一下。谷歌的研究人員表示，12.5%的訓(xùn)練數(shù)據(jù)來自Common Crawl，就像GPT-n模型一樣。另外12.5%來自維基百科。根據(jù)研究論文，他們使用了1.56萬億字的“公共對話數(shù)據(jù)和網(wǎng)絡(luò)文本”。

以下是完整的細(xì)分：

12.5% 基于 C4 的數(shù)據(jù)（常見爬網(wǎng)數(shù)據(jù)的派生數(shù)據(jù)）

12.5% 英語維基百科

12.5%的代碼文檔來自編程問答網(wǎng)站、教程等

6.25% 英文網(wǎng)頁文檔

6.25% 非英文網(wǎng)頁文檔

50% 對話數(shù)據(jù)來自公共論壇

我們知道常見的抓取數(shù)據(jù)，顯然你知道維基百科。其余的呢？它是故意隱藏的，大概是為了保護(hù)Bard（和LaMDA）免受模仿者的侵害。

LaMDA是通過微調(diào)一系列基于Transformer的神經(jīng)語言模型而構(gòu)建的，這些模型是最初由Google開發(fā)的開源神經(jīng)網(wǎng)絡(luò)架構(gòu)。（有趣的旁注 - GPT 也是建立在變形金剛之上的。

ChatGPT有一些護(hù)欄來防止它變得太討厭或胡說八道，但谷歌已經(jīng)強(qiáng)調(diào)了他們?nèi)绾尉膭?chuàng)建質(zhì)量保證，使Bard成為更好，更安全的聊天機(jī)器人。Bard經(jīng)過微調(diào)，以促進(jìn)“質(zhì)量、接地氣和安全”。

谷歌對此有很多話要說，我建議閱讀他們關(guān)于它的博客文章，但如果你時間緊迫，它基本上可以分解為：

Bard應(yīng)該給出有意義的回應(yīng)——沒有荒謬，沒有矛盾
Bard應(yīng)該以一種好的方式給出有見地、詼諧或意想不到的回應(yīng)
Bard應(yīng)該避免任何對用戶造成傷害的風(fēng)險 - 血腥，偏見，仇恨的刻板印象等等
Bard不應(yīng)該編造東西

由于發(fā)布錯誤，我們已經(jīng)知道谷歌還沒有完全弄清楚這個最低要求。但值得注意的是，谷歌以一種ChatGPT沒有的方式如此清楚地談?wù)撨@些設(shè)計(jì)要求 - 至少現(xiàn)在還沒有。

ChatGPT vs 谷歌Bard：模型參數(shù)，為什么它很重要？

ChatGPT 確實(shí)比 Bard 擁有更多的模型參數(shù) - 175 億對 137 億。您可以將參數(shù)視為旋鈕或杠桿，模型會調(diào)整這些旋鈕或杠桿以適應(yīng)正在訓(xùn)練的數(shù)據(jù)。更多的參數(shù)通常意味著模型具有更大的能力來捕獲語言中的復(fù)雜關(guān)系，但它也存在過度擬合的風(fēng)險。

Google Bard可能不太靈活，但與ChatGPT相比，它對新語言用例的魯棒性也可能更強(qiáng)。

ChatGPT vs Google Bard：他們有什么共同點(diǎn)？

值得強(qiáng)調(diào)的是，Bard和ChatGPT都位于基于Transformer的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)上的模型（分別為LaMDA和GPT-3.5）。

例如，Transformer可以制作一個經(jīng)過訓(xùn)練來閱讀句子或段落的模型，注意這些單詞之間的關(guān)系，然后預(yù)測它認(rèn)為接下來會出現(xiàn)什么單詞 - 類似于智能手機(jī)的預(yù)測文本，正如我之前提到的。

我不會在這里深入討論雜草，但你需要知道的是，這意味著在他們的核心，Bard和 ChatGPT 彼此之間并沒有太大的不同。

ChatGPT vs 谷歌Bard：所有權(quán)

雖然所有權(quán)并不完全是技術(shù)差異，但值得牢記。

Google Bard由Google全資制作和擁有，位于LaMDA之上，LaMDA也是由Google創(chuàng)建的。

ChatGPT由位于舊金山的AI研究實(shí)驗(yàn)室OpenAI開發(fā)。OpenAI 最初是非營利性的，但它確實(shí)在 2019 年創(chuàng)建了一個營利性子公司。OpenAI也是Dall-E的幕后推手，Dall-E是你可能玩過的AI文本到圖像生成。

雖然Microsoft在OpenAI上投入了大量資金，但目前它是一家獨(dú)立的研究機(jī)構(gòu)。

哪個是最好的，ChatGPT和谷歌Bard？

很難對這個問題給出一個公平的答案，因?yàn)樗鼈兪侨绱讼嗨?，但又如此不同。首先，現(xiàn)在幾乎沒有人可以訪問Google Bard。另一方面，ChatGPT的訓(xùn)練數(shù)據(jù)在大約兩年前就被切斷了。

兩者都是文本生成器 - 您提供提示，Google Bard 和 ChatGPT 都可以回答它。兩者都有數(shù)十億個參數(shù)來微調(diào)模型。兩者都有重疊的訓(xùn)練數(shù)據(jù)源，并且都建立在 Transformer（相同的神經(jīng)網(wǎng)絡(luò)模型）上。

它們也是為不同的目的而設(shè)計(jì)的。Bard將幫助您瀏覽谷歌搜索。它被設(shè)計(jì)為對話式的。ChatGPT可以生成整個博客文章。它旨在吐出有意義的文本塊。

最終，ChatGPT和Google Bard之間的技術(shù)差異只是強(qiáng)調(diào)了AI驅(qū)動的文本生成技術(shù)已經(jīng)走了多遠(yuǎn)。雖然它們都有很長的路要走，并且在版權(quán)和道德方面都面臨爭議，但這兩個生成器都是現(xiàn)代人工智能模型的有力演示。

原文鏈接：ChatGPT vs Google Bard：技術(shù)差異的比較 (mvrlink.com)

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

ChatGPT vs Google Bard：技術(shù)差異的比較

相關(guān)推薦

技術(shù)專區(qū)