字節(jié)跳動(dòng)類ChatGPT產(chǎn)品「豆包」邀測,我們先試了一下
還在測試,名字很 Q。
ChatGPT 問世以后,這大半年的時(shí)間,科技領(lǐng)域整個(gè)被大模型洗禮了一遍。
在國內(nèi),由百度、阿里代表中國科技企業(yè)率先發(fā)布了大模型對話平臺(tái)文心一言、通義千問,騰訊、京東在行業(yè)大模型上也已經(jīng)出手,華為探索了,同時(shí)也有一批創(chuàng)業(yè)公司積極參與這場科技競賽。
你是不是也好奇加期待,字節(jié)跳動(dòng)的大模型在哪里?
如今,它終于露相了。
昨天,字節(jié)跳動(dòng)大模型對話產(chǎn)品「豆包」邀測,用戶可通過網(wǎng)頁或者下載 App 體驗(yàn)這一人工智能助手。
「豆包」鏈接:https://www.doubao.com/
「豆包」有哪些能力?體驗(yàn)起來效果如何?機(jī)器之心首先下口,嘗了「豆包」。
「豆包」初體驗(yàn)
我們對「豆包」基本問答、常識(shí)問答、寫作能力和數(shù)學(xué)能力四個(gè)方面進(jìn)行了簡單測試。
基本問答
先讓「豆包」做個(gè)自我介紹:
從「豆包」的回答中,我們發(fā)現(xiàn)它主要具備自然語言處理、知識(shí)回答、語言翻譯、文本摘要、情感分析幾大能力:
對大型語言模型(LLM)來說,訓(xùn)練數(shù)據(jù)非常重要,直接影響模型掌握的信息和生成結(jié)果的質(zhì)量?!付拱贡硎酒溆?xùn)練數(shù)據(jù)截止到 2023 年:
為了驗(yàn)證這一點(diǎn),我們詢問它是否知道 2023 年 3 月 OpenAI 推出的大型語言模型 GPT-4,顯然,它知道。
常識(shí)問答
我們進(jìn)一步詢問一些應(yīng)用型問題,比如「你知道機(jī)器之心嗎」,「豆包」的回答可以說是非常準(zhǔn)確詳盡了:
如果我們想擬一個(gè)招聘文案,招聘要求里應(yīng)該闡明哪些工作能力呢,「豆包」給出了答案:
我們又問了一個(gè)與英語學(xué)習(xí)相關(guān)的問題:如何提高英語寫作能力,「豆包」的回答從讀寫練習(xí)、詞匯語法、寫作技巧、尋求反饋等方面給出了合理建議,條理清晰:
寫作能力
除了對話問答,文本寫作也是大模型的一個(gè)重要任務(wù),具有廣泛的應(yīng)用前景。為了測試「豆包」的寫作能力,我們讓它編寫了一個(gè)關(guān)于「未來人工智能」的科幻故事:
整個(gè)故事以人工智能的飛速發(fā)展為背景展開,故事過程完整、有趣味性,可見「豆包」具備一定的寫作能力。
數(shù)學(xué)能力
眾所周知,數(shù)學(xué)問題對大模型來說極具挑戰(zhàn)性,因?yàn)榻鉀Q數(shù)學(xué)問題需要嚴(yán)密的邏輯和推理。我們用經(jīng)典的「雞兔同籠」問題測試了一下「豆包」的數(shù)學(xué)能力,它用二元一次方程組準(zhǔn)確、快捷地回答了這個(gè)問題,這也是「雞兔同籠」問題的常見解法。
再測試一下「豆包」的基本計(jì)算能力和分?jǐn)?shù)化簡能力:
看了這些問題與回答,你初步感覺如何?
字節(jié)跳動(dòng)「豆包」項(xiàng)目團(tuán)隊(duì)成員告訴機(jī)器之心,「豆包」還處于早期開發(fā)驗(yàn)證階段,這次只是小范圍的邀請制測試。目前測試期的「豆包」還存在較多局限,生成的內(nèi)容也可能不準(zhǔn)確,歡迎測試用戶提供反饋意見,研發(fā)團(tuán)隊(duì)將持續(xù)改進(jìn)產(chǎn)品。
值得一提的是,在進(jìn)入「豆包」的對話頁面后,我們發(fā)現(xiàn)除了「豆包」,字節(jié)跳動(dòng)還開發(fā)了多個(gè)面向不同應(yīng)用場景的對話平臺(tái),如「小寧」、英語學(xué)習(xí)助手、全能寫作助手??磥碜止?jié)跳動(dòng)也在下一盤大模型應(yīng)用的大棋,我們拭目以待。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。