ChatGPT AI搜索還不是“谷歌殺手”:關(guān)鍵字搜索不靠譜
11月5日消息,OpenAI上周正式發(fā)布了備受矚目的搜索產(chǎn)品ChatGPT Search,向谷歌發(fā)起了直接挑戰(zhàn)。這一時(shí)刻的到來,其實(shí)早已在業(yè)界的預(yù)料之中,因此谷歌在今年早些時(shí)候便將人工智能生成的答案融入其核心產(chǎn)品之中,但在此過程中卻出現(xiàn)了一些令人尷尬的“幻覺”。這個(gè)失誤讓不少人認(rèn)為,OpenAI的搜索引擎將會(huì)成為真正的“谷歌殺手”。
本文引用地址:http://butianyuan.cn/article/202411/464326.htm然而,在將ChatGPT Search作為默認(rèn)搜索引擎使用了一天左右后,科技記者麥克斯韋爾·澤夫(Maxwell Zeff)便迅速切換回了谷歌。盡管OpenAI的搜索產(chǎn)品在某些方面確實(shí)令人印象深刻,讓我們得以窺見未來人工智能搜索界面的模樣,但就現(xiàn)階段而言,它仍然略顯理想化,并不適合作為日常搜索工具來使用。
ChatGPT Search在某些時(shí)候確實(shí)能夠高效地提供實(shí)時(shí)問題的答案,避免了翻閱廣告和SEO優(yōu)化文章的煩惱。最終,它還會(huì)以一種清晰明了的格式給出簡潔的答案,并在右側(cè)附上信息來源的鏈接、標(biāo)題及簡短介紹,以便我們確認(rèn)所閱讀的人工智能生成文本是否準(zhǔn)確無誤。
然而,對(duì)于日常搜索需求而言,ChatGPT Search卻常常給人一種不切實(shí)際的感覺。
在當(dāng)前形式下,ChatGPT Search在處理人們?nèi)粘J褂霉雀枳疃嗟暮喍滩樵儠r(shí)顯得不夠可靠。這類查詢通常不超過四個(gè)單詞,卻占據(jù)了谷歌搜索的大部分;通常是幾個(gè)關(guān)鍵詞,用于快速找到所需網(wǎng)頁。許多人可能并未意識(shí)到,自己整天都在進(jìn)行這樣的搜索,而谷歌在這方面的表現(xiàn)一直相當(dāng)出色。
例如,查詢“NBA凱爾特人隊(duì)的比分”、“棉襪”、“圖書館的營業(yè)時(shí)間”、“舊金山的天氣”、“我附近的咖啡館”等,這類查詢使谷歌成為數(shù)十億人進(jìn)入互聯(lián)網(wǎng)的首選入口。
澤夫在使用ChatGPT Search進(jìn)行測(cè)試時(shí)經(jīng)常感到沮喪,這讓他意識(shí)到自己每天進(jìn)行大量關(guān)鍵字搜索。他無法通過簡短的查詢?cè)贑hatGPT Search上穩(wěn)定地找到所需信息。多年來第一次,澤夫真切地渴望重新使用谷歌搜索。
當(dāng)然,這并不是說谷歌的搜索質(zhì)量在過去十年里沒有下降,事實(shí)上,由于廣告和搜索引擎優(yōu)化的影響,其搜索質(zhì)量確實(shí)有所下滑。但在測(cè)試過程中,澤夫在測(cè)試過程中不得不始終在另一個(gè)窗口中保持谷歌打開狀態(tài),因?yàn)镃hatGPT Search往往無法為他提供正確的答案或網(wǎng)頁鏈接。
誰會(huì)贏:ChatGPT Search還是簡短查詢?
澤夫嘗試通過輸入“掘金比分”來查看丹佛掘金隊(duì)與明尼蘇達(dá)森林狼隊(duì)的NBA比賽實(shí)時(shí)情況。然而,ChatGPT回答掘金隊(duì)在贏球,但事實(shí)上他們正在輸球。更糟糕的是,根據(jù)谷歌的結(jié)果,ChatGPT顯示的森林狼隊(duì)得分比實(shí)際得分整整低了10分。
另一次,澤夫輸入“今日收益”來查詢可能影響周五股價(jià)的公司季度財(cái)報(bào)信息。ChatGPT告訴他,蘋果和亞馬遜將在周五公布財(cái)報(bào),而事實(shí)上,這兩家公司的財(cái)報(bào)早在一天前就已經(jīng)發(fā)布了。簡而言之,ChatGPT出現(xiàn)了“幻覺”,提供了錯(cuò)誤的信息。
在另一次測(cè)試中,澤夫輸入了一位科技公司高管的名字,希望能找到他的聯(lián)系方式。ChatGPT不僅向他展示了這位高管的Facebook個(gè)人資料摘要,還“編造”出了一個(gè)指向其LinkedIn頁面的鏈接。但當(dāng)澤夫點(diǎn)擊這個(gè)鏈接時(shí),卻收到了一個(gè)錯(cuò)誤信息。
還有一次,澤夫輸入“寬松的牛仔褲”,希望能找到購買渠道。ChatGPT Search首先向他解釋了什么是寬松的牛仔褲(盡管這個(gè)定義對(duì)于大多數(shù)人來說可能是多余的),然后建議他去亞馬遜網(wǎng)站購買一條不錯(cuò)的牛仔褲。
這樣的例子還有很多,但相信你已經(jīng)明白了。在使用ChatGPT Search的第一天,澤夫就遭遇了許多無效鏈接、信息“幻覺”以及隨機(jī)的答案。
也許將來會(huì)成為“谷歌殺手”,但不是今天
對(duì)于OpenAI而言,ChatGPT Search的發(fā)布具有里程碑式的意義。該公司首席執(zhí)行官薩姆·奧特曼(Sam Altman)雖然常常低調(diào)評(píng)價(jià)自家創(chuàng)業(yè)公司的人工智能能力,但他仍對(duì)ChatGPT Search贊譽(yù)有加,稱其“真的很好”。這次之所以不同,或許是因?yàn)樗阉鳂I(yè)務(wù)作為互聯(lián)網(wǎng)上最大的業(yè)務(wù)之一,其重要性不言而喻,而OpenAI的搜索功能確實(shí)有可能對(duì)其最大競爭對(duì)手谷歌構(gòu)成實(shí)質(zhì)性的威脅。
客觀地說,谷歌搜索是一個(gè)已有25年歷史的產(chǎn)品,而ChatGPT Search則完全是一個(gè)新生事物。OpenAI在一篇博客文章中表示,他們計(jì)劃在未來幾個(gè)月內(nèi)根據(jù)用戶反饋不斷對(duì)這一功能進(jìn)行改進(jìn),這無疑將是這家初創(chuàng)公司重點(diǎn)投資的一個(gè)關(guān)鍵領(lǐng)域。
可以肯定,ChatGPT Search在回答復(fù)雜冗長的研究性問題方面表現(xiàn)得相當(dāng)出色。例如,對(duì)于“哪個(gè)美國職業(yè)體育聯(lián)盟最具多樣性?”這樣的問題,谷歌可能難以迅速給出滿意的答案,但ChatGPT Search卻能夠迅速整合多個(gè)網(wǎng)站的信息,在幾秒鐘內(nèi)為你提供相當(dāng)完整的答案。同樣,已經(jīng)問世一年多的Perplexity搜索產(chǎn)品在這類問題上也有不俗的表現(xiàn)。
與傳統(tǒng)版本的ChatGPT相比,ChatGPT Search已經(jīng)具備了網(wǎng)頁訪問功能,它為用戶提供了一個(gè)更加出色的網(wǎng)頁瀏覽界面?,F(xiàn)在,ChatGPT在獲取信息時(shí),會(huì)提供更加清晰的鏈接來源——對(duì)于新聞報(bào)道,ChatGPT將與已經(jīng)達(dá)成所有許可協(xié)議的主要新聞媒體公司進(jìn)行合作。
然而,大多數(shù)谷歌搜索查詢并不如此冗長。為了真正取代谷歌,OpenAI需要改進(jìn)ChatGPT Search在更實(shí)用、更簡短的日常搜索中的表現(xiàn)。
對(duì)此,OpenAI并不回避承認(rèn)ChatGPT Search在短查詢中的不足。該公司發(fā)言人尼科·費(fèi)利克斯(Niko Felix)對(duì)此表示:“通過ChatGPT Search,我們觀察到用戶更傾向于以更自然、更口語化的方式提出問題,這與他們過去使用其他搜索工具的習(xí)慣有所不同。同時(shí),我們也注意到,那些簡短的網(wǎng)頁導(dǎo)航查詢——通常只有幾個(gè)字——同樣非常普遍。我們計(jì)劃在未來不斷優(yōu)化,以改善這類查詢的用戶體驗(yàn)?!?/p>
換言之,這些簡短的關(guān)鍵字查詢正是谷歌長期以來不可或缺的優(yōu)勢(shì)所在,而在OpenAI能夠完美解決這類查詢之前,谷歌仍將是許多人的首選搜索工具。
OpenAI在處理這些簡短查詢時(shí)可能面臨更多挑戰(zhàn),原因主要有以下幾點(diǎn):首先,ChatGPT在技術(shù)上依賴于微軟的必應(yīng)搜索引擎,而微軟必應(yīng)在業(yè)界普遍被認(rèn)為其搜索質(zhì)量不及谷歌。其次,大型語言模型可能并不太擅長處理這些簡短的輸入。這類模型通常需要接收完整的書面提示,才能產(chǎn)生有效的答案?;蛟S,我們需要通過某種方式重新引導(dǎo)用戶——在ChatGPT Search能夠出色完成這類搜索之前,利用大語言模型將簡短查詢轉(zhuǎn)換為更詳細(xì)的問題。
值得一提的是,盡管OpenAI的搜索產(chǎn)品剛剛發(fā)布,但另一家人工智能搜索工具Perplexity每周已經(jīng)能夠處理1億個(gè)搜索查詢。Perplexity也曾被標(biāo)榜為“谷歌殺手”,但它在處理簡短查詢時(shí)也遇到了同樣的問題。
Perplexity的首席執(zhí)行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)曾就人們使用其產(chǎn)品與谷歌搜索的不同之處進(jìn)行過探討。他說:“谷歌搜索的平均查詢字?jǐn)?shù)通常在2到3個(gè)之間,而在Perplexity中,平均查詢字?jǐn)?shù)則達(dá)到了10到11個(gè)。這表明,在Perplexity上,人們更傾向于直接提出問題。相比之下,在谷歌上,用戶只需輸入幾個(gè)關(guān)鍵詞,就能迅速跳轉(zhuǎn)到相關(guān)的鏈接。”
澤夫認(rèn)為,人們并不使用這些新產(chǎn)品進(jìn)行網(wǎng)頁導(dǎo)航的事實(shí),實(shí)際上揭示了比OpenAI或Perplexity所公開承認(rèn)的更為嚴(yán)重的問題。這意味著,ChatGPT Search和Perplexity并未能取代谷歌搜索在網(wǎng)頁導(dǎo)航方面的核心優(yōu)勢(shì)。相反,這些人工智能產(chǎn)品正在開拓一個(gè)新的細(xì)分市場,揭示和呈現(xiàn)傳統(tǒng)搜索中那些被忽視或隱藏的信息。當(dāng)然,這本身就是一個(gè)極具價(jià)值的領(lǐng)域。
OpenAI和Perplexity都表示,他們有信心在未來改進(jìn)這些簡短查詢的處理能力。但在此之前,澤夫認(rèn)為這兩款產(chǎn)品都無法完全取代谷歌的地位。如果OpenAI真的想要成為通往互聯(lián)網(wǎng)的新大門,那么它就必須創(chuàng)造出一個(gè)比現(xiàn)有大門更加出色、更加便捷的新入口。
評(píng)論