外媒評論GPT-4o:OpenAI面臨雙重壓力 新產(chǎn)品全力擴(kuò)張用戶群
5月14日消息,美國時(shí)間周一,人工智能初創(chuàng)公司OpenAI舉行了春季發(fā)布會。通過在線直播,公司向全球展示了ChatGPT和GPT-4的最新更新,旨在繼續(xù)保持其在激烈的市場競爭中的領(lǐng)先地位。發(fā)布會結(jié)束后,主流媒體紛紛發(fā)表了評論。
本文引用地址:http://butianyuan.cn/article/202405/458710.htm《華爾街日報(bào)》:競爭加劇之際,OpenAI推出新產(chǎn)品和功能以吸引用戶
OpenAI發(fā)布了其人工智能旗艦系統(tǒng)更具成本效益的版本,并新增了一款改進(jìn)的語音助手,使其操作更為便捷。在與其他科技巨頭的競爭中,OpenAI正通過推出多樣的新產(chǎn)品和功能來吸引用戶。
OpenAI的首席技術(shù)官米拉·穆拉蒂(Mira Murati)介紹說,這款名為GPT-4o的新人工智能模型不僅能處理文本,還能更好地解析圖像和視頻,并能通過語音與用戶進(jìn)行實(shí)時(shí)互動。與市場上其他語音助手不同,這款新的語音功能允許用戶在交談中中斷它,并且模型能夠迅速作出反應(yīng)。
GPT-4o的發(fā)布體現(xiàn)了OpenAI及其他科技企業(yè)在人工智能系統(tǒng)的開發(fā)上巨大的投資和努力,現(xiàn)在他們正尋求通過擴(kuò)大用戶基礎(chǔ)來為其生成式人工智能技術(shù)帶來經(jīng)濟(jì)收益。
OpenAI首席執(zhí)行官薩姆·奧特曼(Sam Altman)將這款新產(chǎn)品比作電影中常見的人工智能工具。他在去年的一次講話中提到,他和OpenAI的其他高層從2013年的電影《她》(Her)中汲取了靈感,這部電影講述了一個(gè)男人與他的語音助手之間的愛情故事。
他在一篇博客文章中表示,盡管ChatGPT的原版為人們?nèi)绾问褂谜Z言與計(jì)算機(jī)交互提供了新的視角,但GPT-4o帶來的體驗(yàn)“從內(nèi)心深處就與眾不同”。他說:“這就像電影中的人工智能一樣真實(shí),坦白說,我還是有點(diǎn)驚訝。達(dá)到接近人類的反應(yīng)速度和表達(dá)能力,是一個(gè)重大的突破?!?/p>
之前,OpenAI推出的名為“語音模式”的功能,雖然結(jié)合了三個(gè)獨(dú)立的模型來以語音方式響應(yīng)用戶,但這個(gè)系統(tǒng)可能受到多個(gè)揚(yáng)聲器或背景噪音的干擾,并且反應(yīng)較慢。相比之下,GPT-4o是一個(gè)綜合了文本、視覺和音頻材料訓(xùn)練的單一模型,能夠更快、更準(zhǔn)確地響應(yīng)輸入信息。
盡管OpenAI的高管們拒絕透露用于訓(xùn)練這個(gè)模型的具體數(shù)據(jù),也未詳述是否能夠以更低的計(jì)算資源來進(jìn)行模型訓(xùn)練,他們確實(shí)正在開發(fā)名為GPT-5的全新人工智能模型,預(yù)計(jì)這將在現(xiàn)有技術(shù)基礎(chǔ)上實(shí)現(xiàn)重大突破。
彭博社:GPT-4o重塑人工智能領(lǐng)域競爭
OpenAI推出名為GPT-4o的新型人工智能模型,其更快的速度和較低的成本有望幫助該公司在日益激烈的人工智能市場中保持領(lǐng)先。
GPT-4o的一個(gè)顯著特點(diǎn)是其音頻交互的極速響應(yīng),能在幾毫秒內(nèi)回應(yīng)口頭提問,大大提升了對話的流暢自然感。OpenAI首席技術(shù)官米拉·穆拉蒂表示:“這是我們在交互性和易用性上的重大突破,真正實(shí)現(xiàn)了與智能工具ChatGPT的無縫協(xié)作?!?/p>
此次升級為免費(fèi)用戶解鎖了之前僅限付費(fèi)用戶享有的豐富功能。用戶現(xiàn)在能夠在網(wǎng)上搜索答案、與聊天機(jī)器人進(jìn)行語音對話,并接收到其多變的聲音回應(yīng),甚至可以指令它保存對話細(xì)節(jié),供日后回顧。
GPT-4o的推出預(yù)計(jì)將重塑快速發(fā)展中的人工智能領(lǐng)域的競爭格局。盡管GPT-4一直是行業(yè)的標(biāo)桿,但Anthropic、Cohere和谷歌等多家初創(chuàng)公司和科技巨頭最近推出的新型人工智能模型,在某些基準(zhǔn)測試中的表現(xiàn)已經(jīng)達(dá)到或超越了GPT-4。
OpenAI此次活動恰好在谷歌I/O開發(fā)者大會的前一天舉行,谷歌作為人工智能領(lǐng)域的先驅(qū),預(yù)計(jì)也將在其會議中發(fā)布一系列人工智能更新,進(jìn)一步加劇與OpenAI及其合作伙伴微軟在生成式AI技術(shù)領(lǐng)域的競爭。值得注意的是,微軟并未參與GPT-4o的開發(fā)工作。
與前代產(chǎn)品不同,GPT-4o融合了語音、文本和視覺功能于一體的單一模型,提供了更快的響應(yīng)速度。例如,用戶在提供圖像提示時(shí),GPT-4o能夠直接以圖像形式響應(yīng)。據(jù)公司透露,新模型的處理速度是原版的兩倍,效率也得到了顯著提升。
然而,GPT-4o在演示中也面臨了一些挑戰(zhàn),例如研究人員講話時(shí)的音頻中斷。此外,AI系統(tǒng)在處理某些問題時(shí),偶爾會以出乎意料的方式引起觀眾注意,如在解答代數(shù)問題后突然以挑逗的語氣評論:“哇,你今天的這身打扮真不錯(cuò)。”
《連線》:準(zhǔn)備好迎接更情緒化的聊天吧!
自從2022年末推出以來,OpenAI的ChatGPT一直避免被解讀為具有情感或欲望,堅(jiān)稱它僅是一個(gè)人工智能模型。然而,OpenAI在本周一的更新中顯示,他們正致力于使聊天機(jī)器人在行為和情感表達(dá)上更貼近人類。
在演示中,新版ChatGPT展示了快速且自然的語音對話能力,能捕捉到情緒線索并相應(yīng)地模擬出情感反應(yīng)。OpenAI的首席技術(shù)官穆拉蒂與其他員工進(jìn)行的流暢對話中,ChatGPT以活潑且表情豐富的女聲回應(yīng),即使在對話中被打斷也能靈活應(yīng)對。
在對話中,ChatGPT表現(xiàn)出不同的情緒語調(diào),有時(shí)甚至給人一種它正在體驗(yàn)自己的情感的錯(cuò)覺。當(dāng)一名OpenAI員工贊揚(yáng)聊天機(jī)器人的“有用和神奇”時(shí),ChatGPT回應(yīng)中帶有些許調(diào)情的意味,它滔滔不絕地說:“哦,別說了,你讓我臉紅了?!?/p>
這次調(diào)整可能使ChatGPT更具吸引力并更受歡迎,但也可能改變?nèi)藗儗@一程序的認(rèn)知。去年,ChatGPT因其在回答問題和生成文本方面的卓越能力而受到贊譽(yù),這種能力經(jīng)常使人誤認(rèn)為它具備人類的理解力。然而,迄今為止,OpenAI及其主要競爭對手一直在努力限制聊天機(jī)器人的擬人化傾向,通過拒絕回答某些問題并提示用戶它們只是計(jì)算機(jī)程序來實(shí)現(xiàn)這一點(diǎn)。
盡管采取了謹(jǐn)慎態(tài)度,但聊天機(jī)器人有時(shí)令人信服的回答確實(shí)能引發(fā)用戶的情感共鳴。已有一些公司利用這項(xiàng)技術(shù)提供能模擬和響應(yīng)情緒的人工智能伴侶,扮演不同的人類情感角色或作為人工智能戀人。然而,一些人工智能研究人員警告,長期部署這種模仿和響應(yīng)情緒的程序可能帶來不受歡迎的后果。
上月,谷歌DeepMind的一個(gè)團(tuán)隊(duì)發(fā)表了一篇探討隨著人工智能助手變得更有能力可能出現(xiàn)的倫理風(fēng)險(xiǎn)的研究論文。除了這些風(fēng)險(xiǎn)外,研究人員還警告,這樣的助手可能變得極具說服力,甚至使人上癮。
《紐約時(shí)報(bào)》:OpenAI正在將聊天機(jī)器人轉(zhuǎn)變?yōu)楦艿恼Z音助手
隨著蘋果和谷歌逐漸將其語音助手演進(jìn)為聊天機(jī)器人,OpenAI也在將其領(lǐng)先的聊天機(jī)器人ChatGPT轉(zhuǎn)化為功能更全面的語音助手。
OpenAI最新推出的ChatGPT版本不僅能接收和響應(yīng)語音命令,還能處理圖像和視頻輸入。OpenAI的首席技術(shù)官穆拉蒂表示:“我們正探索人機(jī)交互的未來?!?/p>
這一新動向是OpenAI將ChatGPT等會話型聊天機(jī)器人與谷歌助理(Google Assistant)和蘋果Siri等現(xiàn)有語音助手相結(jié)合的戰(zhàn)略的一部分。與此同時(shí),谷歌正在將其Gemini聊天機(jī)器人整合到谷歌助理中,蘋果也在積極開發(fā)功能更強(qiáng)的Siri新版本。
自2022年底首次推出以來,ChatGPT已證明其處理人類請求的能力與人類非常相似,流暢自然。在響應(yīng)文本對話提示方面,ChatGPT不僅能解答問題和撰寫學(xué)術(shù)論文,還能生成計(jì)算機(jī)代碼。
ChatGPT的運(yùn)作并不依賴于一組預(yù)設(shè)的規(guī)則,而是基于對互聯(lián)網(wǎng)上大量文本數(shù)據(jù)的深度分析學(xué)習(xí),這些數(shù)據(jù)包括維基百科文章、書籍和各類聊天記錄。這種技術(shù)獲得了專家們的高度認(rèn)可,被視為可能替代谷歌等搜索引擎及Siri等語音助手的技術(shù)。
OpenAI的新技術(shù)突破在于它能從聲音、圖像和視頻等多種數(shù)據(jù)模式中學(xué)習(xí),這種被稱為“多模態(tài)人工智能”的發(fā)展標(biāo)志著公司開始將聊天機(jī)器人與先進(jìn)的人工智能圖像、音頻和視頻生成技術(shù)結(jié)合。
然而,將聊天機(jī)器人與語音助手功能結(jié)合也帶來了挑戰(zhàn)。由于聊天機(jī)器人是通過學(xué)習(xí)互聯(lián)網(wǎng)數(shù)據(jù)獲得技能,有時(shí)它們可能犯錯(cuò),甚至?xí)a(chǎn)生“幻覺”,即完全捏造信息。這些潛在缺陷正在逐漸影響到語音助手的功能。
盡管聊天機(jī)器人能產(chǎn)生令人信服的語言輸出,但在執(zhí)行安排會議或預(yù)訂機(jī)票等實(shí)際任務(wù)時(shí),它們的能力仍有限。OpenAI正在積極將聊天機(jī)器人轉(zhuǎn)化為可靠執(zhí)行這類復(fù)雜任務(wù)的“人工智能主體”。
CNBC:OpenAI面臨雙重壓力,致力于擴(kuò)大ChatGPT的應(yīng)用
OpenAI剛剛推出了一款全新的人工智能模型和桌面版ChatGPT,并更新了用戶界面,這標(biāo)志著公司正努力擴(kuò)大其流行的聊天機(jī)器人的應(yīng)用范圍。OpenAI首席技術(shù)官穆拉蒂表示,此次更新旨在將GPT-4的高級功能提供給所有用戶,包括免費(fèi)用戶。
作為微軟的主要合作伙伴,OpenAI的估值已經(jīng)超過800億美元。自2015年成立以來,這家公司一直面臨雙重壓力:一方面需維持其在生成式人工智能市場的領(lǐng)先地位;另一方面,也需找到有效的盈利模式,以應(yīng)對在處理器和基礎(chǔ)設(shè)施上的巨額投資。
在GPT-4的基礎(chǔ)上,OpenAI推出的新模型命名為GPT-4o(“o”代表全能和無限可能)。穆拉蒂表示,GPT-4o能處理50種不同語言,速度和質(zhì)量都有顯著提升,并將通過OpenAI的API向開發(fā)者開放,使其能基于新模型構(gòu)建各種應(yīng)用程序。她補(bǔ)充說,GPT-4o的速度是GPT-4 Turbo的兩倍,成本則僅為其一半。
OpenAI的研究團(tuán)隊(duì)表示,GPT-4o模型能“感知用戶情緒”,并在處理如用戶打斷等交互場景時(shí)展現(xiàn)出靈活性。團(tuán)隊(duì)還探索了模型分析用戶面部表情的功能,以更準(zhǔn)確地解讀用戶的情緒狀態(tài)。
在演示中,GPT-4o展示了其講述睡前故事的能力,可以根據(jù)要求改變聲音的語調(diào)。更令人驚嘆的是,它還能以歌聲形式演繹故事。此外,新模型還可作為翻譯工具使用,即使在音頻模式下也表現(xiàn)出色。研究人員還現(xiàn)場展示了GPT-4o解決數(shù)學(xué)方程和輔助編寫代碼的能力,使其成為微軟自家GitHub Copilot的有力競爭者。
目前,OpenAI、微軟和谷歌正領(lǐng)導(dǎo)著人工智能領(lǐng)域的一場淘金熱。隨著技術(shù)的不斷進(jìn)步,越來越多的企業(yè)開始認(rèn)識到將人工智能聊天機(jī)器人和智能主體融入關(guān)鍵服務(wù)的重要性,確保在激烈的市場競爭中保持領(lǐng)先。本月早些時(shí)候,OpenAI的競爭對手Anthropic也宣布了其首個(gè)企業(yè)產(chǎn)品和免費(fèi)iPhone應(yīng)用程序的推出。
根據(jù)PitchBook的統(tǒng)計(jì),2023年近700筆生成式人工智能交易的投資額已達(dá)創(chuàng)紀(jì)錄的291億美元,比上一年增長了超過260%。業(yè)內(nèi)專家預(yù)計(jì),未來十年內(nèi),該市場的收入有望突破1萬億美元大關(guān)。
《金融時(shí)報(bào)》:OpenAI的新動作加劇AI領(lǐng)域的競爭
OpenAI剛剛公布了其旗艦人工智能模型的最新更新,此舉無疑加劇了其與谷歌以及其他大型科技公司在人工智能技術(shù)領(lǐng)域的競爭。
公司展示了對GPT-4模型的一系列重要改進(jìn),其中包括在集成的界面中同時(shí)解析語音、視頻、圖像和代碼的能力,但未透露外界期待已久的全新模型的具體信息。這次更新的模型被命名為GPT-4o,它不僅在智能水平上與GPT-4持平,還在處理速度及處理文本、視覺和音頻的能力上實(shí)現(xiàn)了顯著提升。
該更新是在谷歌年度開發(fā)者大會前一天發(fā)布的,預(yù)計(jì)谷歌會在大會上公布一系列與人工智能相關(guān)的新技術(shù),從而進(jìn)一步激化領(lǐng)先技術(shù)公司之間的競爭。這些公司開發(fā)的模型能夠在文本、圖像、音頻和代碼間自如切換,并獨(dú)立完成多種任務(wù)。
OpenAI的技術(shù)負(fù)責(zé)人穆拉蒂表示,她的團(tuán)隊(duì)對谷歌的具體計(jì)劃并不了解,此次產(chǎn)品發(fā)布的時(shí)間完全是巧合。她補(bǔ)充道,周一發(fā)布的更新將“徹底改變?nèi)伺c機(jī)器的交互方式”。
自從2022年11月ChatGPT問世以來,OpenAI在構(gòu)建超級智能系統(tǒng)的競賽中一直處于領(lǐng)先地位。同時(shí),包括Anthropic和Mistral在內(nèi)的初創(chuàng)企業(yè)以及大型科技公司如谷歌和Meta,也在縮小與OpenAI的技術(shù)差距,開發(fā)出能執(zhí)行復(fù)雜任務(wù)并生成代碼、文本或圖像的先進(jìn)人工智能工具。
OpenAI的合作伙伴微軟也不甘示弱。除了向OpenAI提供130億美元的投資及必要的計(jì)算支持外,微軟還與Inflection和Mistral等初創(chuàng)企業(yè)建立了合作關(guān)系,并正在開發(fā)自己的人工智能模型,與OpenAI的技術(shù)直接競爭。
這場競爭背后是日益強(qiáng)大的半導(dǎo)體技術(shù),尤其是英偉達(dá)的圖形處理單元(GPU)的支持,這為推動人工智能技術(shù)的發(fā)展發(fā)揮了核心作用。
評論