OpenAI推出全新人工智能語言助手功能,向付費(fèi)用戶開放
OpenAI發(fā)布一項(xiàng)重大更新,宣布面向其所有付費(fèi)訂閱ChatGPT Plus和Team計(jì)劃的用戶開放高級人工智能(AI)語音助手功能——“高級語音模式”(Advanced Voice Mode,AVM),將可以通過說話而不是輸入提示的方式來使用聊天機(jī)器人。據(jù)了解,Plus用戶每月需支付20美元,Team用戶每月支付30美元并擁有更多的使用次數(shù)。OpenAI將逐步向用戶推出訪問權(quán)限,并從下周開始面向企業(yè)和教育推出,所有Plus用戶將在秋末之前獲得訪問權(quán)限。
本文引用地址:http://butianyuan.cn/article/202409/463232.htmOpenAI曾在今年5月份發(fā)布GPT-4o時(shí)對外展示過該實(shí)時(shí)語音技術(shù),據(jù)演示視頻內(nèi)容,該能力目前也主要體現(xiàn)于GPT-4o模型上。自首次公開亮相以來,ChatGPT的高級語音模式便受到了高度關(guān)注。經(jīng)過數(shù)月的研發(fā)與測試,OpenAI決定將此功能開放給所有付費(fèi)用戶,此舉有望進(jìn)一步增強(qiáng)OpenAI在人工智能領(lǐng)域的競爭力與影響力。
在此次更新中,語音模式的設(shè)計(jì)從外觀上得到了改進(jìn)?,F(xiàn)在,語音功能由一個(gè)藍(lán)色的動(dòng)畫球體代表,取代了此前OpenAI在5月展示時(shí)使用的黑色動(dòng)態(tài)點(diǎn)。當(dāng)用戶在ChatGPT應(yīng)用中獲得高級語音權(quán)限后,會(huì)在語音圖標(biāo)旁看到一個(gè)彈出提示,方便用戶快速啟用。
AVM提高了部分外語的對話速度、流暢度并改進(jìn)口音。此外,AVM還新增了兩大功能:為語音助手存儲(chǔ)“自定義指令”,以及記住用戶希望語音助手表現(xiàn)何種行為的“記憶”的功能(這類似于今年4月OpenAI為ChatGPT文本版本推出的記憶功能)。也就是說,ChatGPT用戶可以利用自定義指令和“記憶”來確保語音模式是個(gè)性化的,AVM會(huì)根據(jù)他們對所有對話的偏好做出響應(yīng)。
為了提升用戶體驗(yàn),ChatGPT新增了五種全新的語音風(fēng)格供用戶選擇:Arbor、Maple、Sol、Spruce和Vale,使得語音總數(shù)達(dá)到九種。此前的語音包括Breeze、Juniper、Cove和Ember,旨在提供多樣化的語氣和特征。
OpenAI表示,這些聲音是使用來自世界各地的專業(yè)配音演員制作的。值得注意的是,此次更新中沒有包含名為Sky的語音 ——OpenAI在春季更新中展示了Sky的語音,但由于被指與女演員斯嘉麗·約翰遜高度相似,引發(fā)了法律糾紛。盡管OpenAI表示并非有意模仿約翰遜的聲音,但為了避免爭議,仍選擇了移除。
OpenAI的模型設(shè)計(jì)師Drew也分享了他的使用體驗(yàn):“當(dāng)我在忙其他事情或不需要與ChatGPT交談時(shí),它會(huì)保持安靜。當(dāng)我有問題時(shí),可以直接提出展開深入的對話?!痹诖诉^程中,ChatGPT的聲音會(huì)根據(jù)談話的語氣進(jìn)行調(diào)整。他表示,ChatGPT就像是坐在身旁的朋友,不僅提供信息,還能進(jìn)行思想交流。德魯認(rèn)為在日常使用中,用戶可以使用高級語音模式來創(chuàng)造面試、講故事等場景,而且無需擔(dān)心延遲問題。他強(qiáng)調(diào):“這種延遲非常低,就像和另一個(gè)人交談一樣?!?/span>
ChatGPT高級語音模式現(xiàn)已支持50多種語言,拓展了用戶的溝通范圍。需要注意的是,該高級語音模式目前還沒有向歐盟、英國、瑞士、冰島、挪威和列支敦士登等地區(qū)開放使用。OpenAI尚未公布這些地區(qū)的開放時(shí)間。
除了上新高級語音模式,近日OpenAI還發(fā)布了一個(gè)多語言大規(guī)模多任務(wù)語言理解 (Multilingual Massive Multitask Language Understanding,MMMLU)數(shù)據(jù)集,測試集提供了14種語言,包括阿拉伯語、德語、西班牙語等,涵蓋57個(gè)不同類別的主題,包括初級知識(shí)、法律、物理、歷史和計(jì)算機(jī)科學(xué)等高級專業(yè)學(xué)科。
評論