OpenAI的文本到視頻工具Sora如何改變科學(xué)與社會
上個(gè)月OpenAI發(fā)布了其Sora文本到視頻AI工具,這一消息受到了一些研究人員的擔(dān)憂和興奮的交織反應(yīng),他們擔(dān)心這項(xiàng)技術(shù)可能被濫用。這家總部位于加州的公司展示了Sora從幾個(gè)簡短的文本提示中創(chuàng)建逼真視頻的能力,其中包括一個(gè)女人在東京的霓虹燈街道上行走的片段,以及一只狗跳躍在兩個(gè)窗臺之間的片段。
英國萊斯特的德蒙特福特大學(xué)數(shù)字文化專家特蕾西·哈伍德(Tracy Harwood)表示,她對文本到視頻人工智能(AI)的發(fā)展速度“感到震驚”。一年前,人們還在嘲笑AI制作的美國演員威爾·史密斯吃意大利面的視頻?,F(xiàn)在,一些研究人員擔(dān)心這項(xiàng)技術(shù)可能會在2024年顛覆全球政治。
OpenAI還開發(fā)了ChatGPT和文本到圖像技術(shù)DALL·E,于2月15日首次推出了Sora,并宣布將該技術(shù)“提供給紅隊(duì)以評估可能存在危害或風(fēng)險(xiǎn)的關(guān)鍵領(lǐng)域”?!t隊(duì)測試’指的是進(jìn)行模擬攻擊或利用技術(shù)的過程,以查看它如何應(yīng)對現(xiàn)實(shí)世界中的惡意活動,比如創(chuàng)造錯(cuò)誤信息和仇恨內(nèi)容。
Sora并不是文本到視頻技術(shù)的首個(gè)示例;其他示例包括紐約市Runway公司去年推出的Gen-2以及谷歌主導(dǎo)的Lumiere,后者于今年1月宣布。哈伍德表示,她對一些其他提供的產(chǎn)品“感到失望”。她說:“它們在呈現(xiàn)給你的東西方面越來越平淡無奇?!彼a(bǔ)充說,這些程序需要非常具體的提示才能產(chǎn)生引人入勝的內(nèi)容。
哈伍德補(bǔ)充說,錯(cuò)誤信息是這些文本到視頻技術(shù)面臨的主要挑戰(zhàn)?!拔覀儗⒑芸鞎_(dá)到一個(gè)我們被大量看似令人信服的信息淹沒的地步。這真的很令人擔(dān)憂。”
選舉問題
這在即將舉行的選舉中尤其成為問題,包括11月的美國總統(tǒng)選舉和英國即將進(jìn)行的大選?!皩写罅康募僖曨l和假音頻在流傳,”英國雷丁大學(xué)研究生成AI和電影制作的多米尼克·利斯(Dominic Lees)說。2023年10月,英國工黨領(lǐng)袖基爾·斯塔默(Keir Starmer)的假音頻被發(fā)布,而美國總統(tǒng)喬·拜登鼓勵(lì)民主黨人不要投票的假音頻在今年1月流傳。
一個(gè)解決方案可能是要求文本到視頻AI使用水印,可以是視頻上的可見標(biāo)記,將其標(biāo)記為AI,也可以是視頻元數(shù)據(jù)中的人工簽名,但利斯不確定這是否會成功?!澳壳八】梢员粍h除,”他說,并且在視頻元數(shù)據(jù)中包含水印依賴于人們積極研究他們觀看的視頻是否真實(shí)?!拔也徽J(rèn)為我們可以誠實(shí)地要求全世界的觀眾在他們看的每個(gè)視頻上都這樣做,”利斯說。
這項(xiàng)技術(shù)也有潛在的好處。哈伍德表示,它可以用于將難懂的文本,比如學(xué)術(shù)論文,呈現(xiàn)為更容易理解的格式。“它可能被用來向普通大眾傳達(dá)發(fā)現(xiàn),這是它可能被用于的最大的事情之一,”她說?!八梢钥梢暬喈?dāng)復(fù)雜的概念?!?/p>
另一個(gè)潛在的用途可能是在醫(yī)療保健領(lǐng)域,文本到視頻AI能夠代替人類醫(yī)生與患者交流?!坝行┤丝赡軙械讲话?,”英國顧問科學(xué)傳播員克萊爾·馬龍(Claire Malone)說?!叭绻麄兿胍惶於啻蜗蜥t(yī)生提問,其他人可能會覺得這非常方便?!?/p>
數(shù)據(jù)管理
哈伍德說,文本到視頻AI工具如Sora可以幫助研究人員處理龐大的數(shù)據(jù)集,比如瑞士日內(nèi)瓦附近的歐洲粒子物理實(shí)驗(yàn)室CERN和其他大型科學(xué)項(xiàng)目產(chǎn)生的數(shù)據(jù)。馬龍說,生成AI可以“篩選出代碼并執(zhí)行研究中的單調(diào)任務(wù)”,而且還可以進(jìn)行“更復(fù)雜的工作[如]提供數(shù)據(jù)并要求它做出預(yù)測”。
創(chuàng)意產(chǎn)業(yè)的從業(yè)人員也提出了一些擔(dān)憂。美國演員湯姆·漢克斯去年表示,AI可能使他在死后繼續(xù)出現(xiàn)在電影中,“從現(xiàn)在到天國來臨之前”。利斯說:“如果你是一位雄心勃勃的年輕演員,考慮著自己的未來,而你被告知‘對不起,湯姆·漢克斯將永遠(yuǎn)扮演主角’,你會計(jì)劃在這個(gè)行業(yè)的未來嗎?”
文本到視頻AI將引發(fā)社會面臨的廣泛問題?!拔覀儗⒉坏貌粚W(xué)會以前所未有的方式評估我們看到的內(nèi)容,”哈伍德說。“這些工具將媒體內(nèi)容創(chuàng)作者的機(jī)會置于每個(gè)人的手中,”她說?!拔覀儗⒁鎸@一后果。這是對物質(zhì)被消費(fèi)方式的根本性轉(zhuǎn)變?!?/p>
評論