如何保障AI安全?OpenAI詳細(xì)解答,將積極與各國政府接觸
4月6日消息,美國當(dāng)?shù)貢r(shí)間周三,OpenAI發(fā)帖,詳細(xì)介紹了其確保AI安全的方法,包括進(jìn)行安全評(píng)估、改進(jìn)發(fā)布后的保障措施、保護(hù)兒童以及尊重隱私等。該公司表示,確保AI系統(tǒng)的構(gòu)建、部署和安全使用對(duì)實(shí)現(xiàn)其使命至關(guān)重要。
本文引用地址:http://butianyuan.cn/article/202304/445323.htm以下是OpenAI帖子的全文:
OpenAI致力于確保強(qiáng)大的AI安全,讓盡可能多的人受益。我們知道,我們的AI工具為當(dāng)今人們提供了許多幫助。世界各地的用戶向我們反饋,ChatGPT有助于提高他們的工作效率、增強(qiáng)他們的創(chuàng)造力,并提供量身定制的學(xué)習(xí)體驗(yàn)。但我們也認(rèn)識(shí)到,與任何技術(shù)一樣,這些工具也存在真正的風(fēng)險(xiǎn)。因此,我們正在努力確保在各個(gè)系統(tǒng)層面上的安全性。
打造更加安全的人工智能系統(tǒng)
在推出任何新的人工智能系統(tǒng)之前,我們都會(huì)進(jìn)行嚴(yán)格的測(cè)試,征求外部專家的意見,并通過人工反饋的強(qiáng)化學(xué)習(xí)等技術(shù)來改善模型的表現(xiàn)。同時(shí),我們還建立了廣泛的安全和監(jiān)控系統(tǒng)。
以我們最新的模型GPT-4為例,完成訓(xùn)練后,我們?cè)谡麄€(gè)公司范圍內(nèi)進(jìn)行了長達(dá)6個(gè)月的測(cè)試,以確保其在公開發(fā)布之前更加安全可靠。
我們認(rèn)為,強(qiáng)大的人工智能系統(tǒng)應(yīng)該接受嚴(yán)格的安全評(píng)估。監(jiān)管是必要的,以確保這種做法被廣泛采納。因此,我們積極與各國政府接觸,探討最佳的監(jiān)管形式。
從實(shí)際使用中學(xué)習(xí),提高保障措施
我們盡力在系統(tǒng)部署之前預(yù)防可預(yù)見的風(fēng)險(xiǎn),但實(shí)驗(yàn)室中的學(xué)習(xí)永遠(yuǎn)有限。我們廣泛研究和測(cè)試,但無法預(yù)測(cè)人們會(huì)如何使用我們的技術(shù),或?yàn)E用它。因此,我們認(rèn)為從實(shí)際使用中學(xué)習(xí),是創(chuàng)建和發(fā)布越來越安全的人工智能系統(tǒng)的關(guān)鍵組成部分。
我們謹(jǐn)慎地將新的人工智能系統(tǒng)逐步發(fā)布給人群,并采取實(shí)質(zhì)性的保障措施,并根據(jù)我們吸取的教訓(xùn)不斷改進(jìn)。
我們提供自己服務(wù)和API中最強(qiáng)大的模型,以便開發(fā)人員可以直接將技術(shù)集成到他們的應(yīng)用程序中。這使我們能夠監(jiān)控濫用行為并采取行動(dòng),同時(shí)制定應(yīng)對(duì)措施。這樣,我們可以采取實(shí)際行動(dòng),而不僅僅在理論上想象如何應(yīng)對(duì)。
實(shí)際使用中的經(jīng)驗(yàn)也促使我們制定了越來越細(xì)化的政策,以應(yīng)對(duì)對(duì)人們構(gòu)成真正風(fēng)險(xiǎn)的行為,同時(shí)仍然允許我們的技術(shù)以更有益的方式使用。
我們認(rèn)為,社會(huì)需要更多時(shí)間適應(yīng)日益強(qiáng)大的人工智能,每個(gè)受其影響的人都應(yīng)該在人工智能的進(jìn)一步發(fā)展方面擁有發(fā)言權(quán)。迭代部署有助于不同利益相關(guān)者更有效地參與人工智能技術(shù)的對(duì)話中,而擁有使用這些工具的第一手經(jīng)驗(yàn)至關(guān)重要。
保護(hù)兒童
我們的安全工作關(guān)注重點(diǎn)之一是保護(hù)兒童。我們要求使用我們的人工智能工具的人必須年滿18歲或以上,或者在父母同意的情況下年滿13歲或以上。目前,我們正在研究驗(yàn)證功能。
我們不允許我們的技術(shù)用于生成仇恨、騷擾、暴力或成人等內(nèi)容。與GPT-3.5相比,最新的GPT-4對(duì)受限制內(nèi)容請(qǐng)求做出響應(yīng)的可能性降低了82%。我們已經(jīng)建立了強(qiáng)大的系統(tǒng)來監(jiān)控濫用行為。GPT-4現(xiàn)在可供ChatGPT Plus的訂戶使用,我們希望隨著時(shí)間的推移能讓更多人體驗(yàn)它。
我們已經(jīng)采取重大措施,最大限度地減少我們的模型產(chǎn)生傷害兒童內(nèi)容的可能性。例如,當(dāng)用戶試圖將兒童安全虐待材料上傳到我們的圖像生成工具時(shí),我們會(huì)阻止它并向國家失蹤和受剝削兒童中心報(bào)告此事。
除了默認(rèn)的安全防護(hù),我們與非營利組織可汗學(xué)院(Khan Academy)等開發(fā)機(jī)構(gòu)合作,為他們量身定制了安全措施??珊箤W(xué)院已經(jīng)開發(fā)了一款人工智能助手,它可以作為學(xué)生的虛擬導(dǎo)師,也可以作為教師的課堂助手。我們還致力于開發(fā)允許開發(fā)者為模型輸出設(shè)置更嚴(yán)格標(biāo)準(zhǔn)的功能,以更好地支持需要此類功能的開發(fā)者和用戶。
尊重隱私
我們的大型語言模型是在廣泛的文本語料庫上進(jìn)行訓(xùn)練的,其中包括公開可用的內(nèi)容、獲得授權(quán)的內(nèi)容以及由人類審核人員生成的內(nèi)容。我們不利用這些數(shù)據(jù)來銷售我們的服務(wù)或廣告,也不用它們來建立個(gè)人檔案。我們只是利用這些數(shù)據(jù)來讓我們的模型更好地為人們提供幫助,例如通過與人們進(jìn)行更多對(duì)話來提高ChatGPT的智能水平。
盡管我們的許多訓(xùn)練數(shù)據(jù)中包括可以在公共網(wǎng)絡(luò)上獲得的個(gè)人信息,但我們希望我們的模型了解的是整個(gè)世界,而不是個(gè)人。因此,我們致力于在可行的情況下從訓(xùn)練數(shù)據(jù)集中刪除個(gè)人信息,微調(diào)模型以拒絕個(gè)人信息的查詢請(qǐng)求,并響應(yīng)個(gè)人從我們的系統(tǒng)中刪除其個(gè)人信息的請(qǐng)求。這些措施將我們的模型生成包含個(gè)人信息的響應(yīng)的可能性降至最低。
提高事實(shí)準(zhǔn)確性
現(xiàn)今的大型語言模型,基于之前的模式和用戶輸入的文本,可以預(yù)測(cè)下一個(gè)可能要使用的詞匯。但在某些情況下,下一個(gè)最有可能出現(xiàn)的詞匯實(shí)際上可能存在事實(shí)性錯(cuò)誤。
提高事實(shí)準(zhǔn)確性是OpenAI和許多其他AI研究機(jī)構(gòu)關(guān)注的重點(diǎn)之一,我們正在取得進(jìn)展。通過利用被標(biāo)記為不正確的ChatGPT輸出的用戶反饋?zhàn)鳛橹饕獢?shù)據(jù)來源,我們提高了GPT-4的事實(shí)準(zhǔn)確性。相比于GPT-3.5,GPT-4更可能產(chǎn)生符合事實(shí)的內(nèi)容,提高幅度達(dá)到40%。
當(dāng)用戶注冊(cè)使用該工具時(shí),我們努力做到盡可能透明,以避免ChatGPT可能給出錯(cuò)誤回復(fù)。然而,我們已經(jīng)認(rèn)識(shí)到,要進(jìn)一步降低誤解的可能性,并教育公眾了解這些AI工具目前的局限性,還有很多工作要做。
持續(xù)的研究和參與
我們認(rèn)為,解決AI安全問題的一個(gè)切實(shí)可行方法是,投入更多的時(shí)間和資源來研究有效的緩解和校準(zhǔn)技術(shù),并針對(duì)現(xiàn)實(shí)世界可能被濫用的情況進(jìn)行測(cè)試。
重要的是,我們認(rèn)為提高AI的安全性和能力應(yīng)該同時(shí)進(jìn)行。我們迄今為止最好的安全工作來自于與我們最有能力的模型合作,因?yàn)樗鼈兏瞄L遵循用戶的指示,更容易駕馭或“引導(dǎo)”它們。
我們將越來越謹(jǐn)慎地創(chuàng)建和部署能力更強(qiáng)的模型,并將隨著AI系統(tǒng)的發(fā)展而繼續(xù)加強(qiáng)安全預(yù)防措施。
雖然我們等了6個(gè)多月才部署GPT-4,以更好地了解其功能、好處和風(fēng)險(xiǎn),但有時(shí)可能需要更長的時(shí)間來提高AI系統(tǒng)的安全性。因此,政策制定者和AI開發(fā)商需要確保AI的開發(fā)和部署在全球范圍內(nèi)得到有效監(jiān)管,這樣就沒有人會(huì)為了保持領(lǐng)先而采取捷徑。這是一項(xiàng)艱巨的挑戰(zhàn),需要技術(shù)和制度創(chuàng)新,但我們渴望為此做出貢獻(xiàn)。
解決AI安全問題還需要廣泛的辯論、實(shí)驗(yàn)和參與,包括為AI系統(tǒng)的行為設(shè)置界限。我們已經(jīng)并將繼續(xù)促進(jìn)利益相關(guān)者之間的合作和開放對(duì)話,以創(chuàng)建更安全的AI生態(tài)系統(tǒng)。
評(píng)論