如何保障AI安全？OpenAI詳細解答，將積極與各國政府接觸

作者：時間：2023-04-06 來源：網(wǎng)易科技

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

4月6日消息，美國當?shù)貢r間周三，OpenAI發(fā)帖，詳細介紹了其確保AI安全的方法，包括進行安全評估、改進發(fā)布后的保障措施、保護兒童以及尊重隱私等。該公司表示，確保AI系統(tǒng)的構建、部署和安全使用對實現(xiàn)其使命至關重要。

本文引用地址：http://www.butianyuan.cn/article/202304/445323.htm

以下是OpenAI帖子的全文：

OpenAI致力于確保強大的AI安全，讓盡可能多的人受益。我們知道，我們的AI工具為當今人們提供了許多幫助。世界各地的用戶向我們反饋，ChatGPT有助于提高他們的工作效率、增強他們的創(chuàng)造力，并提供量身定制的學習體驗。但我們也認識到，與任何技術一樣，這些工具也存在真正的風險。因此，我們正在努力確保在各個系統(tǒng)層面上的安全性。

打造更加安全的人工智能系統(tǒng)

在推出任何新的人工智能系統(tǒng)之前，我們都會進行嚴格的測試，征求外部專家的意見，并通過人工反饋的強化學習等技術來改善模型的表現(xiàn)。同時，我們還建立了廣泛的安全和監(jiān)控系統(tǒng)。

以我們最新的模型GPT-4為例，完成訓練后，我們在整個公司范圍內進行了長達6個月的測試，以確保其在公開發(fā)布之前更加安全可靠。

我們認為，強大的人工智能系統(tǒng)應該接受嚴格的安全評估。監(jiān)管是必要的，以確保這種做法被廣泛采納。因此，我們積極與各國政府接觸，探討最佳的監(jiān)管形式。

從實際使用中學習，提高保障措施

我們盡力在系統(tǒng)部署之前預防可預見的風險，但實驗室中的學習永遠有限。我們廣泛研究和測試，但無法預測人們會如何使用我們的技術，或濫用它。因此，我們認為從實際使用中學習，是創(chuàng)建和發(fā)布越來越安全的人工智能系統(tǒng)的關鍵組成部分。

我們謹慎地將新的人工智能系統(tǒng)逐步發(fā)布給人群，并采取實質性的保障措施，并根據(jù)我們吸取的教訓不斷改進。

我們提供自己服務和API中最強大的模型，以便開發(fā)人員可以直接將技術集成到他們的應用程序中。這使我們能夠監(jiān)控濫用行為并采取行動，同時制定應對措施。這樣，我們可以采取實際行動，而不僅僅在理論上想象如何應對。

實際使用中的經(jīng)驗也促使我們制定了越來越細化的政策，以應對對人們構成真正風險的行為，同時仍然允許我們的技術以更有益的方式使用。

我們認為，社會需要更多時間適應日益強大的人工智能，每個受其影響的人都應該在人工智能的進一步發(fā)展方面擁有發(fā)言權。迭代部署有助于不同利益相關者更有效地參與人工智能技術的對話中，而擁有使用這些工具的第一手經(jīng)驗至關重要。

保護兒童

我們的安全工作關注重點之一是保護兒童。我們要求使用我們的人工智能工具的人必須年滿18歲或以上，或者在父母同意的情況下年滿13歲或以上。目前，我們正在研究驗證功能。

我們不允許我們的技術用于生成仇恨、騷擾、暴力或成人等內容。與GPT-3.5相比，最新的GPT-4對受限制內容請求做出響應的可能性降低了82%。我們已經(jīng)建立了強大的系統(tǒng)來監(jiān)控濫用行為。GPT-4現(xiàn)在可供ChatGPT Plus的訂戶使用，我們希望隨著時間的推移能讓更多人體驗它。

我們已經(jīng)采取重大措施，最大限度地減少我們的模型產(chǎn)生傷害兒童內容的可能性。例如，當用戶試圖將兒童安全虐待材料上傳到我們的圖像生成工具時，我們會阻止它并向國家失蹤和受剝削兒童中心報告此事。

除了默認的安全防護，我們與非營利組織可汗學院(Khan Academy)等開發(fā)機構合作，為他們量身定制了安全措施?？珊箤W院已經(jīng)開發(fā)了一款人工智能助手，它可以作為學生的虛擬導師，也可以作為教師的課堂助手。我們還致力于開發(fā)允許開發(fā)者為模型輸出設置更嚴格標準的功能，以更好地支持需要此類功能的開發(fā)者和用戶。

尊重隱私

我們的大型語言模型是在廣泛的文本語料庫上進行訓練的，其中包括公開可用的內容、獲得授權的內容以及由人類審核人員生成的內容。我們不利用這些數(shù)據(jù)來銷售我們的服務或廣告，也不用它們來建立個人檔案。我們只是利用這些數(shù)據(jù)來讓我們的模型更好地為人們提供幫助，例如通過與人們進行更多對話來提高ChatGPT的智能水平。

盡管我們的許多訓練數(shù)據(jù)中包括可以在公共網(wǎng)絡上獲得的個人信息，但我們希望我們的模型了解的是整個世界，而不是個人。因此，我們致力于在可行的情況下從訓練數(shù)據(jù)集中刪除個人信息，微調模型以拒絕個人信息的查詢請求，并響應個人從我們的系統(tǒng)中刪除其個人信息的請求。這些措施將我們的模型生成包含個人信息的響應的可能性降至最低。

提高事實準確性

現(xiàn)今的大型語言模型，基于之前的模式和用戶輸入的文本，可以預測下一個可能要使用的詞匯。但在某些情況下，下一個最有可能出現(xiàn)的詞匯實際上可能存在事實性錯誤。

提高事實準確性是OpenAI和許多其他AI研究機構關注的重點之一，我們正在取得進展。通過利用被標記為不正確的ChatGPT輸出的用戶反饋作為主要數(shù)據(jù)來源，我們提高了GPT-4的事實準確性。相比于GPT-3.5，GPT-4更可能產(chǎn)生符合事實的內容，提高幅度達到40%。

當用戶注冊使用該工具時，我們努力做到盡可能透明，以避免ChatGPT可能給出錯誤回復。然而，我們已經(jīng)認識到，要進一步降低誤解的可能性，并教育公眾了解這些AI工具目前的局限性，還有很多工作要做。

持續(xù)的研究和參與

我們認為，解決AI安全問題的一個切實可行方法是，投入更多的時間和資源來研究有效的緩解和校準技術，并針對現(xiàn)實世界可能被濫用的情況進行測試。

重要的是，我們認為提高AI的安全性和能力應該同時進行。我們迄今為止最好的安全工作來自于與我們最有能力的模型合作，因為它們更擅長遵循用戶的指示，更容易駕馭或“引導”它們。

我們將越來越謹慎地創(chuàng)建和部署能力更強的模型，并將隨著AI系統(tǒng)的發(fā)展而繼續(xù)加強安全預防措施。

雖然我們等了6個多月才部署GPT-4，以更好地了解其功能、好處和風險，但有時可能需要更長的時間來提高AI系統(tǒng)的安全性。因此，政策制定者和AI開發(fā)商需要確保AI的開發(fā)和部署在全球范圍內得到有效監(jiān)管，這樣就沒有人會為了保持領先而采取捷徑。這是一項艱巨的挑戰(zhàn)，需要技術和制度創(chuàng)新，但我們渴望為此做出貢獻。

解決AI安全問題還需要廣泛的辯論、實驗和參與，包括為AI系統(tǒng)的行為設置界限。我們已經(jīng)并將繼續(xù)促進利益相關者之間的合作和開放對話，以創(chuàng)建更安全的AI生態(tài)系統(tǒng)。