搜尋
首頁科技週邊人工智慧如何保障AI安全? OpenAI詳細解答,將積極與各國政府接觸

如何保障AI安全? OpenAI詳細解答,將積極與各國政府接觸

4月6日消息,美國當地時間週三,OpenAI發帖,詳細介紹了其確保AI安全的方法,包括進行安全評估、改進發布後的保障措施、保護兒童以及尊重隱私等。該公司表示,確保AI系統的建置、部署和安全使用對實現其使命至關重要。

以下是OpenAI貼文的全文:

OpenAI致力於確保強大的AI安全,讓盡可能多的人受益。我們知道,我們的AI工具為當今人們提供了許多幫助。世界各地的使用者向我們回饋,ChatGPT有助於提高他們的工作效率、增強他們的創造力,並提供量身定制的學習體驗。但我們也意​​識到,與任何技術一樣,這些工具也存在真正的風險。因此,我們正在努力確保在各個系統層面上的安全性。

打造更安全的人工智慧系統

在推出任何新的人工智慧系統之前,我們都會進行嚴格的測試,徵求外部專家的意見,並通過人工回饋的強化學習等技術來改善模型的表現。同時,我們也建立了廣泛的安全和監控系統。

以我們最新的模型GPT-4為例,完成訓練後,我們在整個公司範圍內進行了長達6個月的測試,以確保其在公開發布之前更加安全可靠。

我們認為,強大的人工智慧系統應該接受嚴格的安全評估。監管是必要的,以確保這種做法被廣泛採納。因此,我們積極與各國政府接觸,並探討最佳的監管形式。

從實際使用中學習,提高保障措施

我們盡力在系統部署之前預防可預見的風險,但實驗室中的學習永遠有限。我們廣泛研究和測試,但無法預測人們會如何使用我們的技術,或濫用它。因此,我們認為從實際使用中學習,是創建和發布越來越安全的人工智慧系統的關鍵組成部分。

我們謹慎地將新的人工智慧系統逐步發布給人群,並採取實質的保障措施,並根據我們學到的教訓不斷改進。

我們提供自己服務和API中最強大的模型,以便開發人員可以直接將技術整合到他們的應用程式中。這使我們能夠監控濫用行為並採取行動,同時制定應對措施。這樣,我們可以採取實際行動,而不只是在理論上想像如何應對。

實際使用中的經驗也促使我們制定了越來越細化的政策,以應對對人們構成真正風險的行為,同時仍然允許我們的技術以更有益的方式使用。

我們認為,社會需要更多時間適應日益強大的人工智慧,每個受其影響的人都應該在人工智慧的進一步發展方面擁有發言權。迭代部署有助於不同利害關係人更有效地參與人工智慧技術的對話中,而擁有使用這些工具的第一手經驗至關重要。

保護兒童

我們的安全工作關注重點之一是保護兒童。我們要求使用我們的人工智慧工具的人必須年滿18歲或以上,或在父母同意的情況下年滿13歲或以上。目前,我們正在研究驗證功能。

我們不允許我們的技術用於產生仇恨、騷擾、暴力或成人等內容。與GPT-3.5相比,最新的GPT-4對受限內容請求做出回應的可能性降低了82%。我們已經建立了強大的系統來監控濫用行為。 GPT-4現在可供ChatGPT Plus的訂戶使用,我們希望隨著時間的推移能讓更多人體驗它。

我們已經採取重大措施,最大限度地減少我們的模型產生傷害兒童內容的可能性。例如,當用戶試圖將兒童安全虐待材料上傳到我們的圖像生成工具時,我們會阻止它並向國家失踪和受剝削兒童中心報告此事。

除了預設的安全防護,我們與非營利組織可汗學院(Khan Academy)等開發機構合作,為他們量身定制了安全措施。可汗學院已經開發了一款人工智慧助手,它可以作為學生的虛擬導師,也可以作為教師的課堂助手。我們也致力於開發允許開發者為模型輸出設定更嚴格標準的功能,以更好地支援需要此類功能的開發者和使用者。

尊重隱私

我們的大型語言模型是在廣泛的文本語料庫上進行訓練的,其中包括公開可用的內容、獲得授權的內容以及由人類審核人員產生的內容。我們不利用這些資料來銷售我們的服務或廣告,也不用它們來建立個人檔案。我們只是利用這些數據來讓我們的模型更好地為人們提供幫助,例如透過與人們進行更多對話來提高ChatGPT的智慧水平。

儘管我們的許多訓練資料中包括可以在公共網路上獲得的個人訊息,但我們希望我們的模型了解的是整個世界,而不是個人。因此,我們致力於在可行的情況下從訓練資料集中刪除個人訊息,微調模型以拒絕個人資訊的查詢請求,並回應個人從我們的系統中刪除其個人資訊的請求。這些措施將我們的模型產生包含個人資訊的回應的可能性降至最低。

提高事實準確度

現今的大型語言模型,基於先前的模式和使用者輸入的文本,可以預測下一個可能要使用的詞彙。但在某些情況下,下一個最有可能出現的詞彙實際上可能存在事實性錯誤。

提高事實準確性是OpenAI和許多其他AI研究機構關注的重點之一,我們正在取得進展。透過利用被標記為不正確的ChatGPT輸出的用戶回饋作為主要數據來源,我們提高了GPT-4的事實準確性。相較於GPT-3.5,GPT-4更可能產生符合事實的內容,提高幅度達40%。

當用戶註冊使用該工具時,我們努力做到盡可能透明,以避免ChatGPT可能給予錯誤回應。然而,我們已經認識到,要進一步降低誤解的可能性,並教育大眾了解這些AI工具目前的局限性,還有很多工作要做。

持續的研究和參與

我們認為,解決AI安全問題的一個切實可行方法是,投入更多的時間和資源來研究有效的緩解和校準技術,並針對現實世界可能被濫用的情況進行測試。

重要的是,我們認為提高AI的安全性和能力應該同時進行。我們迄今為止最好的安全工作來自於與我們最有能力的模型合作,因為它們更擅長遵循用戶的指示,更容易駕馭或「引導」它們。

我們將越來越謹慎地創建和部署能力更強的模型,並將隨著AI系統的發展而繼續加強安全預防措施。

雖然我們等了6個多月才部署GPT-4,以便更好地了解其功能、好處和風險,但有時可能需要更長的時間來提高AI系統的安全性。因此,政策制定者和AI開發商需要確保AI的開發和部署在全球範圍內得到有效監管,這樣就沒有人會為了保持領先而採取捷徑。這是一項艱鉅的挑戰,需要技術和製度創新,但我們渴望為此做出貢獻。

解決AI安全問題也需要廣泛的辯論、實驗和參與,包括為AI系統的行為設定界限。我們已經並將繼續促進利益相關者之間的合作和開放對話,以創建更安全的AI生態系統。 (小小)

以上是如何保障AI安全? OpenAI詳細解答,將積極與各國政府接觸的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
使用Python的Google表自動化|分析Vidhya使用Python的Google表自動化|分析VidhyaApr 13, 2025 am 10:01 AM

Google表是Excel的最受歡迎和廣泛使用的替代方案之一,它提供了具有實時編輯,版本控制和與Google Suite無縫集成等功能的協作環境,允許U

O1-Mini:一種改變遊戲規則的STEM和推理模型O1-Mini:一種改變遊戲規則的STEM和推理模型Apr 13, 2025 am 09:55 AM

OpenAI引入了O1-Mini,這是一種具有成本效益的推理模型,重點是STEM受試者。該模型在數學和編碼中表現出令人印象深刻的性能,與其前身Openai O1非常相似

用結構化輸出和功能調用增強LLM用結構化輸出和功能調用增強LLMApr 13, 2025 am 09:45 AM

介紹 假設您正在與知識淵博但有時缺乏具體/知情的回答或他/她/她/她在面對複雜問題時不會流利的回應時互動。我們在這裡做什麼

關於LLM代理商的15個最常見的問題關於LLM代理商的15個最常見的問題Apr 13, 2025 am 09:41 AM

介紹 大型語言模型(LLM)代理是使用LLM作為中央計算引擎的高級AI系統。他們有能力執行特定的行動,做出決策並與外部工具或

11 YouTube頻道免費學習生成AI -Analytics Vidhya11 YouTube頻道免費學習生成AI -Analytics VidhyaApr 13, 2025 am 09:38 AM

介紹 As Generative AI continues to reshape industries from content creation to automation, learning this technology has become essential for aspiring AI professionals and enthusiasts alike.憑藉其巨大的教育

LLM代理商的10種申請LLM代理商的10種申請Apr 13, 2025 am 09:34 AM

介紹 大型語言模型或LLM是改變遊戲規則的人,尤其是在使用內容時。從支持摘要,翻譯和一代,諸如GPT-4,Gemini和Llama之類的LLM使它變得簡單

LLM代理如何重塑工作場所?LLM代理如何重塑工作場所?Apr 13, 2025 am 09:33 AM

介紹 大型語言模型(LLM)代理是提高工作場所業務效率的最新創新。他們自動進行重複的活動,促進協作並在各個部門提供有用的見解。與眾不同

設置法師AI與Postgres設置法師AI與PostgresApr 13, 2025 am 09:31 AM

想像一下自己是一個數據專業人士,負責創建有效的數據管道來簡化流程並生成實時信息。聽起來很具有挑戰性,對嗎?那就是法師AI的來源以確保貸款

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)