搜尋
首頁科技週邊人工智慧OpenAI指引允許董事會限制CEO發布新模型,以防範AI風險

OpenAI指引允許董事會限制CEO發布新模型,以防範AI風險

Dec 19, 2023 am 11:32 AM
ai風險防範ceo控制模型發布製止

為了避免人工智慧(AI)可能帶來的巨大風險,OpenAI決定授予董事會更大的權力來監管安全事務,並對上個月剛在內部爭鬥中獲勝的CEO Sam Altman進行嚴格的監督

OpenAI在美東時間12月18日週一發布了一系列指南,旨在追蹤、評估、預測和防範日益強大的人工智慧(AI)模型帶來的災難性風險。 OpenAI將"災難性風險"定義為可能導致數千億美元的經濟損失,或導致多人嚴重傷害或死亡的任何風險

這篇27頁的指引被稱為“準備框架”,其中提到,即使公司的高層管理人員,包括CEO或由領導層指定的人員認為即將發布的AI模型是安全的,公司董事會仍然有權選擇推遲該模型的發布。這意味著,儘管OpenAI的CEO負責日常工作的決策,但董事會將了解風險的發現,並有權否決CEO的決定

OpenAI的準備框架建議除了對公司領導層和董事會權限的規定外,還使用了矩陣方法來記錄多個類別的前沿AI模型所帶來的風險水平。這些風險包括行為不端者使用AI模型創建惡意軟體、發動社會工程攻擊,或傳播有害的核武或生物武器資訊

具體來說,OpenAI 在網路安全、CBRN(化學、生物、放射、核威脅)、說服和模型自主四個類別上設定了風險閾值。在實施風險緩解措施之前和之後,OpenAI 將每種風險分為低、中、高或嚴重四個等級

OpenAI指引允許董事會限制CEO發布新模型,以防範AI風險

OpenAI規定,只有在風險緩解後評級為「中」或以下等級的AI模型才可以進行部署,只有在風險緩解後評級為「高」或以下的模型才能繼續進行開發,如果無法將風險降低到嚴重以下級別,公司將停止開發模型。對於在風險緩解前評定為高風險或嚴重風險的模型,OpenAI也將採取額外的安全措施

OpenAI將安全問題處理人員分為三個團隊。安全系統團隊專注於減輕和解決目前產品(如GPT-4)所帶來的風險。超對齊團隊則專注於未來系統超越人類能力可能帶來的問題。此外,還有一個名為準備的新團隊,由麻省理工學院(MIT)電機工程與電腦科學系(EECS)教授Aleksander Madry領導

新的團隊將對強大的模型開發和實施進行評估。他們將專門負責監督與安全決策相關的技術工作和操作架構。他們將推動技術工作,審查前沿模型能力的限制,並進行評估和綜合相關報告

Madry表示,他的團隊將定期評估OpenAI尚未發布的最先進的人工智慧模型的風險水平,並每月向OpenAI內部的安全顧問組織(SAG)提交報告。 SAG將分析Madry團隊的工作,並向CEO Altman和公司董事會提供建議

根據本週一公佈的指引文件顯示,Altman及其領導層可以根據這些報告來決定是否發布新的AI系統,但董事會保有推翻他們決定的權力

目前,Madry的團隊只有四個人,但他正在努力招募更多的成員。預計團隊成員將達到15到20人的規模,與現有的安全團隊和超對齊團隊的人數相當

Madry希望其他人工智慧公司能夠以類似的方式評估其模型的風險,並認為這可能成為監管的典範

以上是OpenAI指引允許董事會限制CEO發布新模型,以防範AI風險的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
高維數據的高級矢量索引技術高維數據的高級矢量索引技術Apr 11, 2025 am 10:16 AM

高維矢量搜索:掌握高級索引技術 在當今數據驅動的世界中,高維矢量對於推薦系統,圖像識別,自然語言處理(NLP)和異常等應用至關重要

用OpenAI' s剪輯VIT-L14進行零擊圖像分類用OpenAI' s剪輯VIT-L14進行零擊圖像分類Apr 11, 2025 am 10:04 AM

Openai的剪輯(對比語言 - 圖像預訓練)模型,特別是剪輯VIT-L14變體,代表了多模式學習和自然語言處理的重大進步。 這種強大的計算機視覺系統在Represe上擅長

建立沒有代碼的AI代理的7個步驟-Analytics Vidhya建立沒有代碼的AI代理的7個步驟-Analytics VidhyaApr 11, 2025 am 10:03 AM

利用AI代理的功能使用Wordware:無需輕鬆AI代理創建的無代碼平台。 人工智能代理人正在徹底改變我們與計算機互動,自動化任務和簡化決策的方式。 該博客演示瞭如何構建

手機上的LLM:現在和將來的可能性 - 分析Vidhya手機上的LLM:現在和將來的可能性 - 分析VidhyaApr 11, 2025 am 09:58 AM

生成AI:下一個智能手機戰場 智能手機行業陷入了激烈的競爭中:整合先進的生成AI的競賽。 從增強用戶互動到提高生產率,賭注很高。蘋果的iPhone 16

在2025年遵循的十大生成AI子列表 - 分析Vidhya在2025年遵循的十大生成AI子列表 - 分析VidhyaApr 11, 2025 am 09:51 AM

生成AI:您的10個基本Reddit社區的指南 生成的AI正在迅速發展,新模型不斷出現。 保持更新至關重要,Reddit提供專門針對該領域的充滿活力的社區。本文凸顯了T

AI模型中的主要挑戰和局限性-Analytics VidhyaAI模型中的主要挑戰和局限性-Analytics VidhyaApr 11, 2025 am 09:44 AM

介紹 人工智能(AI)已迅速整合到各種工作場所中,這是由於AI研發和開發的大量投資所推動。 AI的應用程序範圍很廣,從虛擬助手等簡單任務到com

處理SQL中的無效值處理SQL中的無效值Apr 11, 2025 am 09:37 AM

介紹 在數據庫的領域中,零值通常會帶來獨特的挑戰。 代表缺失,未定義或未知數據,它們可能使數據管理和分析複雜化。考慮一個缺少客戶反饋或orde的銷售數據庫

如何將Google Gemini集成到Tableau儀表板中?如何將Google Gemini集成到Tableau儀表板中?Apr 11, 2025 am 09:27 AM

利用Google Gemini在Tableau儀表板上的力量:AI驅動的增強 Tableau的強大可視化功能,跨越數據準備(Tableau Prep Builder),數據講故事(Tableau Desktop)和協作共享(TABL)

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)