首頁 >科技週邊 >人工智慧 >OpenAI DALL-E 3 模型存產生'不當內容”漏洞,一微軟員工上報後反遭'封口令”

OpenAI DALL-E 3 模型存產生'不當內容”漏洞,一微軟員工上報後反遭'封口令”

WBOY
WBOY轉載
2024-02-04 14:40:22770瀏覽

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

2月2日訊息,微軟軟體工程部門經理Shane Jones最近發現OpenAI旗下的DALL-E 3模型存在漏洞,據稱可以產生一系列不適宜內容。 Shane Jones向公司報了漏洞,但卻被要求保密。然而,他最終還是決定向外界透露了這個漏洞。

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

▲ 圖源 Shane Jones 對外披露的報告

本站注意到,Shane Jones 在去年12 月透過獨立研究發現OpenAI 文字生成圖片的DALL-E 3 模型存在一項漏洞。這個漏洞能夠繞過 AI 護欄(AI Guardrail),導致產生一系列 NSFW 不當內容。這個發現引起了廣泛關注,並引發了對 AI 系統安全性和道德問題的深入討論。 OpenAI 公司已經表示他們將盡快修復這個漏洞,以確保其係統的正確和安全運作。這個事件再次提醒了我們在開發和應用人工智慧技術時需要高度重視安全性和倫理問題。

Shane Jones隨後將漏洞上報給微軟和OpenAI,並在領英上發布了一封公開信。他聲稱這些漏洞可能會為大眾帶來安全風險,並呼籲OpenAI在解決漏洞之前暫時下架DALL-E 3模型。

隨後Shane Jones 被微軟法務部及高管找上門,並警告他立即刪除領英公開信並停止對外披露任何內容,但卻並未給予任何解釋說明,此後Shane Jones 一再尋求公司內部溝通,但均未得到公司回應,而漏洞也未修復,之後Shane Jones 便向媒體及相關部門披露了相關漏洞。

Shane Jones 提到,近日網路上出現 AI 生成的知名歌手 Taylor Swift(泰勒・斯威夫特)不雅照便與該漏洞有一定關聯,這些不雅照據稱是使用微軟 Designer AI 功能生成,而 Designer 底層模型正是 DALL-E 3,因此微軟在本次事件中下達「封口令」存在重大過失。

此後微軟官方回應Engadget 等媒體,聲稱將解決相關員工的疑慮,並修復相關漏洞,不過微軟同時聲稱Shane Jones 披露的漏洞實際上成功率較低,「無法繞過微軟為模型設定的所有安全機制」、「目前還不清楚該漏洞與Taylor Swift 不雅照事件是否有關聯性」

OpenAI DALL-E 3 模型存生成“不当内容”漏洞,一微软员工上报后反遭“封口令”

以上是OpenAI DALL-E 3 模型存產生'不當內容”漏洞,一微軟員工上報後反遭'封口令”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除