Big Data Digest에서 제작
어제 OpenAI는 ChatGPT로 인해 증가하는 사이버 보안 위험을 해결하는 데 도움이 되는 현상금 프로그램의 출시를 발표했습니다.
이 "바운티 헌터 프로그램"은 다양한 독립 연구원을 초대하여 OpenAI 시스템의 취약점을 보고하도록 하며, 참가자는 심각도에 따라 US$200에서 US$20,000까지의 금전적 보상을 받을 수 있습니다. 취약점의.
이 프로젝트는 크라우드소싱 사이버 보안 회사인 BugCrowd와 협력하여 수행되었으며 OpenAI는 이 프로젝트가 "안전하고 고급 인공 지능 개발을 위한 노력"의 일부라고 말했습니다.
따라서 ChatGPT와 채팅하는 과정에서 허점을 발견하면(예: 매 턴마다 인간을 파괴하는 등) 허점을 발견하는 데 도움이 될 수 있다면 제때에 신고해야 합니다. 현상금을 받을 수 있어요!
ChatGPT가 탄생한 이후 사람들은 잘못된 정보와 비윤리적인 정보 생성 등 인공지능 시스템의 취약점에 대해 점점 더 우려하게 되었습니다. 인공지능 사이버 보안 회사인 Dark Trace에 따르면, ChatGPT 출시와 동시에 인공지능을 활용한 소셜엔지니어링 공격이 1월부터 2월까지 135% 증가했습니다.
ChatGPT의 출현으로 의심할 여지 없이 사이버 공격의 임계값이 낮아졌습니다. 특히 새로 출시된 ChatGPT 4.0은 더욱 그렇습니다.
ChatGPT 4.0이 출시된 지 불과 며칠 만에 워싱턴 대학교 컴퓨터 과학 학생 Alex Albert는 보안 메커니즘을 무시하는 방법을 찾았습니다. Twitter에 게시된 데모에서 Albert는 GPT-4가 텍스트를 해석하고 응답하는 방식의 취약점을 악용하여 사용자가 GPT-4에 컴퓨터 해킹 지침을 생성하도록 유도할 수 있는 방법을 보여주었습니다.
이 현상금 프로그램은 이러한 일련의 보안 문제로 인해 널리 퍼진 우려를 해결하기 위한 것입니다. 이전에 Rez0이라는 보안 연구원은 A 취약점을 사용한 것으로 의심되었습니다. ChatGPT의 API에서 악용되었으며 80개 이상의 비밀 플러그인이 발견되었습니다.
이러한 논란에 비추어 OpenAI는 연구원들이 제품 생태계의 단점을 해결하기 위해 취약점을 보고하도록 장려하는 동시에 다음으로 인한 문제를 해결하기 위해 선의로 행동하는 조직으로 자리매김하기 위해 이 현상금 상을 시작했습니다. 생성 AI로 인한 보안 위험.
전문가: "포상금 프로그램"의 효과는 제한적입니다
OpenAI의 계획은 일부 전문가들에 의해 환영받는 반면, 다른 전문가들은 현상금 프로그램이 광범위한 문제를 해결할 가능성이 낮다고 말합니다. 범위 점점 더 정교해지는 인공 지능 기술로 인해 발생하는 사이버 보안 위험에 대해 알아보겠습니다.
전문가들은 OpenAI의 현상금 프로그램이 처리하는 위협의 범위가 매우 제한되어 있다고 생각합니다. 예를 들어 포상금 프로그램의 공식 페이지에는 "데모 프롬프트 및 응답 콘텐츠와 관련된 문제는 엄격히 범위를 벗어나며 범위 내 서비스에 추가로 직접 검증 가능한 보안 영향이 없는 한 보상되지 않습니다."라고 명시되어 있습니다.
범위를 벗어나는 것으로 간주되는 보안 문제의 예로는 탈옥 및 안전 모드 우회, 모델이 "비윤리적으로 말하도록" 허용, 모델이 악성 코드를 작성하도록 허용 또는 모델이 나쁜 일을 실행하는 방법을 알려주는 등이 있습니다. .
이런 의미에서 OpenAI의 버그 바운티 프로그램은 조직의 보안 태세를 개선하는 데 도움이 될 수 있지만 생성 AI 및 GPT-4가 사회 전체에 가져온 문제를 해결하는 데는 도움이 되지 않습니다. 위험은 거의 영향을 미치지 않습니다.
많은 사람들이 프로젝트 범위가 OpenAI 시스템 및 파트너에게 직접적인 영향을 미칠 수 있는 취약점으로 제한되어 있기 때문에 사칭, 합성 미디어, 또는 자동화된 해킹 도구에 대한 우려가 더 넓습니다.
OpenAI는 의견 요청에 즉시 응답하지 않았습니다.
관련 보고서:
https://www.php.cn/link/3e9928ece00c78dc7777c644f68d3956
https://www.php.cn/ 링크/52ff52aa56d10a1287274ecf02dccb5f
위 내용은 OpenAI는 ChatGPT 결함 보고서에 대한 현상금 사냥꾼을 모집하기 위해 $20,000의 보상을 설정했습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!