ホームページ > 記事 > テクノロジー周辺機器 > GPT-4 は AI-Guardian レビュー システムを破ることに成功しました: Google 研究チームの人工知能は人工知能に抵抗します
8 月 2 日のニュースによると、Google 研究チームは OpenAI の GPT-4 を使用して、他の AI モデルのセキュリティ保護手段を突破する実験を行っているとのことです。チームは現在、すでに AI-Guardian レビュー システムに侵入しており、関連する技術的な詳細を共有しています。
IT House は調査を通じて、AI-Guardian が画像内に不適切なコンテンツがあるかどうか、および画像が他の AI によって変更されているかどうかを検出できる AI レビュー システムであることを知りました。システムが上記の兆候を検出した場合、管理者は次のように対処するように求められます。 「GPT-4 を使用した攻撃手法の設計と攻撃原則の作成」というタイトルの論文で、Google Deep Mind の研究者である Nicholas Carlini 氏は次のように述べています。これらのスキームを使用して AI ガーディアンの防御メカニズムを欺く方法を説明します#元の文が具体的な内容を示していないため、この文を書き直すことはできません
GPT-4 は、AI-Guardian を欺くために一連の間違ったスクリプトと説明を送信すると報告されています。この論文では、
GPT-4 は AI-Guardian に「銃を持った人物の写真」と思わせる可能性があると述べています。は「無害なリンゴの写真を持っている人」であり、AI-Guardian が関連する画像入力ソースを直接解放できるようになります。 Googleの研究チームは、GPT-4の助けを借りてAI-Guardianの防御を「突破」することに成功し、モデルの精度を98%からわずか8%に低下させたと発表した。 現在、関連する技術文書は ArXiv で公開されています。興味のある友人
は、、 について詳しく知ることができます。ただし、AI-Guardian の開発者は、 Google 研究チーム この攻撃手法は、AI-Guardian の将来のバージョンでは利用できなくなります . 他のモデルも追随することを考慮すると、Google の現在の攻撃計画は将来の参考としてのみ使用できます。
以上がGPT-4 は AI-Guardian レビュー システムを破ることに成功しました: Google 研究チームの人工知能は人工知能に抵抗しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。