ホームページ > 記事 > テクノロジー周辺機器 > ChatGPT「Nemesis」:AIを利用してAI生成テキストを認識、英語論文の読書メモも検出可能
ChatGPT の出現により、多くの人が締め切りの終わりに大きな仕事の夜明けを見ることができるようになりました (手動の犬の頭)。
英語の論文であれ、読書メモであれ、ChatGPT の知識範囲内であれば、完成を手伝ってもらうことができ、書かれた内容は十分に根拠のあるものになります。
しかし、教師もカンニングを防ぐために「AI テキスト検出器」のようなものを使用することを計画していると考えたことはありますか?
このように一見完璧なメモを入力すると、いくつかのテストの後、このテキストが「AI によって書かれた」(偽物) である確率は 99.98% です。
△テキストは ChatGPT によって生成されます
別の数学の論文を試してみますか? ChatGPT の出力には問題がないように見えますが、依然として正確に認識されています:
△テキストは ChatGPT によって生成されています
これはではありません盲目やゲスに頼っても、結局のところ、相手もAIであり、よく訓練されたAIです。
これを見たネチズンの中には、「魔法を倒すために魔法を使うのか?」と冗談を言った人もいました。
AI によって書かれたものを使用して新しい AI をトレーニングする
この AI 検出器は GPT-2 Output Detector と呼ばれ、OpenAI とハーバード大学の共同事業です。大学等の組織と連携して作成します。 (はい、OpenAI が内製しています)
50 文字以上 (トークン) を入力すると、AI が生成したテキストをより正確に識別できます。
しかし、GPT-2 の検出に特化したモデルであっても、他の AI によって生成されたテキストの検出には同様に効果的です。
著者らは、AIが「AI言語」と「人間の音声」の違いを理解できるようにする「GPT-2で生成されたコンテンツ」とWebText(特に海外の投稿バーであるRedditから取得した)のデータセットを最初にリリースした。 " 違い。
その後、このデータセットを使用して RoBERTa モデルを微調整し、AI 検出器を取得しました。
RoBERTa (堅牢に最適化された BERT アプローチ) は、BERT の改良版です。オリジナルの BERT は 13 GB のデータセットを使用しましたが、RoBERTa は 6,300 万件の英語ニュース項目を含む 160 GB のデータセットを使用しました。
このうち、人間の音声は常に True として認識され、AI が生成したコンテンツは常に Fake として認識されます。
たとえば、これは Medium の英語ブログからコピーしたコンテンツです。認識結果から判断すると、作者が自分で書いたものであることは明らかです (手動犬頭):
△テキストソース Medium@Megan Ng
Ofもちろん、この検出装置も 100% 正確ではありません。
AI モデルのパラメータの数が増えるほど、生成されたコンテンツの識別は難しくなります。たとえば、1 億 2,400 万個のパラメータを持つモデルは、1.5 個のパラメータを持つモデルよりも「キャプチャ」される確率が高くなります。億のパラメータ。
同時に、モデル生成結果のランダム性が高くなるほど、AI によって生成されたコンテンツが検出される確率は低くなります。
しかし、最高のランダム性を生成するようにモデルが調整されたとしても (温度 = 1、0 に近づくほどランダム性が低くなります)、1 億 2,400 万のパラメーター モデルによって検出される確率は依然として 88% です。 15 億のパラメータ モデルが検出されます。検出の確率は依然として 74% です。
これは OpenAI が 2 年前にリリースしたモデルですが、当時 GPT-2 で生成されたコンテンツは「正確」でした。
ChatGPT のアップグレード バージョンに直面しても、英語で生成されたコンテンツを検出する効果は引き続き達成できます。
しかし、ChatGPT によって生成された中国語に関しては、その認識能力はそれほど優れていません。たとえば、ChatGPT に作文を書かせます:
##AI 検出器は、99.96% の確率で人間によって書かれたものであると判断します... もちろん、そうは言っても、ChatGPT は生成するテキストを検出することもできます。 したがって、教師が識別のためにあなたの宿題を ChatGPT に直接渡す可能性は排除されません:##One More Thing
Worthはい、ChatGPT はインターネットにアクセスして情報を検索することはできないと述べています。
明らかに、GPT-2 Output Detector AI 検出器の存在は認識されていません:
それでは、ネチズンが言ったように、ChatGPT は「AI 検出器によって検出されない」コンテンツを生成できるのでしょうか?
残念ながら、私にはできません:
だから、大きな宿題は自分で書いたほうがいいです。 .
[4]https://medium.com/user- experience-design-1/how- chatgpt-is-blowing-google-out-of-the-water-a-ux-breakdown-784340c25d57
以上がChatGPT「Nemesis」:AIを利用してAI生成テキストを認識、英語論文の読書メモも検出可能の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。