ホームページ  >  記事  >  テクノロジー周辺機器  >  人工知能の筆記検出ツールは信頼性が低く、米国憲法はロボットによって書かれたと考えられている

人工知能の筆記検出ツールは信頼性が低く、米国憲法はロボットによって書かれたと考えられている

王林
王林転載
2023-07-19 17:15:011178ブラウズ

人工知能の筆記検出ツールは信頼性が低く、米国憲法はロボットによって書かれたと考えられている

7 月 16 日のニュースで、一部のネチズンは最近、米国の最も重要な法的文書である合衆国憲法が、人工知能による書き込みを検出するために特別に設計されたいくつかのツールに入力されると、驚くべき結果: 米国憲法はほぼ確実に人工知能によって書かれました。ジェームズ・マディソンがタイムトラベラーでない限り、これは明らかに不可能です。では、なぜこれらの AI 検出ツールはこのような間違いを犯すのでしょうか?海外メディアArstechnicaは、その理由を明らかにするために複数の専門家とAI検出ツールGPTZeroの開発者にインタビューした。

教育の分野では、人工知能によるライティングが多くの論争を引き起こしています。教師は長い間、生徒の科目の習熟度を評価するツールとしてエッセイを使用する伝統的な教育方法を使用してきました。これまでの証拠によると、AI が生成した文章を検出するために AI ツールに依存している教師の多くは信頼できないことが判明しています。誤検知が存在するため、GPTZero、ZeroGPT、OpenAI のテキスト分類器などの AI 検出ツールは信頼性が低く、記事が大規模言語モデル (LLM) によって生成されたかどうかを判断するために使用できません。

米国憲法の一部が GPTZero に入力されると、GPTZero はその条項が「完全に AI によって書かれた可能性が高い」と述べています。過去 6 か月の間に、同様の結果を伴うスクリーンショットが他の AI 検出ツールを通じてソーシャル メディア上で広く拡散されました。実際、聖書から何かをインプットした場合にも同じことが起こります。これらのツールがなぜこのような明白な間違いを犯すのかを理解するには、まずそれらがどのように機能するかを理解する必要があります。

IT House によると、人工知能の書き込み検出器が異なれば、使用する検出方法も若干異なりますが、基本原理は似ています。つまり、人工知能モデルを通じて、大量のテキスト (数百万の書き込み例を含む) と文章が人間によって生成された可能性が高いか AI によって生成された可能性が高いかを判断するために使用される一連の仮説ルール。

たとえば、GPTZero の中心となるのは、「英語の散文に重点を置いた、人間の文章と AI が生成したテキストの大規模で多様なコーパス」でトレーニングされたニューラル ネットワークです。次に、 システムは「困惑」や「緊急性」などの属性を使用してテキストを評価し、分類します。

機械学習において、困惑度は、テキストと人工知能モデルがトレーニング中に学習した内容との間の偏差の尺度です。困惑度の測定の背後にある考え方は、AI モデルが書くときに、トレーニング データから最もよく知っているコンテンツを自然に選択するというものです。出力がトレーニング データに近づくほど、混乱は少なくなります。 人間はより混乱を招く書き手である 人間は、特に法律や特定の種類の学術文書で使用される形式的なスタイルを模倣する場合、混乱を少なく書くこともできます。そして、私たちが使うフレーズの多くは驚くほど一般的です。

例として、この文の次の単語を推測してみましょう:「私は _____ が欲しいです」。ほとんどの人は、空白を「水」、「コーヒー」、または「お茶」で埋めるでしょう。大量の英語テキストでトレーニングされた言語モデルでも同様のことが行われます。なぜなら、これらのフレーズは英語の文章に頻繁に現れるからです。以下に示すように。

#GPTZero が測定するテキストのもう 1 つの特性は「バースト」です。これは、特定の単語や語句がテキストの中で素早く連続して出現する、または「バースト」する現象です。本質的に、

緊急性は、テキスト全体にわたる文の長さと構造のばらつきを評価します。人間のライターは動的な書き方を示すことが多く、その結果、文の長さや構造が変化するテキストになりますが、人工的にインテリジェントに生成されたテキストはより一貫性がある傾向があります。統合されています。ただし、緊急事態は、AI が生成したコンテンツを検出する確実な指標ではありません。Perplexity と同様に、例外があります。人間のライターは、高度に構造化された一貫したスタイルで書く場合があり、バーストネス スコアが低くなります。逆に、AI モデルはトレーニングできます。文の長さや構造において、より人間らしい変動をシミュレートすることで、バーストネス スコアが向上します。実際、人工知能言語モデルの改良の登場により、人工知能の文章がますます人間の文章に似てきたことが研究で示されています。

以上が人工知能の筆記検出ツールは信頼性が低く、米国憲法はロボットによって書かれたと考えられているの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。