DetectGPT の目的は、テキストの一部が GPT-3 などの特定の llm によって生成されたかどうかを判断することです。段落 x を分類するために、DetectGPT はまず、共通の事前トレーニング済みモデル (T5 など) を使用して段落 ~xi に小さな摂動を生成します。次に、DetectGPT は、元のサンプル x の対数確率を各摂動サンプル ~xi と比較します。平均対数比率が高い場合、サンプルはソース モデルからのものである可能性があります。
ChatGPT はホットなトピックです。記事が大規模言語モデル (LLM) によって生成されたことを検出できるかどうかについては、現在も議論が行われています。 DetectGPT は、特定の LLM から生成するかどうかを判断するための新しい曲率ベースの基準を定義します。 DetectGPT では、別個の分類器をトレーニングしたり、実際のパッセージまたは生成されたパッセージのデータセットを収集したり、生成されたテキストに明示的に透かしを入れたりする必要はありません。対象のモデルによって計算された対数確率と、別の汎用の事前トレーニング済み言語モデル (T5 など) からの記事のランダム摂動のみを使用します。
1. DetectGPT: ランダムな順列と仮定
logp の負の位置にある機械生成チャネル x~pθ (左) を特定して利用します ( x) 近くのサンプルのモデル対数確率が平均して低い曲率領域の傾向。対照的に、人間が書いたテキスト x~preal(.) (右) は、有意な負の対数確率曲率を持つ領域を占有しない傾向があります。
DetectGPT は、ソース モデル pθ からのサンプルが通常、人間のテキストとは異なる pθ 対数確率関数の負の曲率領域にあるという仮定に基づいています。テキスト x~pθ に小さな摂動を適用して ~x を生成した場合、機械生成されたサンプルの数 log pθ(x) - log pθ(~x) は、人間が書いたテキストと比較して比較的多くなるはずです。この仮定を使用して、最初に摂動関数 q(.|x) を考えます。これは、同様の意味を持つ x のわずかに変更されたバージョンである ~x にわたる分布を与えます (通常、大まかな段落長のテキスト x を考えます)。たとえば、q(.|x) は、x の意味を保持しながら x の文の 1 つを書き直すよう人間に単純に依頼した結果である可能性があります。摂動関数の概念を使用すると、摂動差 d (x; pθ, q) を定義できます。
摂動マーカーがランダムに追加される場合、対数確率は常に減少すると予想されるため、セマンティック空間でのサンプリングにより、すべてのサンプルがデータ多様体の近くに留まることが保証されます。したがって、目標はデータ多様体の曲率をほぼ制限するものとして解釈できます。
4. 結果の表示
ゼロサンプルの機械生成テキスト検出
各実験では、評価に 150 ~ 500 のサンプルが使用されます。機械生成テキストは、実際のテキストの最初の 30 トークンを要求することによって生成されます。 AUROC) を使用してパフォーマンスを評価します。
DetectGPT は、XSum ストーリー (AUROC が 0.1 増加) と SQuAD Wikipedia コンテキスト (AUROC が 0.05 増加) の平均検出精度を最大化していることがわかります。
15 のデータセットとモデルの組み合わせのうち 14 について、DetectGPT は最も正確な検出パフォーマンスを提供し、AUROC の平均改善率は 0.06 です。
教師付き検出器との比較
# 実際のテキストと生成されたテキストの大規模なデータセットでトレーニングされた教師付き機械生成テキスト検出モデルは、分布内のテキストに対するパフォーマンスです。 (上の行) は DetectGPT と同等か、それ以上です。ゼロショット手法は、WMT16 の PubMed 医療テキストやドイツのニュース データなどの新しいドメイン (下段) に適用されます。
各データセットからの 200 サンプルで評価すると、教師あり検出器は、英語ニュースなどの配信データでは DetectGPT と同様のパフォーマンスを発揮しますが、英語の科学論文の場合、そのパフォーマンスはゼロ サンプル アプローチよりも大幅に劣ります。これはドイツ語の文章では完全に失敗します。
DetectGPT の GPT-3 の平均 AUROC は、機械生成テキスト検出用に特別にトレーニングされた教師ありモデルに匹敵します。
150 の例が PubMedQA、XSum、およびwritingprompt データ セットから抽出されました。 2 つの事前トレーニングされたロバータベースの検出器モデルが、DetectGPT および確率的しきい値ベースラインと比較されます。 DetectGPT は、より強力な教師ありモデルと競合する検出を提供できます。
機械生成テキスト検出のバリエーション
この部分では、検出器が人間が編集した機械生成テキストを検出できるかどうかを確認します。手動改訂は、テキストの r% が置き換えられるまで、テキストの 5 つのワード スパンを T5 ~ 3B のサンプルで置き換えることによってシミュレートされました。 DetectGPT は、モデル サンプル内のテキストの 4 分の 1 近くが置き換えられているにもかかわらず、検出 AUROC を 0.8 以上に維持します。 DetectGPT は、すべてのリビジョン レベルにわたって最も強力な検出パフォーマンスを示します。
以上がDetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Apollo Researchの新しいレポートによると、高度なAIシステムの未確認の内部展開は、重大なリスクをもたらします。 主要なAI企業の間で一般的なこの監視の欠如は、Uncontに及ぶ潜在的な壊滅的な結果を可能にします

従来の嘘検出器は時代遅れです。リストバンドで接続されたポインターに依存すると、被験者のバイタルサインと身体的反応を印刷する嘘発見器は、嘘を識別するのに正確ではありません。これが、嘘の検出結果が通常裁判所で採用されない理由ですが、多くの罪のない人々が投獄されています。 対照的に、人工知能は強力なデータエンジンであり、その実用的な原則はすべての側面を観察することです。これは、科学者がさまざまな方法で真実を求めるアプリケーションに人工知能を適用できることを意味します。 1つのアプローチは、嘘発見器のように尋問されている人の重要な符号応答を分析することですが、より詳細かつ正確な比較分析を行います。 別のアプローチは、言語マークアップを使用して、人々が実際に言うことを分析し、論理と推論を使用することです。 ことわざにあるように、ある嘘は別の嘘を繁殖させ、最終的に

イノベーションの先駆者である航空宇宙産業は、AIを活用して、最も複雑な課題に取り組んでいます。 近代的な航空の複雑さの増加は、AIの自動化とリアルタイムのインテリジェンス機能を必要とします。

ロボット工学の急速な発展により、私たちは魅力的なケーススタディをもたらしました。 NoetixのN2ロボットの重量は40ポンドを超えており、高さは3フィートで、逆流できると言われています。 UnitreeのG1ロボットの重量は、N2のサイズの約2倍で、高さは約4フィートです。また、競争に参加している多くの小さなヒューマノイドロボットがあり、ファンによって前進するロボットさえあります。 データ解釈 ハーフマラソンは12,000人以上の観客を惹きつけましたが、21人のヒューマノイドロボットのみが参加しました。政府は、参加しているロボットが競争前に「集中トレーニング」を実施したと指摘したが、すべてのロボットが競争全体を完了したわけではない。 チャンピオン - 北京ヒューマノイドロボットイノベーションセンターによって開発されたティアンゴニ

人工知能は、現在の形式では、真にインテリジェントではありません。既存のデータを模倣して洗練するのに熟達しています。 私たちは人工知能を作成するのではなく、人工的な推論を作成しています。情報を処理するマシン、人間は

レポートでは、更新されたインターフェイスがGoogle Photos Androidバージョン7.26のコードに隠されていることがわかり、写真を見るたびに、新しく検出された顔のサムネイルの行が画面の下部に表示されます。 新しいフェイシャルサムネイルには名前タグが欠落しているため、検出された各人に関する詳細情報を見るには、個別にクリックする必要があると思います。今のところ、この機能は、Googleフォトが画像で見つけた人々以外の情報を提供しません。 この機能はまだ利用できないため、Googleが正確にどのように使用するかはわかりません。 Googleはサムネイルを使用して、選択した人のより多くの写真を見つけるためにスピードアップしたり、編集して個人を選択するなど、他の目的に使用することもできます。待って見てみましょう。 今のところ

補強能力は、人間のフィードバックに基づいて調整するためにモデルを教えることにより、AI開発を揺さぶりました。それは、監督された学習基盤と報酬ベースの更新をブレンドして、より安全で、より正確に、そして本当に助けます

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク(C. elegansのものと同様)を広く研究してきました。 ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

Dreamweaver Mac版
ビジュアル Web 開発ツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









