検索
ホームページテクノロジー周辺機器AIDetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

DetectGPT の目的は、テキストの一部が GPT-3 などの特定の llm によって生成されたかどうかを判断することです。段落 x を分類するために、DetectGPT はまず、共通の事前トレーニング済みモデル (T5 など) を使用して段落 ~xi に小さな摂動を生成します。次に、DetectGPT は、元のサンプル x の対数確率を各摂動サンプル ~xi と比較します。平均対数比率が高い場合、サンプルはソース モデルからのものである可能性があります。

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

ChatGPT はホットなトピックです。記事が大規模言語モデル (LLM) によって生成されたことを検出できるかどうかについては、現在も議論が行われています。 DetectGPT は、特定の LLM から生成するかどうかを判断するための新しい曲率ベースの基準を定義します。 DetectGPT では、別個の分類器をトレーニングしたり、実際のパッセージまたは生成されたパッセージのデータセットを収集したり、生成されたテキストに明示的に透かしを入れたりする必要はありません。対象のモデルによって計算された対数確率と、別の汎用の事前トレーニング済み言語モデル (T5 など) からの記事のランダム摂動のみを使用します。

1. DetectGPT: ランダムな順列と仮定

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

logp の負の位置にある機械生成チャネル x~pθ (左) を特定して利用します ( x) 近くのサンプルのモデル対数確率が平均して低い曲率領域の傾向。対照的に、人間が書いたテキスト x~preal(.) (右) は、有意な負の対数確率曲率を持つ領域を占有しない傾向があります。

DetectGPT は、ソース モデル pθ からのサンプルが通常、人間のテキストとは異なる pθ 対数確率関数の負の曲率領域にあるという仮定に基づいています。テキスト x~pθ に小さな摂動を適用して ~x​​ を生成した場合、機械生成されたサンプルの数 log pθ(x) - log pθ(~x) は、人間が書いたテキストと比較して比較的多くなるはずです。この仮定を使用して、最初に摂動関数 q(.|x) を考えます。これは、同様の意味を持つ x のわずかに変更されたバージョンである ~x にわたる分布を与えます (通常、大まかな段落長のテキスト x を考えます)。たとえば、q(.|x) は、x の意味を保持しながら x の文の 1 つを書き直すよう人間に単純に依頼した結果である可能性があります。摂動関数の概念を使用すると、摂動差 d (x; pθ, q) を定義できます。

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

## したがって、次の仮定 4.1 は次のようになります。

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

q(.|x) が人間による書き換えではなく、マスク充填モデル (T5 など) からのサンプルである場合、仮定4.1 は、実証的テストに対する自動化されたスケーラブルなアプローチとして表現できます。

2. DetectGPT: 自動テスト

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

記事を書き換えた後、モデルによって生成された記事の対数確率 (摂動差の平均減少率) は、人間が書いた記事よりも常に高くなります。

実際のデータの場合、XSum データセットからの 500 件のニュース記事が使用されました。 XSum の各記事の最初の 30 トークンの入力を求められた場合、4 つの異なる llms の出力を使用します。摂動は T5-3B を使用して適用され、記事内の単語の 15% がマスクされるまでランダムにサンプリングされた 2 単語の範囲をマスクします。上記の式 (1) の期待値は、T5 の 100 サンプルで近似されます。

上記の実験結果は、人間が書いた記事とモデル サンプルの間で摂動差の分布に大きな違いがあることを示しています。モデル サンプルには大きな摂動差があることがよくあります。これらの結果に基づいて、摂動の差を単純に閾値処理することによって、テキスト片がモデル p によって生成されたかどうかを検出することが可能です。

E~x q(.|x) log p (~x) の推定に使用される観測値の標準偏差によって摂動の差を正規化すると、検出が向上し、通常は AUROC が約 0.020 増加します。実験では摂動差の値が使用されました。

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

DetectGPT 検出プロセスの擬似コード

摂動の差は役に立つかもしれませんが、何を測定するのか明確に説明できないため、著者は次のセクションで曲率を使用して説明します。 。

3. 摂動の差を曲率として解釈する

摂動の差は、候補通路付近の対数確率関数の局所的な曲率の尺度を近似します。より具体的には、次のヘシアンと一致します。対数確率関数行列の負のトレースは比例します。

このセクションは内容が非常に多いため、ここでは詳しく説明しませんが、興味があれば原論文を読んでください。概要は次のとおりです。

摂動マーカーがランダムに追加される場合、対数確率は常に減少すると予想されるため、セマンティック空間でのサンプリングにより、すべてのサンプルがデータ多様体の近くに留まることが保証されます。したがって、目標はデータ多様体の曲率をほぼ制限するものとして解釈できます。

4. 結果の表示

ゼロサンプルの機械生成テキスト検出

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

各実験では、評価に 150 ~ 500 のサンプルが使用されます。機械生成テキストは、実際のテキストの最初の 30 トークンを要求することによって生成されます。 AUROC) を使用してパフォーマンスを評価します。

DetectGPT は、XSum ストーリー (AUROC が 0.1 増加) と SQuAD Wikipedia コンテキスト (AUROC が 0.05 増加) の平均検出精度を最大化していることがわかります。

15 のデータセットとモデルの組み合わせのうち 14 について、DetectGPT は最も正確な検出パフォーマンスを提供し、AUROC の平均改善率は 0.06 です。

教師付き検出器との比較

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

# 実際のテキストと生成されたテキストの大規模なデータセットでトレーニングされた教師付き機械生成テキスト検出モデルは、分布内のテキストに対するパフォーマンスです。 (上の行) は DetectGPT と同等か、それ以上です。ゼロショット手法は、WMT16 の PubMed 医療テキストやドイツのニュース データなどの新しいドメイン (下段) に適用されます。

各データセットからの 200 サンプルで評価すると、教師あり検出器は、英語ニュースなどの配信データでは DetectGPT と同様のパフォーマンスを発揮しますが、英語の科学論文の場合、そのパフォーマンスはゼロ サンプル アプローチよりも大幅に劣ります。これはドイツ語の文章では完全に失敗します。

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

DetectGPT の GPT-3 の平均 AUROC は、機械生成テキスト検出用に特別にトレーニングされた教師ありモデルに匹敵します。

150 の例が PubMedQA、XSum、およびwritingprompt データ セットから抽出されました。 2 つの事前トレーニングされたロバータベースの検出器モデルが、DetectGPT および確率的しきい値ベースラインと比較されます。 DetectGPT は、より強力な教師ありモデルと競合する検出を提供できます。

機械生成テキスト検出のバリエーション

DetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出

この部分では、検出器が人間が編集した機械生成テキストを検出できるかどうかを確認します。手動改訂は、テキストの r% が置き換えられるまで、テキストの 5 つのワード スパンを T5 ~ 3B のサンプルで置き換えることによってシミュレートされました。 DetectGPT は、モデル サンプル内のテキストの 4 分の 1 近くが置き換えられているにもかかわらず、検出 AUROC を 0.8 以上に維持します。 DetectGPT は、すべてのリビジョン レベルにわたって最も強力な検出パフォーマンスを示します。

以上がDetectGPT: 確率的曲率を使用したゼロショット機械生成テキスト検出の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
使用PyTorch进行小样本学习的图像分类使用PyTorch进行小样本学习的图像分类Apr 09, 2023 am 10:51 AM

近年来,基于深度学习的模型在目标检测和图像识别等任务中表现出色。像ImageNet这样具有挑战性的图像分类数据集,包含1000种不同的对象分类,现在一些模型已经超过了人类水平上。但是这些模型依赖于监督训练流程,标记训练数据的可用性对它们有重大影响,并且模型能够检测到的类别也仅限于它们接受训练的类。由于在训练过程中没有足够的标记图像用于所有类,这些模型在现实环境中可能不太有用。并且我们希望的模型能够识别它在训练期间没有见到过的类,因为几乎不可能在所有潜在对象的图像上进行训练。我们将从几个样本中学习

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架Jul 25, 2024 am 06:42 AM

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

在自定义数据集上实现OpenAI CLIP在自定义数据集上实现OpenAI CLIPSep 14, 2023 am 11:57 AM

在2021年1月,OpenAI宣布了两个新模型:DALL-E和CLIP。这两个模型都是多模态模型,以某种方式连接文本和图像。CLIP的全称是对比语言-图像预训练(ContrastiveLanguage-ImagePre-training),它是一种基于对比文本-图像对的预训练方法。为什么要介绍CLIP呢?因为目前火热的StableDiffusion并不是单一模型,而是由多个模型组成。其中一个关键组成部分是文本编码器,用于对用户的文本输入进行编码,而这个文本编码器就是CLIP模型中的文本编码器CL

如何正确拆分数据集?常见的三种方法总结如何正确拆分数据集?常见的三种方法总结Apr 08, 2023 pm 06:51 PM

将数据集分解为训练集,可以帮助我们了解模型,这对于模型如何推广到新的看不见数据非常重要。 如果模型过度拟合可能无法很好地概括新的看不见的数据。因此也无法做出良好的预测。拥有适当的验证策略是成功创建良好预测,使用AI模型的业务价值的第一步,本文中就整理出一些常见的数据拆分策略。简单的训练、测试拆分将数据集分为训练和验证2个部分,并以80%的训练和20%的验证。 可以使用Scikit的随机采样来执行此操作。首先需要固定随机种子,否则无法比较获得相同的数据拆分,在调试时无法获得结果的复现。 如果数据集

利用核模型高斯过程(KMGPs)进行数据建模利用核模型高斯过程(KMGPs)进行数据建模Jan 30, 2024 am 11:15 AM

核模型高斯过程(KMGPs)是一种复杂的工具,用于处理各种数据集的复杂性。它通过核函数扩展了传统高斯过程的概念。本文将详细讨论KMGPs的理论基础、实际应用和面临的挑战。核模型高斯过程是对传统高斯过程的一种扩展,用于机器学习和统计学。了解kmgp前,需掌握高斯过程基础知识,再理解核模型的作用。高斯过程(GPs)高斯过程是随机变量集合,有限个变量联合高斯分布,用于定义函数概率分布。高斯过程在机器学习中常用于回归和分类任务,可用于拟合数据的概率分布。高斯过程的一个重要特征是能够提供不确定性估计和预测

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTAFeb 26, 2024 am 09:58 AM

AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。最近,来自谷歌团队的研究人员提出了一种通用视频编码器——VideoPrism。它能够通过单一冻结模型,处理各种视频理解任务。图片论文地址:https://arxiv.org/pdf/2402.13217.pdf比如,VideoPrism能够将下面视频中吹蜡烛的人分类、定位出来。图片视频-文本检索,根据文本内容,可以检索出视频中相应的内容。图片再比如,描述下面视频——一个小女孩正在玩积木。还可以进行QA问答。

模块化MoE将成为视觉多任务学习基础模型模块化MoE将成为视觉多任务学习基础模型Apr 13, 2023 pm 12:40 PM

多任务学习(MTL)存在很多挑战,因为不同任务之间的梯度可能矛盾。为了利用任务之间的关联,作者引入了 Mod-Squad 模型,它是多个专家组成的模块化模型。模型可以灵活优化任务和专家的匹配,针对任务选择部分专家。模型让每一个专家只对应部分任务,每一个任务只对应部分专家,以此最大化利用任务之间的正向联系。Mod-Squad 整合了 Mixture of Expert (MoE) 层到 Vision Transformer 模型中,并引入了新的损失函数鼓励专家和任务之间的稀疏但强烈的依赖关系。此外

PyTorch 并行训练 DistributedDataParallel 完整代码示例PyTorch 并行训练 DistributedDataParallel 完整代码示例Apr 10, 2023 pm 08:51 PM

使用大型数据集训练大型深度神经网络 (DNN) 的问题是深度学习领域的主要挑战。 随着 DNN 和数据集规模的增加,训练这些模型的计算和内存需求也会增加。 这使得在计算资源有限的单台机器上训练这些模型变得困难甚至不可能。 使用大型数据集训练大型 DNN 的一些主要挑战包括:训练时间长:训练过程可能需要数周甚至数月才能完成,具体取决于模型的复杂性和数据集的大小。内存限制:大型 DNN 可能需要大量内存来存储训练期间的所有模型参数、梯度和中间激活。 这可能会导致内存不足错误并限制可在单台机器上训练的

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。