ホームページ >テクノロジー周辺機器 >AI >たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

王林
王林転載
2023-04-12 21:10:01926ブラウズ

ChatGPT のリリース以来、ニューラル ネットワークの作成やスマート スピーカーの作成など、その機能は人々によって継続的に利用されてきました。試用中に、人々は数学的能力が ChatGPT の大きな欠点であり、単純な「同じ檻の中のニワトリとウサギ」の問題でさえも間違って計算される可能性があることに徐々に気づきました。

おそらくこれを念頭に置いて、ChatGPT は「信頼性」と「数学的能力」の向上という重要なアップデートを発表しました。

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

ChatGPT は昨年 11 月のリリース以来、これで 3 回目のアップデートになりますが、「アップデート手順」が曖昧すぎるため、依然として新しい機能を探索するプロセス。

数日前、コンピュータ科学者であり、Wolfram言語の父であるStephen Wolframは、科学および工学の成果物であるWolfram|AlphaとChatGPTを組み合わせ、後者にスーパーコンピューティングの知識を注入しました。相互に補完し合い、その効果は非常に優れています。

では、このアップデート後の ChatGPT の数学的能力はそれに匹敵するでしょうか?

どうやら... 比較結果は満足のいくものではありません:

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

「のみニューラルネットワークはこれには使用されていないと言えます。」 セバスティアン・ラシュカさんは無力感を感じました。

#アップグレードされた ChatGPT が「ますます不機嫌になってきた」と感じた人もいます:

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

#「あなたに数学を教えたのはどの先生ですか?」 10 以内の足し算と引き算についての質問に直面した彼の口調は、子供の宿題を手伝う親のようなものでした。

#もしかしたらこれは「偶然の現象」なのでしょうか?数学は本当に難しいようです。

いずれにせよ、今後の興味深いデモの波に期待できます。

ボリュームたっぷり: ChatGPT とその競合他社

「企業が OpenAI の API を使用できるようになれば、今後 6 ~ 12 か月で爆発的な実験が行われるでしょう。」 ChatGPT の登場するキラー ユース ケースは、知識管理に対する生成 AI の影響に関するものである可能性があります。」

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

Nicola Moeni Bianzino。

最近の公開イベントで、アーンスト・アンド・ヤング社のグローバル最高技術責任者であるニコラ・モリーニ・ビアンジーノ氏は、企業内でChatGPTを使用するための「キラー」ユースケースは現時点では存在しないと述べた。 。しかし、それはすぐに変わる可能性があり、特に企業が OpenAI の API を使用して ChatGPT を構築できるようになると、今後 6 ~ 12 か月で多くの実験が行われることになると彼は予測しています。

Bianzino 氏は、ナレッジ マネジメントに対する生成 AI の影響を「AI の弁証法」と表現しています。 「ナレッジ企業はナレッジを非常にフラットな二次元の方法で保存する傾向があるため、アクセス、対話、会話が困難になります。私たちは 20 年、30 年、40 年前にエキスパート システムを構築しようとしました。あまりうまくいきませんでした。このテクノロジーにはエキスパート システムの問題の多くを克服できる可能性があると思います」と Nicola Moeni Bianzino 氏は述べています。

同時に、ChatGPT の競合他社も出現しており、トラックはますます「ボリューム」になってきています。 Anthropic の Claude、DeepMind の Sparrow、Google の LaMDA から Character AI まで、毎日新しい競合他社がこの分野に参入しているようです。

Anthropic は、OpenAI を退職した数人の研究者によって 2021 年に設立されたサンフランシスコのスタートアップです。設立から1年も経たないうちに、同社は5億8000万ドルという巨額の資金調達を発表し、金曜日にはさらに3億ドルが調達されようとしていると報じられた。

同社は、「Claude」と呼ばれる AI チャットボットを開発しました。これは現在、Slack 統合を介してクローズド ベータ版で利用可能で、ChatGPT に似ていると報告されており、いくつかの改良点も加えられています。 Anthropic は、その使命を「信頼性があり、説明可能で、制御可能な AI システムの構築に取り組む」と説明しています。

DeepMind もこのトラックでは無視できない勢力です。同社は9月に論文で「Sparrow」を紹介し、「より安全で偏りの少ない機械学習システムの構築に向けた重要な一歩」として歓迎された。 Sparrow は「安全でない不適切な回答のリスクを軽減する便利な会話エージェント」であり、「ユーザーと会話し、質問に答え、証拠を見つけるのに役立つ」ように設計されています。

しかし、DeepMind のセキュリティ研究者で Sparrow 論文の筆頭著者である Geoffrey Irving 氏は、DeepMind は Sparrow を研究に基づいた概念実証モデルであると考えていると述べました。まだ展開の準備ができていません。

2週間前のTimeの記事で、同社のCEO兼共同創設者デミス・ハサビス氏は、DeepMindが2023年中にそのテクノロジーをリリースすることを検討していると述べた。チャットボットSparrowの「プライベートベータ版」。これにより、企業は出典の引用などの強化学習ベースの機能を開発できるようになります。この機能は ChatGPT にはありません。

Google の LaMDA について話しましょう。このモデルは昨年の夏に激しい議論を巻き起こしました。Google エンジニアの Blake Lemoine は、LaMDA に知覚力があると主張したために解雇されました。 Lemoine 氏が信じているほどではないにせよ、LaMDA は依然として ChatGPT の最大の競争相手の 1 つとみなされています。 Googleは2021年のブログ投稿で、LaMDAの会話スキルは「何年もかけて開発された」と述べた。 ChatGPT と同様に、LaMDA は Transformer アーキテクチャに基づいて構築されており、会話についてもトレーニングされています。 #Google によると、「トレーニング中に、LaMDA はオープンな会話を他の形式の言語と区別する微妙な違いのいくつかを発見しました。」

#ニューヨーク・タイムズは1月20日の報道で、グーグル創設者のラリー・ペイジ氏とサーゲイ・ブリン氏が先月同社幹部らと会談し、Googleの1490億ドルのビジネスに対する脅威をChatGPTが捜査する可能性について話し合ったと述べた。 Googleの広報担当者は声明で「当社は今後も社内でAI技術の有用性と安全性を確認するテストを続けており、近いうちにさらに多くの体験を外部と共有できることを楽しみにしている」と述べた。 # #もう 1 つの強力なプレーヤーは、

Character AI

です。この会社は、Transformer 論文の著者の 1 人

Noam Shazeer は

を設立し、徐々に有名になりました。 同社の AI チャットボット テクノロジーを使用すると、ユーザーは誰とでもチャットしたり、エリザベス女王やシェイクスピアなどの歴史上の人物を真似てロールプレイをしたりすることができます。このテクノロジーは現在無料で使用でき、Character は「特定の収益創出計画を策定する前に、ユーザーがこのテクノロジーとどのように対話するかを研究中です。」 Baidu が ChatGPT に似たチャットボットをリリースするという噂があります 国内の AI 実務家からさらに注目を集めているのは、ロイター、ブルームバーグ、その他の海外メディアの報道によると、百度が OpenAI の ChatGPT に似た人工知能チャットボット サービスを 3 月に開始する予定であるということです。

情報筋によると、百度はユーザーが検索リクエストを行った際に、単なるリンクではなく、チャットボットが生成した結果を統合する計画だという。 「このツールはまだ名前が決まっていませんが、メインの検索サービスに埋め込まれ、会話形式の検索結果をユーザーに返します。」

昨年 12 月の社内ディスカッションで、Baidu CEO の Robin Li 氏は ChatGPT について次のように述べました。「このような優れたテクノロジーを、誰もが必要とする製品に変えるのが最も難しいのです。Baidu が新たな製品を開発することを願っています。」少なくとも来年には、私たちの予想を真に超えた、高成長で革新的なビジネスを実現できるでしょう。」

Science and Technology Innovation Board Daily の 1 月 30 日のレポートによると、Baidu は ChatGPT に類似したチャットボットを開始する社内計画を持っていますが、具体的な時期は正確ではありません。 Baidu CEO の Robin Li 氏は、このプロジェクトを「検索体験における世代間の変化を導く」ものと位置づけています。同氏は関連技術が臨界点に達しており、百度にはその分野で大きなチャンスがあると社内で指摘した。

検出ツール: 大規模な言語モデルによって生成されたテキストを隠す場所がないようにします

ChatGPT は強力な機能を備えていますが、学校の課題などの分野でも悪用されています。および紙の出版は、広範な懸念を引き起こしています。そのため、学術コミュニティは、ChatGPT などの大規模言語モデル (LLM) によって生成されたテキストを検出するための方法とツールの探索を開始しました。

メリーランド大学の数人の研究者は、ChatGPT などの言語モデルによって出力されるウォーターマークを研究しました。 「大規模言語モデルのためのウォーターマーク」という論文で、彼らは効率的なウォーターマーク フレームワークを提案しました。ウォーターマークの埋め込みはテキストの品質にほとんど影響を与えず、API や言語モデルのパラメーターにアクセスすることなく、効率的なオープンソース アルゴリズムを使用して検出できます。

私たちの方法は、比較的短い合成テキスト (わずか 25 トークン) を検出できますが、人間のテキストが機械生成としてラベル付けされることは統計的に不可能です。

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

論文アドレス: https://arxiv.org/pdf/2301.10226v1.pdf

スタンフォード大学論文「DetectGPT: 確率曲率を使用したゼロショット機械生成テキスト検出」では、数人の研究者が、LLM テキストからのサンプリングがテキストの領域を占める傾向があることを証明しました。モデルの対数確率関数の負の曲率領域。この観察を利用して、彼らは、パッセージが特定の LLM によって生成されたかどうかを判断するための、曲率に基づく新しい基準を定義しました。

研究者らはメソッドを DetectGPT と呼んでいます。このメソッドは、別個の分類器をトレーニングしたり、実際のパッセージまたは生成されたパッセージのデータセットを収集したり、生成されたテキストに明示的に透かしを入れたりする必要がありません。 DetectGPT は、対象のモデルと別の事前トレーニング済みの汎用言語モデル (T5 など) によって計算された対数確率のみを使用して、パッセージのランダムな摂動を生成します。

結果は、DetectGPT が現在のモデル サンプル検出のゼロサンプル法よりも識別力が高いこと、特に 20B パラメーター GPT-NeoX によって生成されたフェイク ニュース レポートの検出が高いことを示しています。最も強い ゼロサンプルベースラインの 0.81 AUROC は 0.95 AUROC に改善されました。コードとデータは今後公開される予定です。

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

#DetectGPT GPT-3 で生成されたテキストの検出の図。

論文アドレス: https://arxiv.org/abs/2301.11305

論文の形で提示された検出ソリューションに加えて、強力な検出ツールを立ち上げた個人もいます。

たとえば、ChatGPT 検出器に取り組んでいる Hive AI の ML エンジニアは、ChatGPT、GPT-3、およびその他の一般的な AI エンジンによって生成されたテキストを認識できるソリューションを持っています。 ###。 #内部ベンチマーク テストの結果から判断すると、 このソリューションは、GPTZero や OpenAI GPT2 Output Detector などの同様の方法よりも大幅に優れています

。社内データセットでは、モデル バランスの精度は >99% ですが、GPTZero の精度は約 60%、OpenAI GPT2 Output Detector の精度は 84% です。

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。

#デモ アドレス: https://hivemoderation.com/ai-generated-content-detection

#最後に、#GPTZero も更新されました - GPTZe#roX、教育者向けに特別に作成された新しい AI 検出モデル。このモデルは、AI が生成したテキストと人間のテキストを組み合わせて処理し、AI によって生成された可能性が最も高いテキストの部分を強調表示できます。 PDF、Word、.txt 形式のファイルのバッチ アップロードを処理するパイプラインも構築され、複数のファイルを簡単に実行できます。

たった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。デモ アドレス: https://gptzero.substack.com/p/gptzerox

つまり、AI によって生成されたテキスト検出ツールがますます充実して完璧になるにつれて、ChatGPT などの大規模な言語モデルは、そのアプリケーションでますます形式的なものになり、人々が AI の力をより効率的に解き放つのに役立つことになるでしょう。

以上がたった今、ChatGPT の数学的能力が再びアップグレードされたと公式に発表しました ネットユーザー:私はついに足し算と引き算が 10 以内で習熟しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。