ホームページ >テクノロジー周辺機器 >AI >「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

王林
王林転載
2023-04-11 13:55:031886ブラウズ

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

多くの人の心の中で、ChatGPT は全能の「モンスター」です。

詩を書いたり、コードを書いたり、長い論文を直接生成したりすることもできます...さらに、ChatGPT は非常に感情的で表現力豊かでもあり、数ラウンドの会話だけで全員を征服できます。

しかし、ChatGPT は本当に全能なのでしょうか?

ChatGPT はチャット ロボットとして優れた言語理解力とテキスト処理機能を備えていますが、トレーニング モデルの都合上、ChatGPT は 絵対話をサポートしていません。想像してみてください。平日に友達とチャットするときに、写真を送信できなければ、当然楽しみの一部が失われます。

中国にはそのような AI 研究開発チームがあり、彼らが立ち上げた「元成祥Chatlmg」アプリケーションは、ChatGPT に追加するのと同じように、写真を正確に識別してユーザーとチャットできます。 「目」は、テキストを理解できるだけでなく、絵を完全に識別することもできます

数日前、Magike.com は Yuanchengxiang 研究開発チームから、「Yuanchengxiang Chatlmg」が最近立ち上げられたことを知りました。 WeChat 公開アカウント 「Yuanchengxiang」## をフォローしてください。 # 今すぐアプリケーションを試すことができます。 (注: コンピューティング能力の制限により、最初のアクセス方法は 招待ベース )

それでは、「Yuancheng Xiang Chatlmg」の使用感はどうですか、またその画像認識機能は本物かどうか魔法はどうですか?製品の発売前夜に、Magike.com は総合的な評価と要約を実施しました。

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

写真 | Yuan Cheng Xiang Chatlmg ロゴ

写真を見て話しますか?この ChatGPT アプリケーションは素晴らしいです。

「Yuancheng Xiang Chatlmg」と入力すると、アプリケーションのインターフェイスが非常にシンプルで明確であることがわかります。

- 下部のテキスト ダイアログ ボックスと対称のアバターレイアウト 、さまざまな要素が共通のチャット ソフトウェア インターフェイスに組み合わされています。 アプリケーションの左下隅に、目立つ「

画像のアップロード

」ボタンが表示されます。 現在、アプリケーションは写真をアップロードするための 3 つの方法、つまり

フォト ギャラリー、写真の撮影

、および ファイル インポート を一度に 1 つずつサポートしています。 女性の日と同時に、Meike.com も 2 つのアイテムを選択し、それらが適切かどうかを判断するために「Yuanchengxiang Chatlmg」に引き渡しました。そのうちの 1 つは、

検索エンジン ## からのものでした。 # からダウンロードした

口紅の写真 、もう 1 つは携帯電話で撮影した メモ帳の写真 です:

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

## 「Yuancheng Xiang Chatlmg」は 2 枚の写真の製品を正確に特定し、メモ帳のクマがかわいい、口紅が白い背景に置かれているなど、他の説明も拡張したことがわかります。背景 ちょっと待ってください。

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。同時に、この 2 つのアイテムが女の子へのプレゼントに適しているかどうかについても独自の判断を下し、受け取り手の好みに基づいてギフトが適しているかどうかについて合理的な提案も行っています。

「Yuan Cheng Xiang Chatlmg」から返信があった後、

別の質問をしました

:

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

そうですね、これらの提案は非常に適切であり、文脈を理解するロジックも一貫しています。

さらに、Meike.com は、「Yuan Cheng Xiang Chatlmg」を特定できるように、その他の写真もアップロードしました。

たとえば、これ:

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

そして、たとえば、これ:

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

そしてこれら:

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。

「Yuancheng Xiang Chatlmg」の認識能力は依然として非常に正確であることがわかり、表示内容をテキスト形式で説明します。画像の内容は です。

純粋なテキスト対話に基づく ChatGPT と比較すると、詩や記事を書くなどの基本的な対話に加えて、追加の「目」を備えた「Yuancheng Xiang Chatlmg」は明らかに、アイテムなどのいくつかの新しい機能を発見しました。認識はその重要な機能の 1 つです。

その後、データ量の継続的な拡大と製品の継続的な最適化により、Meike.com は「Yuancheng Xiang Chatlmg」がさらに優れたパフォーマンスをもたらすことを期待しています

数百億のパラメータを持つ大規模なモデルに恵まれ、今後もアップグレードされ続けます

本質的に、ChatGPT はチャット ロボット製品であり、テキストを生成する機能を提供します。 GPT-3大型モデルのヘルプ。 ChatGPT の威力はまさに GPT-3 によるものです。

OpenAI によって開発された自然言語処理モデルとしては、論点が多すぎます。 ChatGPT の発売のずっと前に、GPT-3 はすでに AI 分野で成功を収めていました。 モデルのパラメータ数は 1,750 億に達し、1 回のトレーニングに数万個の GPU が必要となり、コストは 460 万米ドル近くかかると報告されています。このようなクレイジーな「金を飲み込む能力」は、ChatGPT のようなクレイジーなアプリケーションを自然にサポートできます。

それでは、ChatGPT には何か欠点があるのでしょうか?答えは「はい」です!

元城翔研究開発チームによると、「元城翔Chatlmg」には自社開発の

数百億パラメータのマルチモーダル大規模モデル

が搭載されており、これは「目」を追加することに相当します。 ChatGPT を使用すると、より人間らしく会話できるようになります。 AI 分野におけるいわゆるマルチモダリティとは、人工知能が理解するのに役立つ、

画像、テキスト、音声

などの感覚情報のコラボレーションを指すことがよくあります。外の世界をより正確に。 「Yuancheng Xiang Chatlmg」が画像を理解できるのは、マルチモーダル大規模モデルのサポートによるものでもあります。

元城翔研究開発チームによると、現在の

元城翔 AI 大型モデル

パラメータのスケールは約 150 億で、データは現在主に 画像テキスト データと VQA データです待って。トレーニング プロセス中、モデルは、限られたコンピューティング能力で効率的なトレーニングを確保するために、学習可能なパラメーターをできるだけ少なく解放します。

モデルの 将来の開発方針 について尋ねられたとき、Yuanchengxiang の研究開発チームは Meike.com に対し、現在のインタラクティブなグラフィックスとテキストに加えて、大型モデルでは将来 画像も使用する予定であることを明らかにしました。 生成機能を組み合わせることで、応答時に自分で生成した画像を返信することができ、会話がより鮮やかになります。

さらに、このモードには、ビデオ、オーディオなどのさらに多くのモードが含まれており、デジタル ヒューマンやその他のテクノロジと組み合わせて開発することもできます。より鮮明な立体映像を実現します。

Yuanchengxiang の数百億のパラメータを備えたマルチモーダル モデルのサポートにより、チャットボットとの会話がより現実の人間に近くなり、将来 AI テクノロジーがもたらす驚きは、また、ますます。

中国AIメーカーが暴走中、国内のChatGPTはどこまで?

今月開催された第14回全国人民代表大会第一回会議の「大臣チャンネル」で、 科学技術部の王志剛大臣がChatGPTについて語り、賞賛した。それが AI と関連産業にもたらした進歩。

同時に、ChatGPTをきっかけとした様々な議論も、代表者や委員による2つのセッションに持ち込まれました。

実のところ、私の国が人工知能の開発を国家戦略に引き上げる前の 2017 年の時点で、AI はすでに全国 2 つのセッションに「頻繁に参加」していました。 ChatGPT が世界中で人気を集めている今、人々は改めて問い直さずにはいられません。中国の AI 産業はどのようにして ChatGPT のトレンドを掴むことができるのでしょうか?

新製品リリースの機会を利用して、Meike.com は、Yuanchengxiang の研究開発チームの責任者である Gao Yizhao

博士とこの問題について話し合いました。

彼の見解では、中国における大規模な AI モデルの構築には、真に革新的なテクノロジーを開発するために長期的なレイアウトと作業の継続が必要です。

ChatGPT の「歴史」を振り返ると、大規模な AI モデルの構築は容易ではなく、その背景には長期にわたる設備投資と計算能力技術の反復があったことがわかります。 、トレーニング データの最適化、コンピューティング エネルギー消費の削減、その他の側面も考慮する必要があります。 つまり、

ChatGPT のようなアプリケーションを作成したい場合、単純な「100 メートル走」では完了できず、忍耐強く「10,000 メートル走」を完了する必要があります。 ~メートル長距離レース』。そうして初めて、英雄たちが競い合う『決勝戦』に出場できる。

しかし、現在の開発状況から判断すると、国内メーカーの大型AIモデルはまだ研究開発段階にあり、「Yuancheng Xiang Chatlmg」のような応用レベルに到達できるチームはまだ非常に稀です。まず第一に、大規模な AI モデルの研究開発は一般に遅れて開始され、深刻な人材格差が存在します。第二に、中国語のコンテキストで大規模なモデルのトレーニングを行うのは英語よりも難しく、はるかに時間がかかります。

これらの問題の解決には「忍耐」が必要であったはずですが、AI投資ブームの最終波が冷めるにつれ、多くの企業が予算削減を余儀なくされ、最終的に関連AIビジネスの発展は限界に達しました。ボトルネック。

対照的に、Yuanchengxiang の研究開発チームは比較的順調に進んでいます。チームは、AI アプリケーションの分野で長期的な探求を行っている一方で、多面的な利点からも恩恵を受けています。モーダル事前トレーニング モデルにおける正しい判断と先見性、そしてチーム全体の粘り強さによって、ついに ChatGPT 時代の「

開花と結実 」が始まりました。

AI 企業の将来の探求について語る際、ガオ博士は次のように自身の意見も述べました。「

エコロジー構築の観点から、中国はオープンソースを推進できます。

''結論

昨年のリリース以来、ChatGPT は「驚異的な製品」から「テクノロジー」に進化しました。 Symbol」では、この競争でいわゆる「勝利」を勝ち取ろうと、国内の大手テクノロジーメーカーがChatGPT類似製品の投入を急いでいる。

時を同じくして、ChatGPTの人気により、国内のAI業界は再び新製品ブームを巻き起こしており、この時期に頭角を現したのが「Yuancheng Xiang Chatlmg」でした。

「Yuancheng Xiang Chatlmg」アプリケーションの評価から判断すると、そのエクスペリエンスはすでに非常にフレンドリーで、ChatGPT にはない「画像認識」機能も備えています。 もちろん、「Yuanchengxiang Chatlmg」の初期バージョンとして、細部にはまだいくつかの不備がありますが、Yuanchengxiang 研究開発チームの努力と粘り強さによって、国内の ChatGPT アプリケーションも驚くべきものになると信じています。これからの業界。

以上が「目」が付いたChatGPTアプリが登場! 150 億のパラメータを持つ大規模なマルチモーダル モデルによってサポートされており、画像の読み取りやチャットなど多用途に使用できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。