ホームページ  >  記事  >  テクノロジー周辺機器  >  機械を擬人化して「人工精神遅滞」から「人工知能」へ

機械を擬人化して「人工精神遅滞」から「人工知能」へ

王林
王林転載
2023-06-03 11:34:451130ブラウズ

5 月 27 日、アントレプレナーシップ ダークホースは 「2023 Leap•Dark Horse AIGC Summit」 を北京で開催しました。このカンファレンスのテーマは「新しい世界を予見し、新しいパターンを構築する」です。ジャスティン・カッセル氏は、カーネギーメロン大学コンピューターサイエンス学部の元副学部長で「AI専門家」として知られ、ダボスの世界経済フォーラム(WEF)コンピューティング・グローバル・フューチャー・カウンシルの元会長、そしてZhiyuan Researchの360グループの元会長でもある。同研究所には、Kunlun Wanwei、Yunzhisheng、BlueFocus、Wondershare Technology、Zhizhichuangyu など、業界の多くの企業の上級幹部が出席し、数千人の参加者と綿密な意見交換を行いました。

サミットでは、Yunzhisheng の創設者兼 CEO である Huang Wei が 「インテリジェントな未来への道」 テーマを共有しました。

以下は共有コンテンツです:

最初は、専門家が行うように、いくつかの方法論をマシンに引き継ぎたいと考えていましたが、10 年前、マシンはエラーのフィードバックから学習し始めました。これらは、過去の人工知能テクノロジーの一般的な段階と道筋です。

今日、OpenAI は ChatGPT と事前トレーニング モデルを開始し、インテリジェンス全体がより擬人化されました。まず、非常に強力なコンピューティング能力を使用して世界中の既知のテキストをすべて読み取り、大規模なモデルを形成するようにトレーニングしました。特に赤ちゃんの脳に似ており、数百億、数千億のパラメータを持つ場合があり、人間の脳とは異なり、赤ちゃんはせいぜい両親の外見と性格しか受け継がれませんが、大型模型の脳は知識を引き継ぎ、これはあくまで初期状態であり、その後、微調整などのさまざまな手法を経て、成長の過程でさまざまな教育を受ける子どものように、大きなモデル全体がより擬人化的に進化していきます。

これは人工知能全体の変化です。

今日の AGI と以前の AGI の本質的な変化は何ですか? 2022 年 12 月までは、人工知能全体は依然として識別型人工知能であり、判断の質問、特別なシステム、および特定のタスクを実行するためのインテリジェント モジュールを実行します。一方で、人工知能の性能はそこまで賢くなく、「提供するのは人工知能だ」と周囲から批判されることも多く、かつては人工知能の能力の上限が低かったのです。

第二に、多くのシナリオでは、顧客のニーズは大きく異なりますが、人工知能の機能はそれほど強力ではなく、多くの企業やチームがニーズを満たすためにさまざまなカスタマイズを使用しています。人工知能企業はハイテク企業のようなものではなく、過去 10 年間、手作業によるワークショップが行われていた時代にしか、識別型 AI を実現できませんでした。しかし今では、大規模なモデルとより強力な一般的な機能が登場し、人工知能は産業時代に入り始めています。

新世代および創発機能により、1 つのモデルで多くのシナリオでさまざまな問題を解決できます。今の時代、人工知能の大きなモデルは発電機ですが、エンジンが発明される前は中東諸国はそれほど裕福ではなく、石油の価値もそれほど高くありませんでした。現在と同様に、データを燃料や機能に変えることができ、この機能を使用して何千もの業界に力を与えることができます。

Yunzhisheng はなぜ短期間で大規模な自社開発モデルを立ち上げることができたのでしょうか?

2016 年に AlphaGo を目にしたとき、私たちは北京連合医科大学病院の医師を支援し、業務効率を大幅に向上させるために病院に医療製品を導入しました。病院のシナリオでは、効率化ツールだけでは十分ではありません。人工知能の本当の知能は認知知能です。Transformer は 2017 年に提案されました。認知知能には比較的強力なコンピューティング能力が必要です。

これらの基盤をもとに、私たちは学術面と工学面の両方で多くの経験を蓄積してきました。個人にとって、この経験は生計を立てるための能力ですが、企業にとっては市場で勝つための中核的な競争力となります。 ChatGPT フレームワークを調べたところ、どれも新しいものではなく、すべて既存のエンジニアリングの組み合わせであることがわかりました。私たちはすぐにこの機能を組み合わせて、大規模モデルの開発に投資しました。

機械を擬人化して「人工精神遅滞」から「人工知能」へ

3日前、私たちはShanhaiという大規模なビジネスモデルをリリースしました。事前トレーニング、指導の微調整、人間のフィードバックに基づく強化学習を実行した後、待望の新機能が見えてきました。当時、チーム内で名前を付けようと考えていたんですが、私もよく旅行に行っていたので、この名前がいいなと思いました。海は雄大で、その包容力は大型モデルの無限の生成能力を反映しており、山は高い山であり、何が言えるのか、何ができないのかを知っています。これはまさに、大型モデルの生成能力と大きなモデルの両方を強調するためです-スケール モデル: モデルのセキュリティ コンプライアンス問題。

非常に興味深い現象があります。誰もが大型モデルについて話しています。国内では春節以降に大型モデルが注目され始めましたが、誰も話題にせず、確信が持てません。これはテクノロジーだけでできるものではないという考え方が今までありまして、人材が揃っても研修コストが非常に高く、非常にお金がかかります。大規模モデルは科学革命や新しいアルゴリズムの発明ではなく、既存のアルゴリズムを組み合わせてより大きくしたもので、そのほとんどにはコストがかかり、当然多くのプロジェクトが関係しています。要点は正しいです。

逆に、大型モデルは今後10~20年で大きなチャンスだと思っていて、BATが投資できないから諦めているのであれば、まだチャンスはあると思います。

過去数年間、雲之勝には特に優秀な科学者は必要ありませんでした。この問題は科学者のやるべきことではないとさえ思います。科学者はそれほど多くの計算能力を使用していないため、現場がどこにあるのか知りません。ですから、結果は必然です。悪くなる。シナリオを持っているメーカーが成功する可能性が最も高くなります。

山海という名前にはもう一つ意味があり、愛する人は山と海に隔てられており、山と海は平らにされることができます。

山と海の力、それが十種競技です。生成能力は非常に主観的であり、言語理解能力はシーンを実装する際に非常に重要ですが、なぜ私が過去に人工知能だと思ったかというと、理解力とコーディング能力が不足していたからです。コーディング能力の向上は、大規模モデルの推論能力の向上に役立ちますが、出力結果は国内の法律、規制、さらには道徳的価値観に準拠する必要があります。また、GPT-4 プラグイン アーキテクチャを使用して、データ選択、モデル トレーニング、モデル展開までのワンストップ サービスで企業や顧客を支援します。

なぜ大規模なモデルには複雑な論理的推論機能があるのでしょうか?今日はそれを実行しましたが、理由はわかりません。500 億のパラメータと 1,000 億のパラメータのどちらが優れているのかを言うのは難しいです。おそらく、1,000 億のパラメータのニューロンがまだ活性化されていないのかもしれません。

それに加えて、医療もあります。当初、私たちは大規模なモデルを開発していました。多くの人は、Yunzhisheng が垂直型インダストリー モデルを開発していると思っていました。いいえ、私たちは業界アプリケーションを開発していました。私たちは最も深刻なシナリオの 1 つである医療に挑戦し、事前トレーニングの段階で多くの医学文献、専門書、書籍、医療記録を収集し、変換可能な実際のラベル付きデータを何千万件も蓄積しました。微調整データに取り込みます。

さらに、私たちは2019年北京科学技術進歩賞の一等賞も受賞しました. 受賞プロジェクトは大規模なナレッジグラフ構築の主要な技術と応用です. 私たちは中国で最大の医療ナレッジグラフの1つを持っています.中国: ナレッジ グラフをナレッジに分解します プラグインは大規模な言語モデルに埋め込まれ、大規模なモデルを医療分野の専門家に変えます。

MedQA は、Google の Med-PaLM、ChatGPT、GPT-4 を含む、非常に権威のある医療知識の質問と回答のテスト セットです。これらはすべて、このテスト セットの評価結果を公開しています。Shanhai は、評価で 81 のスコアを獲得しました。これは GPT-4 の 71 ポイントを大幅に上回ります。ドメインの強化後、大規模なモデルを特定の分野の専門家に変えることができます。水平比較に使用できるもう 1 つの数値があります. 医学部卒業生が臨床医試験に合格するための既知の最高 AI スコアは 456 点ですが、山海大学のスコアは約 511 点であり、これはドメイン強化によって大規模モデルが獲得した超能力です。 。

大きなモデルを構築するのはまだまだ大変です。敷居が非常に高いです。多額の資金、優秀なアルゴリズムエンジニア、アルゴリズムに加えて、多くの能力が必要です。それを山の力とまとめます。そして海。直感的に言えば、大規模モデル自体が大規模なデータセットであり、大規模モデルはエンジニアの仕事です。なぜ Yunzhisheng は数か月で非常に信頼できる客観的な評価データを作成できるのでしょうか? 私たちの内部評価は、医学的な観点からのみではなく、一般的な分野では、Yunzhisheng が最高の 1 つです。

コンピューティング パワー プラットフォームは、接続するカードの数を購入するだけではありません。Yunzhisheng のコンピューティング パワーはほぼ 200P です。クラスターの使用効率は業界のトップ レベルに達しています。比較的少ないカードで迅速にトレーニングできます。私たちのモデル。

当社の現在の GPU クラスター使用率は 50% に達する可能性があります。大規模モデルには複数のカードが必要です。現在の業界レベルは約 42% です。大規模なモデルでは、3D ハイブリッド並列トレーニングを実現する必要もあります。 3Dとは何ですか?モデルの並列化、データの並列化、パイプラインの並列化を意味しており、それぞれのタスクを多数の異なるマシンの異なるカードに分割して計算し、最終的に応答結果を迅速に取得する必要があります。また、モデル推論では多くの最適化が行われ、推論速度が 5 倍に向上しました。トレーニング カードと推論カードをどのように分離するのですか? トレーニング カードは A800 で、推論カードは 800 で高速な推論を実現できます。シングルカードA6000。

さらに、データは非常に重要です。データ サイズ、データの多様性、データの高品質です。10T レベルの高速重複排除をサポートできるようになりました。ChatGPT のトレーニング数は 45T でしたが、最適化後は数百 G のデータが得られました。トレーニングしに来てください。

これらの機能により、Atlas と UniDataOps の機能を利用して、山海の業界顧客により良いサービスを提供できるようになります。

スマート モノのインターネットも会社の重要なビジネスです。私たちは多くの実装を行っています。過去に使用された結果は確かにあまり良くありませんでした。山海が設立された後は、大規模なモデルを使用して既存のすべてを構築できることを願っていますモノのインターネット製品。

医療は私たちが楽観的に考えている方向です。 これまで、医療分野では、この製品には主に 2 つの側面がありました。1 つは、手でキーボードを入力する代わりに、マイクで直接話すことができるため、医師の作業効率が大幅に向上し、時間が短縮されました3時間から1時間の医療記録の入力; 2番目に、医療記録を取得した後、AI脳を通じて医療記録をレビューし、医療記録に誤りがないかチェックするシステムもあります。 AI は大規模なモデル機能を備えていますか?

Shanhai のビジョンは、人工知能を通じて相互接続された直感的な世界を創造することです。以前は、人工知能の定義は、機械を人間に従わせることでした。現在、私たちは機械がより擬人化されることを望んでいます。人とモノのコミュニケーションがより直感的になり、新たな機能によって新たな製品や新たなビジネスモデルが生まれ、大型モデルの新時代を皆様とともに迎えたいと思っています。

QR コードをスキャンして Dark Horse Entrepreneur Exchange Group に参加してください

↓↓↓

下の QR コードをスキャンしてください

ダークホース AIGC インダストリアル キャンプに参加しよう

AIGC の基礎となるロジックを理解し、ワンステップで業界の未来につながります

↓↓↓

共有、いいね、視聴の 3 クリックのコンボを完了して、優れたコンテンツを必要とするより多くの人に届けます。

さらにエキサイティングなコンテンツをすべてダークホース ビデオ アカウントで提供します

↓↓↓

ダークホース コミュニケーション マトリックスに従って、よりエキサイティングなコンテンツを入手しましょう

#↓↓ ↓

以上が機械を擬人化して「人工精神遅滞」から「人工知能」への詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。