ホームページ > 記事 > テクノロジー周辺機器 > ChatGPTが医療サービスを実装できるようになるまで、どれくらいかかるでしょうか?ハーバード大学教授の個人テストの成績が医師の成績に近い、尹志生氏が業界版作成の可能性を暴露
この記事はAI New Media Qubit(公開アカウントID:QbitAI)の許可を得て転載していますので、転載については出典元にご連絡ください。
国内プレーヤーが ChatGPT に本格的に参入しており、さまざまな業界での成功は誰の目にも明らかです。
しかし、特に医療などの一部の困難で障壁の高い業界では、正確にいつ働き始めることができるのかはまだ明らかではありません。
今回、ハーバード大学医学部教授が ChatGPT のパフォーマンスを個人的にテストしました。
その結果、45 件中 39 件を正確に診断し、正解率 87% (従来機の診断率 51% を上回りました)、30 件に適切な診断を提供できました。トリアージの推奨事項が作成されました。
彼は、ChatGPT の診断支援のパフォーマンスは医師のそれに近いと述べました。この場合、いつから仕事を始めればよいのでしょうか?
実際、これは現在ほとんどの国内プレーヤーが直面している問題でもあります: ボーナスがここにあります。最初にどうやって受け取るか?
以前に、ChatGPT の中国語版を複製する背後にある技術的および環境上の困難を体系的に整理しましたが、明らかに、それは短期的には達成できません。
ここで、新しいアイデアが浮かび上がりました: ChatGPT の業界垂直バージョンを直接作成する。
このアプローチは実現可能ですか?
技術コアである ChatGPT の作成では、コンピューティング能力、データ、アルゴリズムの 3 つの要素を回避することはできません。
コンピューティング能力の点では、OpenAI は Microsoft に依存しています - Microsoft には 285,000 個の CPU コアと 10,000 個の Nvidia V100 GPU があり、GPT-3 をトレーニングするだけで 460 万米ドルもの費用がかかります。 データ、GPT シリーズは繰り返し最適化されており、かつて誰もを驚かせた GPT-3 には 1,750 億のパラメーターがありますが、GPT-2 の前のバージョンには 15 億のパラメーターしかありませんでした。アルゴリズム自然にも長年にわたる深い蓄積がなければ、「人間のような」自律学習特性を持ち、さらに複数の分野や複数のシナリオに迅速に適応する能力を発揮することはできません。
生態学的フィードバック技術と組み合わせることで、反復的な閉ループが形成されます。 OpenAIは、GPT-3以降、オープンインターフェースの形で独自の「GPTエコシステム」を構築してきました。 gpt3demo Web サイトの統計によると、現在 GPT-3 シリーズ モデルを使用して開発されたアプリケーションは 656 あります。
このような
技術的および環境的障壁により、ChatGPT を偽造するのはそれほど簡単ではありません。この場合、ChatGPT の垂直バージョンのソリューションも業界で議論され始めています。まず第一に、技術の観点から見ると、彼らの中心的な課題は、数百億などのより少ないパラメータを使用した垂直分野のタスクにおいて、ChatGPTの効果を達成または超えることです。パラメーター。
これは、ChatGPT を再現するよりも難しいかもしれません。パラメータの数がはるかに少なく、「暴力的な美学」だけに頼ることはできず、優れたモデル設計と圧縮スキルも必要となるためです。 もう 1 つの課題は、
データ ソースの違いです。
Google や Microsoft のように、実際には自然な一般的なデータ ソースを持っていますが、専門的なデータの蓄積は垂直プレーヤーとは比較できません。 特に医療などの生計産業は専門性が高く、多岐にわたるため、ChatGPT以上の高品質なデータが求められ、オンラインで取得できないデータがほとんどです。
しかし、長年この分野に深く根付いてきた垂直企業の場合、彼らはすでに独自の産業エコロジーを構築しており、豊富な業界データとこの知識の蓄積により、ChatGPT の再現に必要な基盤が築かれました。
そして、価値要件の観点から見ると、垂直産業が表す価値は本物です。例えば、医療そのものの需要は決して小さくありませんが、ChatGPTが医療に導入されれば、大きな社会的価値が生まれます。
これまで、ユーザーは自分の病気の診断に役立つ検索やアプリを習慣的に使用していましたが、結果は最小限であることがほとんどでした。 ハーバード大学医学部教授の Ateev Mehrotra 氏は、既存のオンライン診断の平均精度が 51% にすぎないのに対し、ChatGPT は 87% であることをかつてテストしました。そのため、ChatGPT は医療診断において変革をもたらす可能性があると信じています。 . .
ChatGPT アプリケーションの実装を加速するために、技術的な難易度と価値の需要の観点から ChatGPT の垂直バージョンを作成することが可能です。
現在、中国にはすでにこれを行っている AI プレーヤーがいます。
Yunzhisheng ChatGPT Industry Edition
最新の進歩の暴露、インテリジェント音声トラック ユニコーン Yunzhisheng は、ChatGPT Industry Edition の構築を推進しています——
医療ケアを医療として活用エントリーポイントとして、ChatGPTの医療業界版を構築すると同時に、ChatGPTの業界版をベースにしたプラットフォームを構築し、他の分野にも迅速に拡張し、ドメインモデルを利用してMoE(専門家混合)技術を統合し、研修を行う一般的な ChatGPT モデル。そして、このアイデアは特殊なものから一般的なものまであります。実際、これは尹志生氏の一貫した "U X" アプローチです。ここで、"U" は汎用大規模モデル アルゴリズム開発および効率的なトレーニング ベース プラットフォームを指し、"X" は複数の業界分野で使用される専用大規模モデル バージョンを指します。
実際、これは多くの企業が ChatGPT に参入するというアイデアになりつつあり、これにより既存の専用データを活用することができます。
しかし、Yunzhisheng が、生成されるコンテンツの品質に対する要求がより高い医療業界を参入点として選択したことは言うまでもなく、それほど簡単ではありません。
最も重要な問題は、医学知識の信頼性を向上させることです。 ChatGPT の得意分野は、くだらない話を真剣に話すことです。実際、現在ではチャット検索やコンテンツ制作を Bing 上に置くことは大きな問題ではなく、ユーザーはそれを楽しんでいます。
しかし、業界で適用される場合、専門家以外がそれを検出するのは困難な場合が多く、これがさまざまなリスクにつながる可能性があります。したがって、ChatGPT の業界バージョンは、特に医療、教育、産業など、非常に高いコンテンツ生成要件と低い耐障害性があり、さらに高いデータ品質要件が求められる業界において、あらゆるナンセンスに終止符を打つ必要があります。 。
2つ目は、業界における「費用対効果」の実現です。テクノロジーを大規模に導入するには、「限られたリソースでいかに効果を最大化するか」という問題を解決する必要があります。
これは、ChatGPT 業界で実装される唯一の方法でもあります - このモデルは、より小さいパラメーター スケールで ChatGPT と同じ効果を達成できます。これはまた、これらの企業に多くの問題をもたらします。
実際、Yunzhisheng 氏は、ChatGPT 業界バージョンのパラメータも数百億規模に達する必要がある可能性があり、効果的な結果を達成し、大規模なアプリケーションを実現するのは簡単ではないことも認めました。
ChatGPT の業界バージョンを作成することは、現在のユニバーサル ChatGPT よりもある程度困難ですが、ChatGPT 業界が実際に実装されるときには、これらの問題を解決する必要があります。要約すると、ChatGPT エンジニアリング機能を実現することです。
これは、ゲームに参加する誰もが避けることはできず、必ず通過する必要がある道です。
これを踏まえると、尹志生氏の選択がより困難であることは疑いの余地がありません。入り口としての医療です。この分野は業界の壁が高く、専門性が高く、技術的に難しい分野と考えられており、それが他の業界の隆盛に比べて医療AIのプレイヤーが非常に少ない理由でもあります。
しかし、ChatGPT の医療バージョンが公開されると、最終的な一般的な大規模モデルを含む他の分野の実装は、半分の労力で 2 倍の結果が得られます。
2012年に設立されたAI企業として、最先端のAI技術に注目し、2012年にはディープラーニングアルゴリズムの高度化と産業応用を行うなど、技術の産業応用を積極的に推進してきました。 2016 年の Atlas スーパーコンピューター。プラットフォーム、ナレッジ グラフ、フルスタック AI テクノロジー アプリケーションは、ChatGPT フレームワークに基づく AGI コグニティブ テクノロジーにアップグレードされました。
同時に、10年近く医療業界に深く関わり、業界の知識、データ、アプリケーションを蓄積しており、2019年には北京科学技術進歩賞の一等賞も受賞しています。 。
ChatGPT の業界版の作成に自信があるかどうかという質問に対して、Yunzhisheng 氏は次のように述べています: 我々は完全に自信を持っています。
要約すると、ChatGPT の構築には、高品質のデータ、最先端のアルゴリズム、十分なコンピューティング能力が不可欠です。 ChatGPT の垂直バージョンには、より高度なエンジニアリング能力も必要です。
これらの側面から見ると、Yunzhisheng はまさに業界の参考人です。
データの面では、過去 10 年間に Yunzhisheng は患者指向の指導、事前相談、患者教育、フォローアップ システムなどのあらゆる業界データを蓄積してきました。 、臨床指向の音声医療記録、医療記録の品質管理、単一疾患の品質管理、および医療リスク管理システムが約 400 の病院で導入されています。 データ規模は5Tに達したと言われており、医療業界における大規模な言語モデルのデータ基盤を提供しています。
アルゴリズムの観点から見ると、ChatGPT に代表される認知知能自体が Yunzhisheng の中核となる技術的利点です。彼らは国内最大級の医学知識グラフを構築しました。 2019 年から 2022 年にかけて、Yunzhisheng の認知知能テクノロジーは国内外の関連評価で 7 回の優勝と 5 回の準優勝を獲得しました。自社開発した医療事前トレーニング言語モデル CirBERTa は、かつて中国の医療情報処理課題リストのトップにありました。 計算能力
の観点から見ると、Yunzhishengスーパーコンピューティングプラットフォームの浮動小数点計算能力は毎秒80億回に達し、数千億回のモデルの計算能力を保証できます。パラメーター。大規模モデル エンジニアリングの観点から、Yunzhisheng は CirBERTa モデルを開発し、GPT-2 モデルを再現し、モデル圧縮と知識蒸留メカニズムを使用してオンラインでほぼ 100 倍の高速化を達成しました。推論の効率化は、大規模モデルの広範な適用の基礎を築きます。
さらに、ChatGPT の業界版として、コンテンツ品質保証も重要な部分です。
Yunzhisheng が提供するソリューションは、CirBERTa に適用されている継続学習および知識埋め込みテクノロジを使用して、既存のナレッジ グラフの蓄積に基づいて ChatGPT モデルのナレッジ取得および更新メカニズムを最適化することです。 報告によると、これにより、ChatGPT 回答の知識の正確性が保証され、同時に知識のトレーサビリティ情報も提供されます。
さらに、Yunzhisheng の業界をリードする医療記録品質管理技術を使用して、生成された医療記録の問題を自動的に発見し、ChatGPT のコア技術として人間のフィードバックに基づいて強化学習を自動的に生成できます。 ( RLHF、ヒューマン フィードバックからの強化学習)モデルの最適化を加速するために必要なユーザー フィードバック データ。
最後に、事件自体の話に戻りますが、業界に対する ChatGPT の価値に関するこれまでの議論はすべて、人間とコンピューターの相互作用、情報配信、コンテンツ制作など、マクロレベルの産業生態学とモデルの革新の観点からのものでした。 、など。
現在、ますます多くの垂直型企業が市場に参入するにつれて、企業にとっての ChatGPT の重要性も明らかになってきています。これは、新しい AGI テクノロジー パラダイムの選択肢です。 「大規模なユニバーサル基本モデル軽量産業に基づく」 「アプリケーションの最適化」業界の知識の統合と問題解決方法。
これまで、これらのシナリオのプレイヤーは、AI の探求に関して「山を山として見、山を山ではないと見る」という無知な状態にあった可能性があります。 、今は「小さな山があり、道があることがわかっています。」。
ChatGPT が実証した「インテリジェンス」は、彼らに明確な技術的方向性をもたらしました。
Yunzhisheng CEO Huang Wei も理解が深く、AlphaGo と比べても、ChatGPT の影響ははるかに深く、新たな 「産業革命」 に相当すると信じています。
この革命の最大の利点は、自己教師あり注意メカニズムを通じて、大量の教師なしデータを最大限に活用して一般的な基本モデルをトレーニングし、知覚、認識、生成を統一されたフレームワークで組み合わせて、次のことを達成できることです。 「エンドツーエンド」「生成された高品質の結果から直接機械インテリジェンスを提示するための統合。機械が採用する人工誘導データ駆動型学習手法は、人間の論理的思考モードとは全く異なり、航空機のジェット機の「空気力学」メカニズムに似ており、人間が採用する「翼の羽ばたき」手法とは全く異なります。鳥。
業界全体であれ、個々の企業であれ、ChatGPT がもたらす価値は、本当に追随できないほどのものです。
特に一部のシナリオのプレイヤーにとって、彼らは依然として ChatGPT ボーナスを使い果たしてしまう可能性が最も高いグループです。
彼らにはシナリオ、データ、そして業界の深い障壁があるため、一度 ChatGPT 機能を手に入れれば、業界で最初にそれを実装できるようになります。これは他のプレイヤーが達成できない先行者利益です。
AI の最後の波が押し寄せたとき、最初に AI ボーナスを利用したのはシーン プレーヤーでした。ただ、今では ChatGPT が技術的なパスを介して直接登場しており、当然のことながら実装速度は以前よりもはるかに速くなります。
Yunzhisheng CEO Huang Wei 氏も明確な時点を示しました:
成功したアプリケーション計画は年内に実施される予定です。
以上がChatGPTが医療サービスを実装できるようになるまで、どれくらいかかるでしょうか?ハーバード大学教授の個人テストの成績が医師の成績に近い、尹志生氏が業界版作成の可能性を暴露の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。