ホームページ > 記事 > テクノロジー周辺機器 > 中国初の注目を集めるAIGCサミットは盛大なイベントでした。 21 人の専門家のスピーチを凝縮した、GPT-4 時代についての数千語の辛口情報
Zhixixi は 3 月 24 日、本日、GTIC 2023 中国 AIGC イノベーション サミットが北京で成功裡に開催されたと報告しました。
GPT-4 時代が始まる中、「AI が新時代の新世界を創造する」をテーマとするこのサミットは、生成 AI (AIGC) に焦点を当てた中国初の注目度の高いイノベーション イベントです。このサミットには、20 名を超える産業界、学界、研究のリーダーが集まり、激しい技術的な対立と意見の衝突を繰り広げ、霧の中で前進するすべての産業界の関係者が虚偽を排除し、真実を求める旅を完遂できるよう支援しました。
過去 2 か月間、あまりにも多くの疑問が私たちの脳裏に押し寄せました。GPT-4 は本当に認知知能の爆発的な増加をもたらすのでしょうか?私たちの AI と ChatGPT の違いは何ですか?中国版OpenAIは誕生するのか?大手メーカーがよく口にするMaaS(Model as a Service)は確実なトレンドとなるのでしょうか?中国AIGC産業は「大工場勝者総取り」か「百花繚乱」か…今回のサミットでは多くの疑問が解消されたが、その答えの多くは私たちの直感とは異なり、専門家の意見も完全に一致していない。このため、これらの議論は非常に価値のあるものになります。
大手メーカーの大型モデル製品の対立からAI投資トップ意見の衝突まで、AIGCの先駆的な製品トライアルからコンピューティング大手企業の「暴力的な美学」PKまで、「巨大企業」の議論からモデル vs 小型モデル」から「「ChatGPT はなぜ中国で最初に登場しなかったのですか?」という魂の疑問...次から次へとクライマックスが訪れ、サミットは満席で非常に人気があり、コミュニケーションの雰囲気は活気に満ちていました。会議には 1 日を通して 1,000 人以上が参加し、ネットワーク全体でのライブブロードキャストの数は 420 万件にも達しました。
Zhiyi Technologyの共同創設者兼CEOであるGong Lunchang氏は、サミットで主催者を代表して、AI業界は新たな市場機会の時代を迎えていると述べた。 、中国 AIGC イノベーション サミットは、業界、産業界、投資コミュニティに学術的なコミュニケーション プラットフォームを提供したいと考えています。このサミットには主に、AIGC サミット フォーラムのメイン フォーラムと、大型モデル、中国のような ChatGPT、AIGC アプリケーション イノベーションの 3 つのテーマ フォーラムが含まれます。
会議には、中国科学院などの学術機関、Microsoft、Baidu、Kuaishou、NVIDIA、Kunlun Wanwei、SenseTime、Lanzhou Technology、Moxin Artificial Intelligence、UBTECHなどの業界大手の代表者が出席しました。 Zhipu AI、Luchen Technology、Yunzhisheng、Zhujian Intelligence、aiXcoder、Movie Book Technology、Computational Aesthetics (Nolibox) およびその他の起業家精神にあふれた先駆者、および Qiming Venture Capital、Creation Partners Capital、Lanchi Venture Capital などの投資機関からのゲスト代表者., 共有 最先端のイノベーション、ビジネスの展望、コンピューティング能力の進化、起業の機会、大規模モデルと生成 AI の投資戦略をカバーしています。
以下は、今日の AIGC サミットでのスピーチの要旨です。
Gong Lunchang、Zhiyi Technology 共同創設者兼 CEOが主催者を代表して今回のサミットに向けてスピーチを行った。事前トレーニング済み言語モデルや拡散モデルなどの主要なアルゴリズムとモデルの出現と進化により、生成 AI の急速な開発が促進され、関連製品は非常に短期間に世界的な注目を集めました。
▲Zhiyi Technology 共同創設者兼 CEO、Gong Lunchang氏
先週は、AI の急速な発展にとって重要な時期でした。 GPT-4 と Wen Xinyiyan のリリースにより、Microsoft は GPT をオフィス ファミリ バケットに統合し、生産ツールの飛躍的な進歩を推進しました。 AI 業界は、新たな市場機会の時代を迎えています。
これに基づいて、中国 AIGC イノベーション サミットは、学界、産業界、投資界のためのコミュニケーション プラットフォームを構築し、誰もが深い交流を持ち、アイデアを刺激し、協力の実施を促進したいと考えています。革新。
Zhiyi Technologyは今年で設立7年目になります。 Zhiyi Technologyはテクノロジーと産業の両輪駆動を堅持し、デジタル化とインテリジェンスに代表される最先端テクノロジーとその産業応用に焦点を当て、産業メディアとエンタープライズサービスの2大ビジネスシステムを構築しています。
Zhiyi Technology は、Zhishi Dongxi、Core Dongxi、Car Dongxi に代表される産業メディア マトリックスを保有しており、中国において独自のポジショニングを持ち、高い影響力と信頼性を誇る産業メディアとなっています。産業のアップグレードを目指して、東熙志を開発しました。オープンコースを核としたエンタープライズサービスシステムを核として、世界中の優れた産業企業や一流大学の専門家や学者と協力して、一連の講演や新しい青少年向けの講義を開催し、国内外の一流企業がカスタマイズしたオープンコースを企画し、これまでに600以上のコースを修了し、高い評価を得ています。
午前のサミットでは、蘭州科技の創設者兼CEO兼副所長が登壇中国コンピュータ連盟CCFのChang Zhouming氏は、大型モデルがもたらす新しいパラダイムについて説明し、中国科学院オートメーション研究所の研究者で博士指導者のZhang Jiajun氏は、Zidong Taichu大型モデルがその謎をどのように理解しているかを説明した。世界の。
同時に、Microsoft オムニチャネル部門の最高技術責任者である Xu Mingqiang 氏は、AIGC のトレンドと企業における Microsoft Azure OpenAI サービスの適用について全員を率いて、Baidu グループの副社長である Yuan Foyu 氏は、 Wen Xinyiyan を立ち上げたばかりの彼は、Wen Xinyiyan がクラウド コンピューティング市場のゲームのルールをどのように変えたかについて議論するために現場に来ました。
1. Lanzhou Technology の Zhou Ming: 大規模モデルは 9 つの主要な側面に焦点を当てた認知知能の台頭をもたらします
Lanzhou Technology の創設者兼 CEO、Computer Federation中国のCCF副会長でSinovation Venturesの主任研究員である周明氏は、大型モデルがもたらす新たなパラダイムについて詳しく説明した。
▲周明氏、蘭州科技創始者兼CEO、中国コンピュータ連盟CCF副会長、イノベーションワークス主任科学者
技術者としてマイクロソフト出身の専門家、周明氏は、マイクロソフトの共同創設者ビル・ゲイツに深い影響を受けており、大規模なモデルが認知知能の台頭をもたらしていると信じていると語った。大規模モデル、特に ChatGPT は、言語理解、複数ラウンドの対話、問題解決の実用的な時代を象徴すると同時に、NLP タスクの断片化の問題を効果的に解決し、研究開発効率を大幅に向上させ、NLP の産業分野への参入を示しています。実装段階。
現在、AIは2.0時代を経て、単一タスクに特化したモデルから、幅広いタスクに対応する汎用モデル、そして汎用人工知能のAGI時代へと移りつつあります。 AI 2.0時代は、まずクリエイティブコンテンツ、オフィスメソッド、検索エンジン、ヒューマンコンピュータインタラクションインターフェース、金融などの分野を革新します。
2021 年 6 月に設立された Lanzhou Technology は、多数の大型モデル外部製品サービスを開始しており、現在、Mencius 大型モデル、AIGC (Intelligent Creation) プラットフォーム、機械翻訳プラットフォーム、財務 NLP プラットフォームなどを導入しています。このテクノロジーと製品は、Flush、China Asset Management、その他の企業によって導入されています。 ChatGPT のようなテクノロジーと組み合わせて、Lanzhou Technology は会話ロボット MChat を発売しました。これは、ユーザーがインテリジェントな対話を通じて特定のシナリオでさまざまなタスクを完了できるように支援します。
業界の将来の方向性について話し、Zhou Ming 氏は、現在の ChatGPT のようなテクノロジーには推論、論理、数学と算術、そして事実誤認がまだ欠けていることを認めました。今後、大型モデルに関連する9つの主要な問題は、推論能力、事実の正しさ、中国語の処理能力などの側面に特に注目に値します。
2. Microsoft Xu Mingqiang: OpenAI と協力してスーパーコンピューターを構築
モデル パラメーターは指数関数的な増加傾向を示しています。現在、大型モデルに対する疑念は、わずか 1 ~ 2 年以内に新たな疑念に取って代わられるでしょう。したがって、Microsoft オムニチャネル部門の最高技術責任者である Xu Mingqiang 氏は、現在の高品質コーパスの 1/10 しか使用されていないため、このモデルは今後も急速に成長すると確信しています。
▲Microsoft オムニチャネル部門最高技術責任者 Xu Mingqiang 氏
これらすべては、強力なコンピューティング能力のサポートと切り離すことができません。すべて トレーニングできるモデルのサイズとパラメータ。そこで、Microsoft Azure は OpenAI と協力して、大規模な AI トレーニング用に設計された、285,000 個の CPU と 10,000 個の GPU を備えた AI スーパーコンピューターを構築しました。
徐明強氏は、大規模な言語モデルをスポンジにたとえました。ウィキペディア、医学論文、科学論文は水であり、これらの論文を詰め込むことで、その機能が発現します。
ついにエンタープライズ アプリケーションに落ち着きました。CPU 時代、企業がアプリケーションの際に考えていた問題は、ビジネス上の問題をコンピューティング上の問題にどう変換するか、つまりコンパイラを通じてアプリケーションをコンピューティング上の問題に変換することでしたが、今はどうやってアプリケーションをコンピューティング上の問題に変換するかという問題に変わりました。さまざまな業界がコンピューティングの問題に変わり、ビジネスの問題がコンテンツ処理の問題に変わります。
エンタープライズ レベルの ChatGPT アプリケーション シナリオには、顧客サービス、販売市場、コンテンツ生成、ナレッジ管理、意思決定支援などが含まれます。
3. 中国科学院の張家軍氏: 「紫東台中」の秘密を明らかに、マルチモーダルな大型モデルが「多専門化、多機能」に現れ始めている
会議では、中国科学院オートメーション研究の研究者兼博士指導者であり、武漢人工知能研究所の副所長である張家軍氏が、「自東台中」大型モデルが技術的な問題をどのように理解しているかを説明した。世界の謎。
▲Zhang Jiajun、中国科学院オートメーション研究所研究員兼博士指導者、武漢人工知能研究所副所長
Zhang Jiajun 氏は、ディープラーニングの事前トレーニングについて話しました。大規模モデルの効果は向上し続けています。現在、自己教師あり学習条件下での「ビッグデータとビッグモデル」手法を通じて、マルチモーダル大規模モデルが「多専門化かつ多機能」になり始めており、小規模サンプル学習、自然言語質問が急速に進歩しています。応答、およびクロスモーダル生成。大型モデルはイノベーションの波を押し上げてきましたが、エネルギー消費量とコストが非常に高く、認知能力も依然として人間に遠く及ばないのが現状です。
「Zidong Taichu」は、中国科学院オートメーション研究所のチームが立ち上げた、1,000億個のパラメーターを備えた世界初のマルチモーダル大型モデルです。 Zhang Jiajun氏は、「このモデルはトークンレベル、モダリティレベル、サンプルレベルでマルチタスクの自己教師あり学習をサポートしている。マルチモーダルの弱く関連したデータは128日間512枚のカードでトレーニングされ、モーダル理解とモーダル生成の統一モデリングを実現する」と述べた。 。 「Zidong Taichu」は、テキスト付きの画像の検索、画像を使用してサウンドを生成する、サウンドを使用して画像を生成するなど、クロスモーダルな検索と生成例をサポートしています。たとえば、実際の画像を入力すると、Zidong Taichu はパーソナライズされた 3D を生成できます。画像。
現在、チームはZidong Taichu Open Service Platform 1.0とZidong Taichu Luoshen 1.0 AIGCインテリジェント生成プラットフォームを立ち上げ、産学界および研究からのリソースを統合して、人工知能オープンソースのオープンエコシステムを構築し、一般的な人工知能を探索しています。インテリジェンス産業化の道。
4, Baidu Yuan Foyu: Wen Xin の言葉はクラウド コンピューティング市場のルールを変えるでしょう。100,000 社以上の企業がこの呼びかけに応募しています。
世界の AI 業界は、 AI は爆発的な時代に突入し、まったく新しい世界を創造しています。 2021 年、Baidu の CEO、Robin Li 氏はかつてこう述べました。「コンピュータが人間の自然言語を理解する能力、明確な表現能力、優れた論理的推論能力を備えていれば、それは人間に非常によく似たものになります。そして、記憶力とコンピューティング能力は、人間よりもはるかに優れた機械の方が優れています。したがって、AI は今日、あらゆる業界に間違いなく革命を起こすでしょう。」
▲百度グループ副社長、ユアン・フォユ氏
Baidu New Generation Big 言語モデルと生成 AI 製品 Wenxin Yiyan の背後にある重要な技術サポートは、自然言語理解です。
Baidu Groupの副社長であるYuan Foyu氏は、「世界の主要メーカーの中で、Baiduが最初にリリースした。MicrosoftはOpen AIに直接電話をかけ、Googleは3月21日にテストを開始した。Metaも、Googleもテストを開始した」と強調した。 Amazon は本当に同じ種類とレベルの製品をリリースしています。」
Wen Xin Yiyan には、文学創作、ビジネスコピーライティング作成、数理論理学計算、中国語理解、マルチモーダル生成、および能力という 5 つのコアコンピテンシーがあります。 「三体問題」と「紅楼夢」の執筆を継続できること、ライブブロードキャスト用のコピーを生成すること、数学の問題の間違いを指摘し、解決プロセスを提供すること、中国語を理解する高い能力、複数の画像、音声、ビデオを生成することBaidu が独自に開発した大規模言語モデルに基づくモーダル生成機能。
Yuan Foyu氏は、Wenxin Yiyanのパフォーマンスから判断すると、Wenxin Yiyanには人間の意図を理解する能力があり、その回答の正確さ、論理性、流暢さは徐々に人間のレベルに近づいていると述べました。
温信宜燕氏の記者会見から1週間後、10万社以上の企業が文信宜燕氏のAPI呼び出しサービステストに応募した。
人工知能の時代では、IT テクノロジー スタックは、アプリケーション層、モデル層、フレームワーク層、チップ層の 4 層アーキテクチャになります。 Yuan Foyu 氏は次のように述べています。「世界的に見て、これら 4 つのレイヤーで主要な製品を提供しているのは、Baidu だけです。」
さらに、大規模モデルの開発により、3 つの新しいクラウド コンピューティング、業界モデルの微調整、アプリケーション開発がもたらされます。 . 業界に大きなチャンス。
アプリケーションを上向きにたどっていくと、Kuaishou MMU NLP センターおよびオーディオ センターの責任者である Zhang Fuzheng 氏は、Kuaishou での AIGC テクノロジーの探求と応用について語り、コンピューティング パワーを下向きに探求する Wang Wei 氏は、 Moxin Artificial Intelligence は、快寿での AIGC テクノロジーの探求と応用について語り、AIGC 時代にコンピューティング能力がどのように「進化」したかを追跡し、さらに、Qiming Venture Partners のパートナーである Zhou Zhifeng が、新しい波における起業家の機会と投資戦略について説明しました。投資の観点から見た AI。
1. Kuaishou Zhang Fuzheng: AIGC アプリケーション、デジタル ピープル、オーディオとビデオが複数の場所で開花する様子を探ります
実践は真の知識をもたらします。会議では、Kuaishou MMU 自然言語処理センターおよびオーディオ センターの所長である Zhang Fuzheng 氏が、AI がデジタル人物、音楽、ビデオを生成する最新の事例をデモンストレーションすることで、Kuaishou の AIGC における探求と応用を共有しました。
##▲ Kuaishou MMU 自然言語処理センターおよびオーディオ センター所長 Zhang Fuzheng Zhang Fuzheng 氏は、まずワークフローの観点から AIGC についての理解を語りました。 「クリエイターは表現したいアイデアを入力し、AI テクノロジーを使用してコンテンツを合成し、ワークフローの開始点として出力します。Kuaishou は、プラットフォーム エンジン、インフラストラクチャ、AI アトミック機能、AIGC ソリューション、およびランディング シナリオを通じて AIGC をレイアウトしました。」 。 デジタルヒューマンシナリオでは、テキストを入力するだけで、正確な口の形と豊かな表情・動作を備えたデジタルヒューマンアプリケーションを5分以内に生成でき、eコマース、人材採用、アンカー、トレーニングなどに活用できます。およびその他のシナリオ。 スマートミュージックの観点では、指定された話題の単語やその他の情報のユーザー入力に基づいて、ユーザーはその話題の単語に韻を踏み、関連する歌詞や特定のメロディーを生成できます。AI シンガーなどのアプリケーションもそれに近いものです。本物の人の歌のレベル。 映像制作においても、AIGC テクノロジーはクリエイターにとって大きな助けとなります。たとえば、Kuaishou の「ワンクリック ムービー」ビデオ作成の平均消費量は 4 億 5,000 万本を超え、コピーライトによるムービーの 1 日あたりの平均消費量は 4,000 万本を超えています。2. Moxin Artificial Intelligence の Wang Wei: スパース コンピューティングは大規模モデル実装の最適なソリューションとなり、Moxin は AI 2.0 コンピューティング パワーの進化をリードします
オンデマンドサイド、デジタル 文明の発展は根本的な変化を遂げました。生成 AI は、爆発的に成功するアプリケーションの構築への扉を開き、AI 2.0 ラージ モデル時代のコンピューティング パワーの需要は完全に覆されました。コンピューティング能力の多様性に重点を置いた小規模モデルの AI 1.0 時代と比較して、大規模な事前トレーニング モデルは構造が統一されており、スケーラビリティに重点が置かれています。計算能力と推論速度の向上が、大規模モデルの開発と適用における課題となっています。 Moxin Artificial Intelligence の創設者兼 CEO の Wang Wei 氏は次のように述べています。「ハードウェアだけでコンピューティング能力の指数関数的な増加に対応することは困難です。ソフトウェアとハードウェアを統合する必要があります。この方向では、スパース コンピューティングが認識されています」最も有望な開発と実装の方向性として。」 デンス コンピューティングと比較して、スパース コンピューティングは 1 ~ 2 桁のパフォーマンス向上を達成できます。 ▲Moxin Artificial Intelligence 創設者兼 CEO、Wang Wei 氏2021 年の初め、Moxin の最初の高スパース レート AI コンピューティング チップ Antoum はテープでした。成功に続いて、Moxin は、さまざまな AI アプリケーション シナリオをサポートする Antoum ベースの AI コンピューティング カード シリーズ S4、S10、および S30 をリリースしました。 Moxin 独自のデュアル スパース アルゴリズムとソフトウェアとハードウェアのコラボレーションの概念に基づいて、Moxin の製品は高性能と低消費電力の両方を実現でき、デュアル スパース アルゴリズムは多くのネットワークやアプリケーションで最大 32 倍のスパース性を実現できます。 176B オープンソース大型モデル BLOOM での実測によると、Ink Core S30 コンピューティング カードは、中低スパーシティ レートのみを使用した場合に 25 トークン/秒の生成速度を達成でき、4 つの S30 生成速度を生成します。 8 A100を超え、推論速度が大幅に高速化します。Wang Wei 氏は次のように述べています。「大規模モデルの急速な開発により、AI チップの新興企業は巨大企業に挑戦する機会が得られ、破壊的イノベーションを利用して桁違いのパフォーマンスのブレークスルーをもたらす新しいディスプレイ段階がもたらされました。」
3、Qiming Venture Capital Zhou Zhifeng: 生成 AI 起業家のほぼ 60% がマルチモーダル アプリケーションに焦点を当てており、中国のエコロジーがより多くの機会を生み出す可能性があります
過去 40 年間、コンピューティング能力とデータの継続的な爆発的な増加に伴い、AI テクノロジーの形式は指数関数的に変化しています。新しいノードで傾向を予測し、事前に計画を立てるにはどうすればよいでしょうか?
Qiming Venture Partners のパートナーである Zhou Zhifeng 氏は、超大規模な事前トレーニング モデルによって推進されるこの AI の波は、基盤となるテクノロジーからの革新的な一般化機能と創発現象を実証し、次の問題を解決したと述べました。 AI 1.0 時代はある程度進んでおり、AI 技術が端末製品のほんの一部にすぎないこと、社会が AI 技術に合理的な期待を持っていないこと、完全なアプリケーション開発がされていないことなど、起業家が直面している多くの問題があります。インフラと環境、そして上場企業と資本市場評価システムの欠如。 AI は再び起業家精神と投資の注目のスポットとなっています。 2020 年の GPT-3 リリースから 2 年以内に、世界のベンチャーキャピタル機関による AI 企業への投資は 4 倍に増加し、2022 年だけで 13 億 7,000 万米ドルの資金調達が行われました。
▲ Qiming Venture Partners のパートナーである Zhou Zhifeng
は、「中国には基本的に新たな OpenAI は存在しない」と述べた Baidu の創設者とは異なります。中国と米国では、AI ベースの大型モデルの生態環境が大きく異なり、中国には多くのユニークな機会があると考えています。高い技術的障壁、高い人材密度、高い資本要件を伴う大規模モデルの方向性に加えて、若い起業家、垂直産業のベテラン、AI 業界の巨人は皆、テクノロジーとアプリケーションの複数の側面で異なる起業家としての機会を持っています。 Qiming Venture Capital の技術チームは、インテリジェント コンピューティング プラットフォーム、ツール チェーン、オープン/クローズド ソースの大規模モデル、自己構築モデルのアプリケーションから、AI エコロジー アーキテクチャと主要なレイアウト領域の新しい波の「マップ」をまとめました。・パーティーモデル構築など、ベンチャーキャピタルを参考にしてください。
Qiming Venture Capital のテクノロジー チームと 2020 年以降に設立された 100 社以上の企業とのコミュニケーション統計によると、生成 AI 起業家精神の分野では、起業家の 14% が基礎となるテクノロジーに注目し、起業家の 57% が起業家の 29% は言語アプリケーションに重点を置いており、AI テクノロジーで独自の障壁を築くことができるテクノロジー主導のスタートアップと、産業ワークフローに統合して高い商業価値を提供できるアプリケーション指向のスタートアップが、より目立つ可能性が高くなります。
爆発的な ChatGPT はどのようにして新たな技術革命を引き起こしたのでしょうか?午前中の円卓会議では、Zhiyi Technologyの共同創設者兼編集長であるZhang Guoren氏が、Zhujian Intelligenceの社長兼COOであるSun Bin氏、UBTECHの音声技術科学者であるHuang Dongyan氏、CreationのパートナーであるLiang Yu氏と話し合いました。パートナーズ キャピタル、テクノロジー、産業、投資についての質問で、会場の雰囲気は最高潮に達しました。
▲ラウンドテーブル対話セッション、左から右へ: Zhiyi Technology 共同創設者兼編集長 Zhang Guoren、Zhujian Intelligence 社長兼 COO Sun Bin 、UBTECH 音声テクノロジー科学者 Huang Dongyan 氏と Creation Partner Capital パートナー Liang YuChatGPT はどこからともなく生まれ、Nvidia CEO の Jen-Hsun Huang 氏から「人工知能の iPhone の瞬間」と称賛されました。自然言語理解トラック業界の導入について、COOの孫斌氏は「この製品の人気は予想を超えていた。大型モデルと暴力的なパラメータがもたらす新たなパラダイム変化の始まりとなった」と嘆いた。 Youbixuan は、人工知能によるサービス ロボットの実現における主要企業です。 「GPTの出現により、人工知能があらゆる階層に浸透し、サービスロボットが数千世帯に導入される時代が到来することがわかりました。」とUBTECHの音声技術科学者であるHuang Dongyan氏は述べています。 ▲UBTECH の音声技術科学者、Huang Dongyan 氏以前、深層学習の 3 人の巨人の 1 人である Yann LeCun 氏は、ChatGPT には特別な革新性はなく、単にうまく組み合わせられているだけだと述べていました。 Creation Partners Capital のパートナーで、初期段階のテクノロジー企業への投資に注力している Liang Yu 氏も同様の見解を示し、技術的な観点から見ると、Transformer アーキテクチャのシステム統合とエンジニアリングは着実に革新されており、ChatGPT も同様の見解を示しています。革命的な躍進を達成できていない。 Huang Dongyan 氏は Liang Yu 氏の見解に同意し、OpenAI は統合と試行錯誤の過程で「神から与えられた秘密」を発見し、対話によって人間のような驚くべきパフォーマンスを実現できるようになったと付け加えました。
その後、Zhang Guoren 氏は、OpenAI の GPT-4 の発売とマイクロソフト関連製品の相次ぐリリースが同業他社に多大なプレッシャーをかけているという、大きな注目を集めた質問を提起しました。 OpenAIポートフォリオは維持される見込み??
この点に関して、Sun Bin は、パフォーマンス ツールの組み合わせは、人々がそれをどのように使用し適用するかによって決まり、最終的には人々の成果が基準として使用される必要があると考えています。それらの組み合わせの長期的な価値は、将来他の業界でも使用でき、テクノロジーと業界を完全に統合できるかどうかにかかっています。 Huang Dongyan 氏は、「Microsoft と OpenAI の組み合わせがどこまで実現できるかは、Microsoft の技術革新能力と反復的な開発スピードにかかっています。もちろん、このプロセスでは「ダークホース」技術を備えた多数の AI 企業も登場するでしょう」と述べました。 。
▲Zhujian Intelligence 社長兼 COO、Sun Bin 一般的に言えば、マイクロソフトのアプローチは実際にこの業界の発展のパターンを設定しています。 Liang Yu氏は、「マイクロソフトはある程度、エコロジー戦略をとっている。業界アプリケーションとユーザーによるエコシステムへのアクセスは「データフライホイール」を形成する可能性があり、その回転速度はますます速くなるだろう」と語った。 国内環境では、大規模なモデルのトレーニングには、「フライホイール」として回転を開始する優れた中国語学習コーパスも必要です。 Meituan の共同創設者である Wang Huiwen から、Sogou の創設者である Wang Xiaochuan に至るまで、Project AI 2.0 計画を発表した Kai-fu Lee に至るまで、多くの著名人が AIGC 起業家の波に加わっています。張国人氏が、この起業家精神の波はインターネット時代の起業家精神のような「勝者総取り」の傾向になるのか、それとも「百花を咲かせよう」の傾向になるのかを尋ねると、数人のゲストは後者に同意した。 Sun Bin 氏は、「ビッグモデルの時代の状況は、インターネットにおける「多額の補助金」の時代とは異なる。AI は比較的固定された起業家チェーンのパターンを形成している。新しいビッグ言語モデルは、基礎となるエンジンは新しくなりますが、蓄積された業界のエコロジーやモデルは再利用され、百花を咲かせる機能は継続されます。同氏は、大規模な言語モデルは依然として業界の大手メーカーによって支配されている可能性があるが、重要な進歩は依然として科学技術革新企業に依存していることを認めた。 梁裕もこの意見に同意します。同氏は、大手メーカーが先頭に立っている一方で、新興企業のチャンスはアプリケーション層にある可能性があり、垂直分野に切り込んで産業実装を実現し、コストを削減し、効率を高める可能性があると考えている。 「スタートアップ企業は『巨大な獣の足音』を避けることを学ばなければなりません。すべての偉大な企業は小さな隙間から生まれます。」 ▲Creation Liang Yu、a World Partner CapitalのパートナーであるLiang Yu氏は、AIGC起業家精神が持つべき要素について語り、現在の競争、資本環境、大型モデル起業家精神の人材は、過去2年間に比べて質的に変化していると述べ、資本密度、起業家の密度と起業家の密度は急上昇しており、起業家は深い技術スキルと業界の理解を必要としています。 Sun Bin は、OpenAI の共同創設者が 8 年前にビジネスを始め、蓄積したテクノロジー、リソース、人脈を利用してビジネスを始めたのと同じように、現在の起業家も次の 3 つのことを考慮する必要があると考えています。電力、エンジニア、データ。ビジネスを始めると、半分の労力で 2 倍の成果が得られます。 サミットの講演者の多くは、AI 開発の終焉は汎用人工知能 (AGI) であると指摘しました。解決したい究極の問題は何ですか? Huang Dongyan 氏は、一般的な人工知能と垂直分野の人工知能は実際には相互に補完的であると考えています。直感的に言えば、大企業は一般的な人工知能のプラットフォームを提供しますが、垂直分野の人工知能は異なる業界にあります。 . 徹底的な開発を行います。孫斌氏は、10年後の現在を見ると、これが一般的な人工知能の出発点になるかもしれないと述べました。梁裕氏はまた、今年は汎用人工知能元年になるかもしれないと述べ、今日から汎用人工知能が水や電気のように人々の生産や生活のあらゆる側面にゆっくりと浸透していく可能性があると述べた。
張国仁氏は、おそらく多くのSF映画が、『アイアンマン』のジャービスや『流浪の地球』のモスなど、私たちにとって一般的な人工知能の姿をすでに描いているのではないかと述べ、「形は違えど、レベルが違う」と語った。提督は人間に達するか、人間を超えるでしょう。
##▲Zhiyi Technology 共同創設者兼編集長 Zhang Guoren 氏それでは、10 年からの今日の AIGC アプリケーション イノベーションの波を振り返ってみましょう数年後、テクノロジー産業と人間社会にどのような意味と影響を与えるでしょうか? Sun Bin は、10 年後から今日を見ると、これはコンピューターの対話方法に大きな変化をもたらし、人々は複雑な言語を学ぶ必要がなくなると信じています。梁裕成氏はまた、今年は汎用人工知能元年になるかもしれないと述べ、今日から汎用人工知能は水や電気のように人々の生産や生活のあらゆる側面にゆっくりと浸透していく可能性があると述べた。 ホアン・ドンヤン氏は、倫理的な観点から次のように述べています。「人間の本性に基づいて、テクノロジーのプラスの効果をどのように刺激するかが非常に重要です。10年以内には、おそらく誰もが独自のインテリジェントロボットを所有し、人々の効率を向上させるでしょう。その後、安全性と倫理の問題が業界関係者にとって懸念事項となっています。 Huang Dongyan は、法令、企業の自主規律、国民の意識、安全倫理基準などからなる包括的なガバナンスが必要であると考えています。 張国仁氏は、「10年後を振り返ってみると、今私たちが慣れ親しんでいるものは、その頃には珍しいものになっているはずだ。現在の視点から見ると、それは人々が今使い慣れているのと同じだ」と結論付けました。電子決済。10 年前またはそれ以前の現金決済の導入と比較して。 5.大型モデル特別セッション:国産品とGPT-4の差は何ですか?垂直化とローカリゼーションの追い越し午後の大規模モデル フォーラムでは、Beijing Zhipu Huazhang Technology Co., Ltd. の CEO、Zhang Peng 氏が、生成 AI 時代の基礎である事前トレーニング済み大規模モデルである Luchen Technology について説明しました。シンガポール国立大学コンピューターサイエンス学部の創設者であり学長でもある若きユー・ヤン教授が、大規模な AI モデルの低コストトレーニングの課題と実践について話し合いました。 Lanchi Ventures の投資パートナーである Shi Jianping 氏は、事前トレーニングされた大規模言語モデルが認知知能の時代の到来をもたらすと考えています NVIDIA のコンシューマー インターネット業界ソリューション アーキテクトの責任者であり、SenseTime の共同創設者である Xu Tianhao 氏は、 & 大型デバイス ビジネス グループ プレジデントの Yang Fan 氏は、コンピューティング能力とアルゴリズム実践の側面から洞察をもたらしました。1. Zhipu AI Zhang Peng: 大型モデルにもムーアの法則があり、GLM の新たな道を模索
大規模モデル フォーラムの最初の講演者は、Beijing Zhipu Huazhang Technology です。株式会社(以下、Zhipu AI)CEO 張鵬氏。産業界と学術界の先駆者として、彼は大規模モデルの事前トレーニングの技術的な道筋と実装の進捗状況を共有しました。 ▲Beijing Zhipu Huazhang Technology Co., Ltd. CEO、Zhang Peng 氏 事前トレーニングされた大規模モデルは、新世代のインフラストラクチャとなっています。 AI アプリケーション。 Zhang Peng 氏は、大規模モデルの分野にはムーアの法則があり、単一モデルのパラメータの数は毎年 10 倍に増加すると述べました。モデル パラメーターが数千億に達すると、大規模モデルは質的変化の重要なしきい値を超えており、ChatGPT がその代表です。 「私たちは懸命に取り組んできました。」 張鵬氏は、清華大学コンピューターサイエンス学部の成果の変革に基づいて、Zhipu AI が 2021 年に初のマルチモーダル大規模モデルを立ち上げたと述べました。 Zhang Peng 氏は、1,000 億のモデルをトレーニングするにはさまざまな課題に直面し、忍耐と時間が必要であると述べました。 Zhang Peng氏は、Zhipu AIが共同開発したバイリンガルGLM-130Bモデルの評価レポートは、精度と公平性の指標の点でGLM-130BがGPT-3 175B (davinci)に近いか同等であることを示していると述べた。また、Zhipu AIは昨年からAIコードツールCodeGeeXのオープンソース化と、1枚のカードで実行できるChatGLM-6Bオープンソースモデルのリリースを相次いで行うとともに、無料の補助書き込みアプリケーションの提供も開始した。 「Writing Frog」やパーソナライズされたダイアログ「Xiaodai」など、大型モデルの敷居を大幅に下げる製品です。最後に、Zhang Peng 氏は会議で Model as a Service (MaaS) の概念を強調し、事前トレーニングされた大規模モデルから API、マルチレベル アプリケーション、クラウドから民営化、オールインに至るまで、柔軟な導入方法を提供することを主張しました。 -1 つの展開。
2, Luchen Technology Youyang: 大規模モデルのトレーニング インフラストラクチャ Colossal-AI を構築して、AI 大規模モデル アプリケーションの実装コストを削減します
AI モデルのパラメーターの数はわずかです数年間で数万倍に増加しており、将来的には AI が人間の脳よりも賢く強力になる可能性があります。現在、大規模モデルのトレーニングが直面している課題は、トレーニング コストが非常に高いことです。
ビッグデータと大規模モデルが同時に改善される一方で、より効果的な最適化手法を作成し、コストを削減して効率を高め、スケーラブルで効率的なコンピューティングを実現し、AI 大規模モデルのアプリケーション実装コストを削減する方法が業界になっています。重要な問題点。
Luchen Technology は、一連の効率的な分散 AI 大規模モデル トレーニング インフラストラクチャ Colossal-AI を構築しました。これには、効率的なメモリ管理システム、N 次元並列テクノロジ、および大規模な最適化手法の 3 つの部分が含まれています。
Luchen Technology の創設者であり、シンガポール国立大学コンピューター サイエンス学部の校長である You Yang 氏によると、若い教授 You Yang 氏は、Colossal-AI が世界で最も急速に成長しているソフトウェアの 1 つになっていると明らかにしました。世界的な基本ソフトウェア市場をリードしており、Github でオープンソース化されています: https://github.com/hpcaitech/ColossalAI
▲若いヤン教授、Luchen Technology の創設者であり、シンガポール国立大学コンピュータサイエンス学部長
枞Chen Technology が開発した N 次元並列テクノロジは、高次元テンソル並列処理を含むさまざまな並列戦略を作成し、低コストで効率的な並列処理を提供します。大規模モデル向けの分散トレーニング ソリューション。
さらに、Colossal-AI の異機種混合スケジューリング システムに基づいて、ユーザーは GPU メモリ、CPU メモリ、ハードディスクを動的に管理するためのコードを 1 行記述するだけで、ハードウェアのモデル容量を増やすことができます。何十回も。
たとえば、1,750 億のパラメーターを使用する GPT-3 トレーニングには、以前は 128 GPU が必要でしたが、Colossal-AI では 64 GPU のみが必要となり、大規模モデルのハードウェア要件とコストが大幅に削減されます。 Colossal-AI は、同じ機器の下で、ユーザーがモデル トレーニングをより迅速に完了し、コストを削減するのに役立ちます。
3. Lanchi Venture Capital の Shi Jianping 氏: 認知知能は AI の最前線となり、「AI ファースト アプリケーション」がトレンドになっています
Lanchi Venture Capital の投資パートナーLanchi ベンチャー キャピタルの Shi Jianping 氏は、大規模な事前トレーニング済み言語モデルが認知知能の時代を切り開き、認知知能は AI の次のフロンティアになると提案しました。
▲Shi Jianping、Lanchi Ventures 投資パートナー
機械は、言語の生成と理解、知識推論などの前例のない認知能力を獲得しています。 AI OS(オペレーティングシステム)、基本モデルや事前学習済みモデル、強化学習技術などが全て揃っています。
スタートアップ企業は認知知能の世界をどのように取り入れているのでしょうか? Shi Jianping 氏は、すべての企業が大規模なモデルを構築する必要があるわけではなく、自社のデータを使用してオープンソース モデルやサードパーティがホストするモデルを微調整するなど、垂直アプリケーション パスから始めることもできるし、プラットフォームから始めることもできると示唆しました。ダウンストリームの垂直アプリケーション開発者にトレーニング、微調整、管理、サービスなどのプラットフォーム ツールを提供するなどのパス。
彼は次のように述べています:「大規模な事前トレーニング済み言語モデルは、認知知能を中核的な推進力とするインテリジェント コンピューティングの時代を切り開きました。」デジタル文明の基礎はコードであり、認知知能はその構造も再定義しますこのようにして、「AI ファースト アプリケーション」がトレンドになるでしょう。たとえば、Microsoft の検索エンジン Bing の新バージョンは、すでに優れた例を示しています。
「テクノロジーの反復の現在のペースは、PPT よりも速いです。」と Shi Jianping 氏は冗談を言いました。この文脈において、企業はどのようにして核となる競争上の優位性を確立できるのでしょうか?同氏の見解では、中核となるのは、独自のデータを使用して微調整された人工知能モデルをトレーニングすることであり、同時に、インテリジェントな世界とデジタル世界の統合により、より多くの想像力がもたらされるだろうという。
4, NVIDIA Xu Tianhao: ソフトウェアとハードウェアのコラボレーションにより、大規模クラスターで GPT3 をトレーニングする場合に 50% 以上の計算能力効率が実現
ハードウェアのコンピューティング能力の向上は、チップ テクノロジーの向上に依存するだけでなく、AI モデル アルゴリズムの進化のニーズとトレンドを正確に捉えることにも依存します。NVIDIA のコンシューマー インターネット業界ソリューション アーキテクトの責任者である Xu Tianhao 氏は次のように述べています。コンピューティング アクセラレーションの重要なポイントを見つけ、将来のビジネス ニーズを満たすために継続的に革新してください。」
##▲Xu Tianhao 氏、NVIDIA コンシューマー インターネット インダストリー ソリューション アーキテクト責任者大規模モデルの時代へ、1 枚のカードでモデルのトレーニングを実行できるには程遠く、相互に連携できるマシン ノードを形成するにはより多くの個人が必要です。 NVIDIA は、NVLink、NVSwitch、および IB テクノロジを導入しています。Ampere および Hopper アーキテクチャは、NVSwitch に基づいてノードを構築し、IB ネットワークを介してクラスタ ネットワーキングを実行するため、これらの強力な個人が効率的に協力して同じことを完了できます。 基盤となるハードウェアは基盤であり、開発者がそのハードウェアを使用して真に問題を解決するには、ソフトウェアの連携が必要です。そのため、NVIDIA はこれまでさまざまな業界の問題を解決するために SDK やシーン アプリケーションを構築してきましたが、その中でも NeMo フレームワークは大規模なモデルのトレーニングと推論のデプロイメントの問題を解決するように設計されています。 それでは、GPT-3 をトレーニングするために必要なリソースの数をどのように評価するのでしょうか? Xu Tianhao 氏は、消費時間 = より大きなモデルの作成に必要な FLOPS / ハードウェアの有効な計算能力という公式を説明しました。並列手法の効果的な統合と一連の最適化に基づいて、NVIDIA の NeMo フレームワークは、GPT-3 のトレーニング中に 50% 以上の効果的なハードウェア コンピューティング パフォーマンスを達成できます。 さらに、企業における大規模モデルの大規模展開を加速するために、NVIDIA NeMo フレームワークは、FasterTransformer と Triton の統合に基づく統合された大規模モデル ソリューションも提供します。 #5. SenseTime Technology のヤン・ファン氏: AI の生産パラダイムは大きな変化を遂げ、人工知能はより豊かな「ナビゲーションの時代」を到来させるでしょう会議では、SenseTimeの共同創設者で大型デバイスビジネスグループの社長であるYang Fan氏が、「スモールモデル時代」から出現したスタートアップの変化の道筋と力量の輪について説明した。
▲ SenseTime 共同創設者兼大型デバイス ビジネス グループ社長、Yang Fan 氏
AI は AI から新世代の技術革命をリードしています-生成AIへの科学支援研究は、最近人気の会話ロボットChatGPTを席巻しました。大きな(計算)力は奇跡を生み、量的な変化は質的な変化を生みます。 Yang Fan 氏は、AI の生産パラダイムは大きな変化を遂げており、大型モデルの時代が到来していると述べました。
Yang Fan氏は、AI「スモールモデル」時代の過去10年間で、単一の問題を解決するための深層学習手法と工業化されたスモールモデル作成ツールが徐々に成熟し、新たなビッグモデル時代には、大型モデルはサービスとして (MaaS) が新しいテーマとなり、大型モデルのインフラストラクチャのコスト削減、コンピューティング能力とデータ軍拡競争、リアルタイムのユーザー フィードバックを中心とした新しい AI パラダイムが生まれました。
この傾向に直面して、10 年近くにわたって AI に根ざしてきた SenseTime は、AI ネイティブ インフラストラクチャ、大規模モデル制作プラットフォーム、アルゴリズム モデル サービス、および業界アプリケーションの 4 つの要素を可能にする SenseCore 大型デバイスを開発しました。レベル: 究極の大規模モデル開発エクスペリエンス。
Yang Fan 氏は、SenseTime は長年蓄積された業界経験を組み合わせて、高効率、低コスト、大規模な新世代 AI インフラストラクチャ製品とサービスを提供し、数千億の AI インフラストラクチャの生産と導入を加速すると述べました。スタック全体にわたる大規模なモデルの統合、およびデータのプロモート 収集、ラベル付け、および管理の効率が大幅に向上し、モデルの反復サイクルが短縮されました。同時に、開発成果を確実に実装するための大規模モデル開発支援サービスも提供してまいります。
6. ChatGPT 的特別セッション: To B と To C、大型モデル VS 小型モデルの戦い
Yunzhisheng Li Xiaohan 氏は、AI スタートアップ向けの ChatGPT の出現で最も感じているのは、AGI が今後数年で現実になるかもしれないということであり、彼らは大規模モデルの波に統合する方法を模索していると述べました。
▲Li Xiaohan、Yunzhisheng 共同創設者兼副社長
AI の進化は、アルゴリズム中心からモデル中心への 3 つの法則を示しています。美しさは、大きなプロジェクトや中間タスクの終焉にあります。中間タスクとは、これまでのAI開発において独立した目標を持たず、徐々に弱体化したり消滅したりする中間タスクを指します。
2022 年までに、大手企業と AI スタートアップ企業の両方が大規模なモデルを構築しており、ChatGPT の出現により、業界にとってこの道の実現可能性が実証されました。 「モデルのパラメータが一定の規模に達すると、『創発的な』能力が現れるかもしれない」と李暁漢氏は述べ、認知知能のレベルでは、一定の開発期間を経て機械が人間を超える可能性があると述べた。
同時に、大規模モデルにより、エンタープライズ開発には 2 つの道が生まれました。つまり、一般的な大規模モデル サービスと垂直シナリオ向けの大規模モデルの作成です。大手メーカーの一般的な大型模型プラットフォームは外部サービスを提供し、模型フライホイールを「キャベツ価格」で生産することになる。さまざまなシナリオに直面している企業は、より垂直方向の大規模モデルを必要とし、データとサービスの制御可能性にさらに注意を払う必要があります。
Yunzhisheng はスマート医療業界に焦点を当て、特定の業界向けの大型モデルを発売し、業界に基づいて企業向けにカスタマイズされた大型モデルを顧客に提供します。 Li Xiaohan 氏は、自社のビジョンは業界バージョンから強化されたユニバーサル バージョンに移行することであると述べました。
2. Zhujian Intelligence の Jian Renxian: 「大規模言語モデルの知識の応用」、汎用人工知能の将来のオペレーティング システム
Jian Renxian、Zhujian Intelligence の創設者兼 CEO Zhujian Intelligenceは、大規模な言語モデルは一般的な人工知能のオペレーティングシステムとなり、「2つの世界」をもたらすだろう、1つはOpenAIとMicrosoftが主導するクローズドソースの世界、もう1つはDeepmindとGoogleが主導するオープンソースの世界であると述べた。 。同氏は、スタートアップと大企業の組み合わせによってイノベーションが規模を拡大し、「百花が咲く」状況が実現すると信じている。
▲Zhujian Intelligence 創設者兼 CEO、Jian Renxian 氏
彼はさらに、将来のソフトウェア パラダイムは自然言語テクノロジーによって駆動されるアプリケーションになると指摘しました。 「ビッグ言語モデル知識アプリケーション」構成による。モデル自体には実際の価値はないが、大規模な言語モデルに基づいて細分化されたアプリケーションには実際の価値があると考え、「サービスとしてのモデル」(MaaS)ではなく「アプリケーションとしてのモデル」(MaaA)の開発を主導しています。 )。
Jian Renxian 氏は、ChatGPT ベースのアプリケーションは、顧客サービスの自動化、仮想アシスタント、ナレッジ管理、従業員トレーニングなどのホワイトカラー労働者に大きな価値をもたらし、企業にも価値をもたらすと信じています。4 つのアプリケーション シナリオ:最初に中断されました。
大規模な言語モデルと小規模な言語モデルの長所と短所のバランスを取るために、Jian Renxian 氏は「小規模な自然言語処理モデル、知識モデル、大規模なモデル = 自然言語処理デュアル エンジン」という公式を提案しました。小さなモデルは、大きなモデルをより制御しやすく、使いやすく、解釈しやすくします。現在、Zhujian Intelligence は自然言語処理の専門知識を活用して、既存のスケーラブルな製品を大規模な言語モデルと統合し、さまざまな業界に事前トレーニングされたモデルを提供しています。
3. Kunlun Wanwei Fanghan: 中国と海外との間の大型モデルの開発には 3 つの大きなギャップがあります。国内のビジネス モデルの革新はエンタープライズ サービスから始まります
Largeモデルは数千億のモデルから始まる 真の汎用人工知能が出現し、iPhone における AI の瞬間が到来しました。 Kunlun Wanwei CEO Fang Han 氏は、ChatGPT は炭素ベースの生命からシリコンベースの生命への進化のマイルストーンとなる可能性があり、それは人類の歴史の中で 2 番目の進化となるだろうと述べました。
▲崑崙万偉 CEO ファン・ハン
しかし、中国と外国の間の大規模モデルの開発における現在の格差には 3 つの側面が含まれています。第一に、年間 5,000 万から 1 億米ドルのコストが、数千億の大規模モデルのトレーニングへのチケットであることです。第 2 に、中国語のテキストのデータ品質は高くありません。最大のギャップはエンジニアリング技術のギャップです。
Fang Han 氏は、GPT に向けた OpenAI の取り組みは、一般的な人工知能が実現可能であることを証明していると述べました。 GPT-3 がリリースされて体験した後、彼は GPT-3 が AIGC にとってマイルストーンとなり、コンテンツ生成の分野を大きく覆すものになると信じていました。
アプリケーション レベルでは、AIGC 業界は B 側のコストを削減し、C 側の効率を向上させるというロジックに従うだろうと Fang Han 氏は述べました。 Microsoft の B サイドのレイアウトは、金融やエネルギーなどの業界の大規模顧客に焦点を当てていることがわかります。その理由は、「これらの企業のデータを GPT などの大規模モデルと組み合わせて、次世代の生産を生成できるため」です。パラダイム。" C 側では、Microsoft の Copilot を例に挙げると、人々の生産性が向上します。
したがって、Fang Han 氏は、国内 AIGC 業界におけるビジネス モデルの革新は、まず B サイドのエンタープライズ サービスの分野に現れ、次に C サイドの UGC ツールの分野に現れると予測しています。
午後の AIGC アプリケーション イノベーション スペシャル フォーラムでは、aiXcoder CTO Hao Yiyang 氏、映画ディレクターグループ兼北京地区社長のファン・シュオ氏とコンピュテーショナル・エステティックス(Nolibox)の共同創設者であるファン・シェンユー氏はそれぞれ、AIGCとコード生成、メタバース、デザイン、クリエイティビティ、その他の業界との衝突と統合について議論した。
1. aiXcoder Hao Yiyang: GPT-4 はコード生成に新たな変化をもたらし、将来的にはモデルの数千億への拡張を促進します。会議では、aiXcoder (Silicon Heart Technology) の CTO Hao Yiyang 氏が「大規模言語モデル (LLM) 時代のコード生成」と題した基調講演を行いました。
彼は、GPT-4 はコード生成に新たな変化をもたらし、より長いシーケンス、より多くの命令数の微調整、マルチモーダル (画像入力) およびその他の操作をサポートし、一般的な用途により適していることを示していると述べました。しかし、関連ドキュメント、依存ライブラリや要件ドキュメントの不足、速度の遅さ、情報セキュリティの脅威など、多くの問題にも直面しています。 実は手続き型生成モデルと言語モデルには大きな違いがあり、例えばインタラクション手法に関して言えば、通常の対話言語モデルは主に質疑応答や継続に重点を置いているのに対し、手続き型生成モデルでは空白を埋めて完了し、バックアップします。コード生成では GPT-4 ではできないことがまだたくさんあります。たとえば、リアルタイム パフォーマンスの点では、GPT-4 は、リアルタイム フィードバックを必要とする一部のコード修正やコード補完のシナリオには適用できません。コンテキスト シーケンスは中規模および大規模プロジェクトのすべてのコンテキストを考慮することは困難であり、コード プロジェクトの完全な情報と Web クローリングのテキストの間には大きなギャップがあります。 aiXcoder は、2018 年に AI インテリジェント プログラミング ロボット トラックに参入したスタートアップとして、2022 年 6 月に国内初のコード生成事前トレーニング モデル製品 aiXcoder XL を発売しました。この製品は、フル機能の自然言語入力から本格的なプログラミング言語への出力をサポートします。 aiXcoder のロードマップを楽しみにしている Hao Yiyang 氏は、aiXcoder はモデルの数百億から数千億への拡張を推進し、自然言語処理コードの多数の混合データを追加し、特別に構築する予定であると述べました。プログラミングのさまざまなシナリオに対応する命令データ セットを作成することで、全体的なパフォーマンスが向上したコード編集ツールが得られます。▲aiXcoder (Silicon Heart Technology) CTO Hao Yiyang
2. Movie Group の Fan Shuo: コンテンツ用のデジタル オペレーティング システムの構築このモダリティは、今後 2 年間で爆発的な爆発を引き起こすでしょう。
生成 AI は爆発的な段階に達しており、それがもたらすアプリケーションの爆発的な増加により、人々は AI が知覚から知覚へと飛躍するプロセスを感じさせます。それは多くの市場スペースをもたらします。
ChatGPT はテキストモダリティを爆発期にもたらしましたが、写真、ビデオ、音声の爆発期はこの時代にはまだ到来していません。 Movie Book Group のディレクターであり、北京地区の社長である Fan Shuo 氏は、業界の需要の出現と生産効率の向上により、写真、ビデオ、さらにはデジタルツインが将来、不可逆的なトレンドとなり、より直観的かつ直感的なものになるだろうと述べています。人々が情報を得るのに便利です。▲范碩氏、映画書籍グループディレクター兼北京地区社長
テクノロジーの変革全体は、反復的なタスクの解決から論理と創造性についての思考に至るまで、人間の成長のプロセスと同じです。
現在、テキスト モダリティは人々の生産性の向上をもたらしていますが、樊碩氏は「2023 年から 2025 年はマルチモーダルの爆発的な時代になるでしょう。」と述べています。将来的には、生成 AI によって構築されたコンテンツは、論文や文書だけでなく、コードですが、ユーザー定義の自己対話型の制作。
さらに、端末会社にとって、「多くの企業がモデルに直接アクセスできるわけではありません。」そのため、モデルには接続するアプリケーションとサポートするプラットフォームがさらに多く必要であり、その後、モデルは次のような必要があると述べました。データの構造化、制作コンテンツの標準化、および処理化は、コンテンツ生成プロセス全体に真に適用できます。 Movie Group は AI デジタル オペレーティング システムを開発しました。
大規模モデル業界の発展は、コンテンツ生成の分野での反復的な作業に引き続き適応していくでしょう。将来的には、そのシステムは標準化機能を達成すると同時に、対応するオープン エンジンとドッキングして全体的なエコロジーを構築するでしょう。 、テキスト、サウンド、画像、ビデオ、その他のさまざまなモードを放射し続けます。
3. 計算の美学 Huang Shengyu: 変革の「3 つの要素」を把握し、AIGC でデザインの創造性を推進しましょう
AI は人間の芸術に影響を与えています。 Computational Aesthetics (Nolibox) の共同創設者である Huang Shengyu 氏は、AIGC がデザインとクリエイティブな生産メカニズムの革新をどのように推進しているかを共有しました。
▲Computational Aesthetics (Nolibox) 共同創設者 Huang Shengyu 氏
Huang Shengyu 氏は、デザインとコンピューティングの統合と進化には 3 つの過程を経たと述べました。段階:1.0時代はAdobeに代表される機械支援デザイン、2.0時代はCanvaなどのツールに代表されるデジタルデザインツール、3.0時代はAIGCに基づくダイレクトデザイン。この目的のために、コンピュテーショナルエステティックスは「Picture Universe」を立ち上げました。 」、「Painting Universe」などのツール。
「設計業界にとってのインテリジェント デザインは、運輸業界にとっての自動運転と同じです。」と Huang Shengyu 氏は述べています。「しかし、設計の動作は複雑で、通常、最適なソリューションはありません。最適化機能は、多くの場合、一意ではありません。明確です。」
AIGC によって推進される制御可能なデザインと創造的な生産の実現は、少なくとも 3 つの大きな課題に直面しています: 1. 創造性に関しては、人間と機械の言語は共通ではありません。 2. 複雑なデザインのクリエイティブ要件を取得して分析します。 3. デザインから生み出される創造的なソリューションは、反復して実装することが困難です。これに関して、Huang Shengyu 氏は、デザインの認知をロボットの認知に変換するための「3 つの要素」を提案しました。 1. デザイン資産の定量化可能な性質。 2. 設計経験の一般化可能性。 3. 設計動作のシミュレーション。
2020 年に設立された Computational Aesthetics は、清華大学が育成したテクノロジー企業です。世界初の商用ビジュアル デザイン データ セットを発売しました。そのコア製品には、AIGC 生産性向上ツール「Drawing the Universe」とインテリジェントな「Picture Universe」は次のステップとして、AIデザインクリエイティブプラットフォーム「Yeahpix」の立ち上げを予定している。
GTIC 2023 中国 AIGC イノベーション サミットは成功裡に閉幕しましたが、その内容は大規模モデルと生成 AI によって促進される生産とインタラクションは、インタラクション パラダイム革命が始まったばかりです。
今回の AIGC イベントでは、ChatGPT が大型モデル時代の技術の開発と蓄積から生まれ、産学投資コミュニティを興奮させたことがわかりました。同時に、この驚異的な製品は大型モデル時代のマイルストーンとなり、長年大型モデルに深く関わってきた企業にとってインテリジェンスが出現する可能性を示しています。
同時に、モデル パラメーターの規模は爆発的に増加しており、数千億個のモデルをトレーニングすることの難しさは想像できます。AI チップと計算能力レベルでは、大規模な生成 AI 製品の大規模な導入。
ジェネレーティブ AI は、テキスト、画像、コード、ビデオ、さらにはクリエイティブな制作に至るまで、破壊的なアプリケーション イノベーションをメタバース業界にもたらし、さまざまな業界に創造と想像のための無限のスペースをもたらしました。 ChatGPT に似た製品がますます商品化され、AI があらゆる分野に浸透し、汎用人工知能の時代が加速しています。
未来に目を向けると、生成 AI は私たちを新しい AI の世界に導き、急速に進歩する ChatGPT は新たな技術革命を引き起こしています。
GTIC 2023 中国 AIGC イノベーション サミットは、産業界、学界、研究サークルにとって、最先端のテクノロジーと産業実装に関する綿密な交流を行い、アイデアを刺激する重要なプラットフォームになります。さまざまな部門の AIGC 企業が招待されます。 AI の新時代の到来の証人になりましょう。
以上が中国初の注目を集めるAIGCサミットは盛大なイベントでした。 21 人の専門家のスピーチを凝縮した、GPT-4 時代についての数千語の辛口情報の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。