ホームページ >テクノロジー周辺機器 >AI >中国電信人工知能部長、賀忠江氏:超自然音声 2.0 は 2024 年にリリース予定
11月10日午後、中国電信人工知能総経理の何忠江氏が人工知能・データ産業発展協力フォーラムで一般大型モデルの製品とアイデアを解説した
何忠江氏は最初に、一般的な人工知能についての見解を共有しました。彼は、一般的な人工知能とは、人間のように見て、聞いて、考える能力を指すと信じていました。見るには視覚技術が必要で、聞くには音声技術が必要です情報や音声情報が脳に収集された後、脳はそれを処理および判断し、意思決定のアイデアを提供します。一般的な大型モデルは脳の役割を果たします。今日の膨大なデータ、高度なアルゴリズム、堅牢なコンピューティング能力も、大規模モデルの大規模開発を促進します。
基本的な考え方を説明した後、何忠江氏はチャイナテレコムスターセマンティックモデルとチャイナテレコムスターマルチモーダルモデルから詳細な説明を行いました。 China Telecom Star Semantic Large Model は一般的な人工知能の中核であり、より優れた機能を備え、複数回の幻覚を軽減し、「幻覚率」を 40% 削減します。将来的には、チャイナテレコムのスターセマンティック大規模モデルは、外部で 2B2G サービスを強化し、品質と効率を向上させ、エクスペリエンスを最適化することができ、内部で完全に適用し、生産コラボレーションの効率を向上させ、より豊富なアプリケーションを実現することができます。何忠江氏はまた、チャイナテレコムのAIチームもオープンソースおよびオープンソースプロセスに参加し、今年末までに数百億モデルを、来年4月には数千億モデルをオープンソース化する予定であることを明らかにした。オープンソース化される予定です。
He Zhongjiang 氏が China Telecom の Xingchen マルチモーダル大規模モデルを紹介したとき、China Telecom は混合精度戦略を使用して 12 億以上の画像とテキストのペアをトレーニングし、GPU 効率を大幅に向上させ、推論を 4.5 倍高速化したと述べました。マルチモーダルな大型モデルは、次世代のデジタル担当者の基本的な機能ベースとなります。
Wanhao インテリジェント カスタマー サービス音声と Supernatural TTS1.0 を比較して、何 Zhongjiang 氏は、China Telecom Xingchen Voice Large Model 1.0 は本物の人間に匹敵する自然さを実現し、適切な音声へのリアルタイム ストリーミングを実現できると述べました。最初のパケット応答時間は50 ミリ秒未満; 非常に小さいデータ量のサウンド変換とカスタマイズをサポートし、それによってより優れた、より高速な、より柔軟な実現を実現します。また、Supernatural Speech Synthesis 2.0 が 2024 年半ばにリリースされる予定であることも明らかにしました。
China Telecom HR は、China Telecom Star マルチモーダル大型モデルをベースにしており、基本的なデジタル アバターを使用して、メイクアップ アクセサリーの任意のマッチングやパーソナライズされた生成とカスタマイズなどの機能を表示します。何忠江氏は、大規模模型技術の継続的な強化と知識の継続的な充実により、仮想空間におけるデジタル人間と現実世界におけるロボットが人々の生産、運営、生活に与える影響はますます大きくなり、社会の時代は到来すると述べた。人工知能が本当に到来しようとしています!
Operator Finance (公式 WeChat パブリック アカウント yyscjrd) - 主流の金融ウェブサイト、テクノロジー、金融、証券、自動車、不動産、食品、医薬品、日用化学品、ワイン、その他の消費者製品を包括的にカバーするウェブサイト。
以上が中国電信人工知能部長、賀忠江氏:超自然音声 2.0 は 2024 年にリリース予定の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。