ホームページ >テクノロジー周辺機器 >AI >Mobvoi の内部ベータ テストでは、大規模モデル「Sequence Monkey」を調査し、個人および企業向けの専用コパイロットを作成します
4月20日、Mobvoiは北京で「AGI・Advent」をテーマにした2023 AIGC戦略カンファレンスを開催した。 Mobvoi は会議で、大型モデル「Sequence Monkey」を探索するための内部テストを発表し、CoPilot がどこにでも存在することを提案しました。同時に、大型モデルの機能に基づいて、クリエイター向けの CoPilot 製品マトリックスとアップグレードされたバージョンも発表しました。 C 側のバージョン、音声アシスタントのマジック、および B 側の企業固有の大規模モデルの内部テストと探索に関する質問。その中で、クリエイター向けのCoPilot製品マトリックスには、AIライティングプラットフォーム「Qiaowen」、AIペイントプラットフォーム「Yihua」、AIアフレコプラットフォーム「Magic Sound Workshop」、デジタルヒューマンビデオ&ライブブロードキャストプラットフォーム「ワンダフルユアン」。
AGI の「到達」を支援する自社開発大型モデル「Sequence Monkey」
大型モデルについて聞きに行く「Sequence Monkey」 マルチモーダル生成機能を備えた大規模な言語モデルであり、言語を中心とした機能システムは「知識、対話、数学、論理、推論、計画」の 6 つの側面をカバーし、テキスト生成、画像生成をサポートできます。コンテンツ生成、音声生成、音声認識などのさまざまなタスク。
現時点では、「Sequence Monkey」大規模モデルは、すでに一定の自然言語理解、知識、論理および推論能力を備えています。「湖南省と湖北省のどちらの省都に人口が多いですか?」などのより複雑な質問については、正確な結果を迅速に得ることができます。
報道によると、Mobvoi が自社開発した大型モデルの中国語名「シーケンス モンキー」のインスピレーションは、20 世紀初頭に数学者エミール ボレルによって提案された「無限猿」定理から来ています。この定理によれば、サルのグループがランダムにタイプライターを打てば、最終的にはシェイクスピアの完全な作品が生み出されることになります。この定理は確率理論と組み合わせ数学に基づいており、確率の単一性を示しています。 Mobvoi が自社開発した大規模モデルの構築原理は「Infinite Monkey」と同様で、大規模なテキストシーケンスが Mobvoi 独自のアルゴリズムによって継続的に学習され、大規模な計算能力によって消化・理解されて「Sequence Monkey」となります。
Mobvoi の創設者兼 CEO である Li Zhifei 氏は、「大規模モデルは、単に大きなパラメータを意味するものではありません。今日の大規模モデルは、インターネット テキストの詳細なモデリングであり、インターネット テキストは世界の知識のマッピングであり、非常に大規模です」と述べました。モデルは認知モデルであり、言語のモデリングです。言語は思考の境界であるため、大きなモデルには無限の想像力の余地があります。 「Sequence Monkey」はすでに訓練過程でその「創発」能力を発揮しており、現在は「啓蒙」段階にあり、今後ますます向上していくだろう。彼はまた、人間のコパイロットであることが大型モデルにとって最高の「仕事」であり、将来的にはどこにでもコパイロットが存在するようになるだろうと信じている。
コンテンツ作成プロセス全体を開くワンストップの CoPilot 製品マトリックス
「Sequence Monkey」大型モデルに基づいて、Mobvoi はさまざまなクリエイターを検討してきました。 AIGC 製品とアプリケーションは、数千人のクリエイター向けにワンストップの CoPilot 製品マトリックスを構築し、コンテンツ作成プロセス全体を開放します。現在、Mobvoi は技術、製品、商品化の「三位一体」を実現しており、全世界で 500 万人以上の登録ユーザーと 100 万人以上の有料ユーザーを抱えています。
Qiaowen-Your AI Writing Assistant (write.mobvoi.com)
記者会見で初公開されたCoPilot製品として、「Qiaowen」のAIが登場このライティング能力は、職場、マーケティング、ニューメディア、クリエイティブライティングの 4 つの主要なコンテンツ作成シナリオをカバーしており、年末の要約、顧客サービスの言葉、台本、広告のコピーライティング、その他のコンテンツを作成する際に、ユーザーにインスピレーションとクリエイティブな方向性を継続的に提供できます。 。
ユーザーのコンテンツ作成効率の向上を支援するために、「Qiaowen」は、スタイル変換、キーポイント抽出、校正と誤り訂正、継続、書き換え、拡張、省略、および、という 8 つの主要な AI 編集機能をオープンしました。翻訳。 。 「Qiaowen」は執筆中に自動的に画像を生成することもでき、画像とテキストの両方を含む執筆体験をユーザーに提供します。
Yuhua-あなたの AI ペイント アシスタント (paint.mobvoi.com)
文字だけでなくデザインも強く求めるデザイナーやイラストレーターなどに対応Mobvoi.com の作成者は、内部テストで AI ペイント プラットフォーム「Yihua」を調査しました。 「ワードペインティング」は、2次元、スチームパンク、イラストなど8つのクリエイティブスタイルに対応しています。ユーザーはテキストを入力するだけで、「Yihuahua」はリアルな光と影と豊かなディテールを備えた 8 枚の 2K 高解像度画像を一度に生成できます。
テキストを使用した絵の作成に加え、絵の作成、アニメーションの生成、パーソナライズされたアバターの生成などの AI 描画機能も備えており、ユーザーのクリエイティブな方法を大幅に豊かにします。企業ユーザー向けに、「宜華」は専用モデルのカスタマイズもサポートしており、企業ユーザーが自分のニーズに応じてモデルのスタイルをカスタマイズできるようにし、複数人による共同制作をサポートして企業の図面ニーズをより適切に満たします。
現在、「Yiyanhua」は家の装飾デザインプラットフォーム Kujiale との探求の目的に達しています。Kijiale プラットフォームでは、ユーザーは「Yiyanhua」を使用して自分のニーズを言葉で説明できます。装飾スタイルを簡単に変更できます。家具の位置などを調整し、お好みの装飾プランをデザインしてください。
Moyin ワークショップ - AI 吹き替えアシスタント (moyin.com)
AI 吹き替えシナリオのために、Mobvoi は新世代の AI 吹き替え製品「Magic Sound Workshop」を発売しました。 「Magic Sound Workshop」(DupDubの海外版)は、1,000以上の音色、2,000以上の音声スタイル、20以上の方言と外国語をユーザーに公開した、世界有数のフルプロセスワンストップAIダビングプラットフォームです。
「Magic Sound Workshop」は、ラージモデル技術を活用し、AIライティング、AIアフレコ、編集などマルチなシーンをカバーする、ラージモデルAIライティング機能を搭載した世界初のアフレコプラットフォームです。その支援により、ユーザーは、映画やテレビの解説、オーディオブック、オンライン教育、ニュース放送など、コピーライティングと吹き替えを統合したコンテンツ作成を簡単に完了できます。現在、「Magic Sound Workshop」は、WeChat Reading、Juvenile Get、Volkswagen など、多くの業界の大手企業と提携に至っています。
ユーザーにより良いアフレコ体験を提供するために、「マジックサウンドワークショップ」は選択した音声に対して、穏やか、悲しい、嬉しいなど7つの感情の調整をサポートします キャラクターなど10種類.が移行され、同時にリズム調整やローカル速度変更、複数人ダビングなどのAIサウンド個別編集機能がオープンし、Wordで文書を編集するような感覚でサウンド編集ができるようになりました。
「Magic Sound Workshop」では、サウンドの選択と編集に加えて、大規模モデル言語生成機能に基づいた「ピンチサウンド」機能も開始され、ユーザーは性別、年齢、言語、言語を自由に選択できます。スタイルや感情など、音の特徴を0から1までお好みの音を創り出します。
Wonderful Yuan-Your AI Digital Avatar (weta365.com)
ビデオを作成するためにテキスト、画像、サウンドなどを生成する機能に基づいていますコンテンツクリエイター もっと見る 斬新で活気に満ちた興味深い作品を迅速かつより良く作成するために、Mobvoi の内部ベータテストでは、AI デジタル画像作成およびライブブロードキャストプラットフォーム「Wonderful Yuan」を検討しました。
レポートによると、「Wonderful Yuan」プラットフォームには現在 100 人を超えるデジタル人材、1,000 を超える 3D デジタル資産、1,000 を超えるサウンドが存在します。マルチモーダル生成技術により、「Wonderful Yuan」プラットフォームは現在、画像モデリング (2D デジタル ヒューマン)、ビデオ モデリング (2.5D デジタル ヒューマン)、および 3D モデリング (3D デジタル ヒューマン) の 3 つの異なる形式のデジタル ヒューマン生成をサポートしています。画像クローン機能は、5分間のライブビデオ素材を使用するだけで、ユーザーのイメージと態度を1:1で再現し、一貫した音声と自然な動きを備えたユーザーのデジタルクローンを作成します。
個人から企業まで、CoPilot はあらゆる場所に登場します
Mobvoi は音声アシスタントの分野で豊富な蓄積を持っており、AI 音声に関する研究は 2016 年に遡ります。 10 年以前、Mobvoi は 2014 年に最初の音声アシスタント「Xiaowen Assistant」をリリースし、2015 年に「Xiaowen 秘書」を反復し、2017 年にフルシナリオ VPA を開始し、2019 年に VPA をアップグレードしました。 10 年間の蓄積と開発を経て、このカンファレンスで Mobvoi による内部テストで研究された CoPilot-Magic Xiaowen は、Siri と ChatGPT を統合したものとして理解できます。
「こんにちは、こんにちは、一番近い火鍋レストランはどこですか?」 「こんにちは、明日の北京の天気を教えていただけますか?」 人々は衣食住を必要とする前に関連情報を調べることに慣れています。個人ユーザー向けのインテリジェントな音声アシスタントを開発する「Magic Question」は、百科事典の情報、天気、レストラン、ホテルなどを確認したり、ユーザーと自由に会話したりできるため、ユーザーはより便利かつ迅速に情報を入手できます。
Mobvoi 氏によると、「CoPilot」はスーパーアシスタントの概念から派生したもので、大規模なモデルに基づいた高知能の頭脳を備え、膨大なデータを分析し、瞬時かつ正確に人間とコミュニケーションすることができます。また、美しい声、美しい画像を備え、携帯電話、時計、自動車機械などのあらゆるハードウェアプラットフォームに装備でき、さまざまな業界に適応して、高品質の教育教師、知識豊富な弁護士に変身することもできます。 、専門の医師、財務管理の顧客サービスなど、必要なときにいつでもどこでも専門知識を実証し、他の人へのプレッシャーを共有します。
「Sequence Monkey」大型モデルをベースとした「Mobvoi Copilot」は、ボトムレベルの機能、Bエンドユーザーおよび垂直分野向けに、一般的な機能サポートサービスとデジタルヒューマンイメージのカスタマイズを提供するだけでなく、サービスだけでなく、独自のロール機能も開放し、データ インターフェイスの反復を継続します。必要な企業ユーザーは、Web にログインして API サービスを呼び出し、ドキュメントをアップロードして業界固有のコンテンツをトレーニングして、カスタマイズされた音声対話を実現できます。 Sequence MonkeyのURLはopenapi.mobvoi.comです。
現在、Mobvoi は、自動車、教育、法律事務所、金融、医療、観光などを含む上位 10 業界の社内ベータ探索パートナーの第一陣と協力関係に達しています。将来的には、Mobvoi は「 「CoPilot」は、徐々に多くの業界に力を与え、より多くの企業が独自の独占的な大型モデルを所有し、独自の独占的な「CoPilot」を作成できるように支援します。以上がMobvoi の内部ベータ テストでは、大規模モデル「Sequence Monkey」を調査し、個人および企業向けの専用コパイロットを作成しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。