


ChatGPT は AI 業界に鶏の血を注入しました。かつては想像もできなかったすべてのことが、今日では基本的な慣行になりました。
は Text-to-3D を継続的に進めており、Diffusion(image) や GPT(text) に続くものと考えられています。 AIGC 分野における次のフロンティアのホットスポットは、前例のない注目を集めています。
いいえ、ChatAvatar という製品が控えめなパブリック ベータ版として公開されました。すぐに 700,000 回を超えるビューと注目を集め、ホット (今週のスペース) に掲載されました。 。
△ChatAvatar は、AI で生成された単一視点/複数視点のオリジナルの絵画から 3D 様式化されたキャラクターを生成する Image to 3D テクノロジーもサポートします。
#現在のベータ版で生成された 3D モデルは、PBR 素材とともにローカルに直接ダウンロードできます。うまく機能するだけでなく、さらに重要なのは、無料でプレイできるということです。一部のネチズンは次のように叫びました。
とてもクールです。独自のデジタル ツインを簡単に生成できるような気がします。
ChatAvatar と呼ばれ、国内の AI スタートアップ企業である Yingmo Technology Team によって作成されました。
これは、世界初の Production-Ready Text to 3D 製品であることがわかり、スターの名前や希望のキャラクターの外観などの単純なテキストを通じて、映画やテレビのレベルを生成できます。画像 3D の超現実的なデジタル人的資産。 効率も非常に高く、自分の顔であっても本物に見える顔を作成するのにかかる時間は平均 30 秒です。 将来的には、生成分野は他の 3 次元アセットにも拡大される予定です。 そして、モデルには通常のトポロジ、4k 解像度の PBR マテリアル、バインディングがあり、Unity、Unreal Engine、Maya などのプロダクション エンジンのプロダクション パイプラインに直接接続できます。 それでは、ChatAvatarとはどのような3D生成ツールなのでしょうか?その背後にはどのようなテクノロジーが使用されているのでしょうか? 「スキンのペイント」を 30 秒で完了 ChatAvatar のゲームプレイを実際に体験してみると、まさに敷居ゼロと言えることがわかります。 具体的には、チャットボットへの要望を公式ウェブサイト上で会話形式で現地語で説明するだけで済みます。オンデマンドで 3D 顔を生成し、ステッカーで覆うことができます。モデルの本物の「人肌」。
会話プロセス全体を通じて、ChatBot はユーザーのニーズに応じてガイドを行い、必要なモデルに関するユーザーの考えをできるだけ詳細に理解します。
## マウスを使用してドラッグしたり、頭を回転させたり、ズームインしてローカルの詳細を確認したりすることもできます。効果、毛穴、ニキビがはっきりと見えます:
ユーザーがプロンプト エンジニアリングの専門家である場合は、左側のボックスに「プロンプト」と直接入力して生成を完了することもできることに注意してください。
最後に、ワンクリックでダウンロードするだけで、プロダクション エンジンに直接接続して駆動できる 3D デジタル ヘッド アセットを取得できます。ベータ版 ヘアスタイル機能はまだ提供されていませんが、全体として、最終的に生成された 3D デジタル人財と説明コンテンツの一致度は高いです。
公式 Web サイトには、ChatAvatar ユーザーによって生成された、さまざまな人種、肌の色、さまざまな年齢、喜び、怒り、悲しみ、美しさ、醜い、太った、やせた、あらゆる種類の外観を備えた多数のアセットも表示されます。
3D デジタル ヒューマン アセットを生成するための ChatAvatar 製品のハイライトを要約しましょう:
まず第一に、使いやすいです
生成スパンが大きく、顔の特徴を変更することができ、
のように顔に合わせたマスクやタトゥーなども生成できます。##公式によると、プロモーション ビデオによると、ChatAvatar は、アバターなどの映画やテレビ作品のキャラクターなど、人間の範囲を超えたキャラクターをさらに生成することができます。
#最も重要なことは、ChatAvatar3D モデルと従来のレンダリング ソフトウェアの間の互換性の問題を解決するです。
これは、ChatAvatar によって生成された 3D アセットを、ゲーム、映画、テレビの制作プロセスに直接統合できることを意味します。 もちろん、ChatAvatar は、産業プロセスに正式に関与する前に、パブリック ベータの第 1 ラウンドに参加するようすでに何千人ものアーティストやプロのアート関係者を集めており、Twitter 上の関連トピックは 100 万近くのビューを獲得しています。そして注意。
どのツイートも 50,000 回以上再生される可能性があります。
無駄に「水道水」を溜め込んでしまったアインシュタインの3D顔を見てください、本当に似ていると言わざるを得ません。 ?
ControlNet と組み合わせると、直接撮影した一眼レフ写真と同等の効果が得られます:実際、3D 業界の以前のデザイナーや企業にとって、ほとんどの AI テキストから 3D へのアプリケーションは効果がないわけではありませんが、実際に工業デザインのプロセスに実装するには依然として多くの困難があります。
ChatAvatar が今回これほど大きな話題を呼び起こした背後にある技術的な理由は何ですか?
業界の要件を満たす 3D アセットを生成する際の難しさは何ですか?
AI が人間に取って代わると言われていますが、実際のところ、Text-to-3D の分野だけを置き換えるのはそう簡単ではありません。
最大の困難は、AI によって生成されたものを
標準 の 3D アセットに対する業界の要件を満たすようにすることです。
業界標準
をどのように理解していますか?プロの 3D アート デザインの観点から見ると、品質、制御性、生成速度という少なくとも 3 つの側面があります。1つ目は品質です。特に視覚効果を重視する映画、テレビ、ゲーム業界では、パイプラインの要件を満たす 3D アセットを生成するために、トポロジカルな規則性やテクスチャ マッピングの精度などの「業界の暗黙のルール」が AI 製品にとって最初に実行する必要があります。ほーむ。
トポロジ構造の規則性を例に挙げると、これは基本的に 3D アセットの配線の合理性を指します。
3D アセットの場合、トポロジの規則性は、オブジェクトのアニメーション効果、変更処理効率、テクスチャ描画速度に直接影響することがよくあります。
業界における 3D アート デザインの導入によると、 、手動リトポロジー 時間コストは、たとえ複数であっても 3D モデル自体の制作よりも高くなることがよくあります。これは、AIモデルによって生成された3Dアセットがどんなに素晴らしくても、生成された位相規則性が要件を満たしていなければ、根本的なコスト削減はできないことを意味します。テクスチャの正確さは言うまでもありません。
△Yingmo Technology の ChatAvatar プロジェクトは、生成品質、速度、標準互換性の点で以前の作品と比べて大幅に向上しました
Take一例として、現在ゲーム、映画、テレビ業界で一般的に必要とされている PBR テクスチャには、2D 画像 PSD ファイルの「レイヤー」に相当する、反射率マップや法線マップなどの一連のテクスチャが含まれています。 3D アセット パイプラインの制作に不可欠な数少ない条件の 1 つです。
しかし、現在のAIによって生成される3Dアセットは「全体」であることが多く、産業環境に合わせたPBRテクスチャを必要に応じて独自に生成できることは稀です。
2 つ目は制御性です。生成 AI の場合、生成されたコンテンツをどのようにしてより「制御しやすく」するかが、このテクノロジーに対する CG 業界のもう 1 つの主要な要件です。
有名な 2D 業界を例に挙げると、ControlNet が登場するまで、2D AIGC 業界は「半暗い進歩」の状態にありました。
つまり、AIは指定されたカテゴリの物体の画像を生成することはできますが、指定された姿勢の物体を生成することはできず、その生成効果はもっぱら迅速なエンジニアリングと「形而上学」に依存します。
ControlNet の登場以降、2D AI 画像生成の制御性は飛躍的に向上しましたが、3D AI に関しては、対応する効果を備えたアセットを生成するために、依然としてプロの Prompt 作品に大きく依存しています。 。
最後に生成速度です。 3D アート デザインと比較すると、AI 生成の利点は速度にありますが、AI レンダリングの速度と効果が手動レンダリングに匹敵しない場合、この技術は依然として業界に利益をもたらすことができません。
現在 AI 技術として非常に普及している NeRF を例にとると、その産業化には速度と品質の互換性の問題が発生しています。
NeRFによる3D生成は、生成品質が高いと時間がかかることが多いですが、速度を追求するとNeRFで生成した3Dアセットでも産業利用に全くなりません。
しかし、たとえこの問題が解決されたとしても、精度を損なうことなく NeRF を従来の CG 業界の主流エンジンと互換性を持たせる方法は依然として大きな問題です。
上記の業界標準化プロセスから、2 つの大きなボトルネックがあることを見つけるのは難しくありません。:
1 1 つは、プロンプト プロジェクトを手動で完了する必要があり、AI 以外の専門家や AI を理解していないデザイナーにとっては十分に使いにくいこと、もう 1 つは、生成された 3D アセットが業界標準を満たしていないことが多く、使用できないことです。彼らがどんなに美しくても。
これら 2 つの点を考慮して、ChatAvatar は に 2 つの具体的で効果的な解決策を提供しました。
ChatAvatar は、手動入力プロンプト エンジニアリング以外の第 2 の道を実現する一方で、「パーティ A モード」による直接対話を通じてニーズを説明するという、より一般の人に適した近道でもあります。
チームの公式 Twitter によると、この機能を実現するために、ChatAvatar は GPT の機能に基づいて会話の説明をポートレート機能に変換する方法を開発しました。
デザイナーは、GPT とチャットを続けて、必要な「フィーリング」を説明するだけで済みます。
GPT は、プロンプト プロジェクトの完了と結果の表示を自動的に支援します。 AI への提供:
# つまり、ControlNet が 2D 業界の「ゲーム チェンジャー」である場合、3D 業界にとっては、ChatAvatar はテキストを 3D に変換できます。は業界にとってまさにゲームチェンジャーです。
一方、より重要なことは、ChatAvatar が CG パイプラインと完全に互換性があること、つまり、生成されたアセットがトポロジー、制御性、速度の点で業界の要件を満たしていることです。
これは、3D アセットの生成後、ダウンロードしたコンテンツを さまざまなポストプロダクション ソフトウェアに直接インポートして二次編集を行うことができ、より高い制御性を実現できることを意味するだけではありません。 、生成されたモデルと高精度のマテリアル マップは、後のレンダリングで非常にリアルなレンダリング効果を実現することもできます。
このような効果を実現するために、チームは ChatAvatar 用の進歩的な 3D 生成フレームワーク DreamFace を開発しました。鍵となるのは、モデルのトレーニングに使用される基礎となるデータです。これは、世界初の大規模で高精度、複数の表情の顔の高精度データセットです。 。
このデータセットに基づいて、DreamFace は 製品レベルの 3 次元アセット の生成を効率的に完了できます。つまり、生成されたアセットには規則的なトポロジ、マテリアル、およびバインディングが含まれます。
DreamFace には主に、ジオメトリ生成、物理ベースのマテリアル拡散、アニメーション機能生成の 3 つのモジュールが含まれています。 DreamFace は、外部 3D データベースを導入することで、CG プロセスに準拠したアセットを直接出力できます。
#△生成されたアセットドリブン レンダリングの効果
上記 2 つの主要な問題を解決する本質技術的なボトルネックAIGCの激流によって時代の流れはさらに加速し、「検索」は「世代」に取って代わられる -
△ChatAvatar プロジェクトのホームページ
Yingmu Technology CTO Zhang Qixuan が次のように紹介しました:
文生图
分野が拡散モデルによって成果を上げたとき、人々はテキスト生成3D
にも同様の驚くべきパフォーマンスを期待し始めました。生成AIの3D制作技術が成熟すると、VRや動画などのコンテンツ制作が本格化します。
△拡散モデルMidjourney5.1
その背後にある AI スタートアップ企業 Yingmu Technology は、2020 年に上海科技大学の MARS 研究室から設立されました。設立後、Qiji Chuangtan と Sequoia から 2 ラウンドの投資を受けました種子。
同社は、コンピューター グラフィックスと生成 AI の研究と製品化に重点を置いています。 2021年、AIGCが大きな波紋を起こす前に、同社は中国初のAIGC ToCペイントアプリケーションであるWandをすでにローンチしており、この製品はAppStoreパーティションでトップになったこともあった。
そして、この先進的なチームはすでに業界ではよく知られており、平均年齢はわずか 25 歳です。
最初の商品化シナリオをデジタル担当者に具体的に据えた後、ChatAvatar は、AIGC を活用したこの方向への最新の進歩です。
ChatAvatar は、新しく発売された製品として、互換性、完成度、精度などの製品効果の点で Yingmo チームの期待を上回りました。しかし、ウー・ディさんの言葉を借りれば、ここに至るまでの過程は「非常に恥ずかしい」ものであったという。
最大の理由は「人手不足」に他なりません。現在、Shadow Eye はマルチカテゴリー 3D 生成技術の進歩を遂げており、次のステップは「3D 生成された大型モデル」を開始することです。
以上がカード1枚で30秒でバーチャル3D嫁をゲット! Text to 3D は、毛穴の詳細が明確な高精度のデジタル ヒューマンを生成し、Maya、Unity、その他の制作ツールとシームレスに接続しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

您一定记得,尤其是如果您是Teams用户,Microsoft在其以工作为重点的视频会议应用程序中添加了一批新的3DFluent表情符号。在微软去年宣布为Teams和Windows提供3D表情符号之后,该过程实际上已经为该平台更新了1800多个现有表情符号。这个宏伟的想法和为Teams推出的3DFluent表情符号更新首先是通过官方博客文章进行宣传的。最新的Teams更新为应用程序带来了FluentEmojis微软表示,更新后的1800表情符号将为我们每天

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

当八卦开始传播新的Windows11正在开发中时,每个微软用户都对新操作系统的外观以及它将带来什么感到好奇。经过猜测,Windows11就在这里。操作系统带有新的设计和功能更改。除了一些添加之外,它还带有功能弃用和删除。Windows11中不存在的功能之一是Paint3D。虽然它仍然提供经典的Paint,它对抽屉,涂鸦者和涂鸦者有好处,但它放弃了Paint3D,它提供了额外的功能,非常适合3D创作者。如果您正在寻找一些额外的功能,我们建议AutodeskMaya作为最好的3D设计软件。如

ChatGPT给AI行业注入一剂鸡血,一切曾经的不敢想,都成为如今的基操。正持续进击的Text-to-3D,就被视为继Diffusion(图像)和GPT(文字)后,AIGC领域的下一个前沿热点,得到了前所未有的关注度。这不,一款名为ChatAvatar的产品低调公测,火速收揽超70万浏览与关注,并登上抱抱脸周热门(Spacesoftheweek)。△ChatAvatar也将支持从AI生成的单视角/多视角原画生成3D风格化角色的Imageto3D技术,受到了广泛关注现行beta版本生成的3D模型,

对于自动驾驶应用来说,最终还是需要对3D场景进行感知。道理很简单,车辆不能靠着一张图像上得到感知结果来行驶,就算是人类司机也不能对着一张图像来开车。因为物体的距离和场景的和深度信息在2D感知结果上是体现不出来的,而这些信息才是自动驾驶系统对周围环境作出正确判断的关键。一般来说,自动驾驶车辆的视觉传感器(比如摄像头)安装在车身上方或者车内后视镜上。无论哪个位置,摄像头所得到的都是真实世界在透视视图(PerspectiveView)下的投影(世界坐标系到图像坐标系)。这种视图与人类的视觉系统很类似,

原标题:Radocc:LearningCross-ModalityOccupancyKnowledgethroughRenderingAssistedDistillation论文链接:https://arxiv.org/pdf/2312.11829.pdf作者单位:FNii,CUHK-ShenzhenSSE,CUHK-Shenzhen华为诺亚方舟实验室会议:AAAI2024论文思路:3D占用预测是一项新兴任务,旨在使用多视图图像估计3D场景的占用状态和语义。然而,由于缺乏几何先验,基于图像的场景

一些原神“奇怪”的关键词,在这两天很有关注度,明明搜索指数没啥变化,却不断有热议话题蹦窜。例如了龙王、钟离等“转变”立绘激增,虽在网络上疯传了一阵子,但是经过追溯发现这些是合理、常规的二创同人。如果单是这些,倒也翻不起多大的热度。按照一部分网友的说法,除了原神自身就有热度外,发现了一件格外醒目的事情:原神3d同人作者shirakami已经被捕。这引发了不小的热议。为什么被捕?关键词,原神3D动画。还是越过了线(就是你想的那种),再多就不能明说了。经过多方求证,以及新闻报道,确实有此事。自从去年发


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

Dreamweaver Mac版
ビジュアル Web 開発ツール

ホットトピック



