これは普通の自動運転ビデオだと思いますか?
画像
このコンテンツは、元の意味を変更せずに中国語に書き直す必要があります。
どのフレームも「本物」ではありません。
写真
さまざまな道路状況、さまざまな気象条件、20 以上の状況をシミュレートでき、その効果は本物とまったく同じです。
写真
世界モデルが再び多大な貢献を果たしました。これを見たルカンさんは熱心にリツイートした。
写真
最新バージョンの GAIA-1 によってもたらされる上記の効果によると、
このプロジェクトの規模4,700 時間の運転ビデオ トレーニングを通じて 90 億のパラメータに達し、ビデオ、テキスト、または操作を入力して自動運転ビデオを生成する効果を達成することに成功しました。
最も直接的な利点は、将来のイベントをより適切に予測できることです。 20 さまざまなシナリオをシミュレーションできるため、自動運転の安全性がさらに向上し、コストが削減されます。
写真
私たちのクリエイティブチームは、これは自動運転ゲームのルールを完全に変えるだろうと率直に述べました。
それでは、GAIA-1 はどのように実装されるのでしょうか?
スケールは大きいほど優れています
GAIA-1 は複数のモードを備えた生成世界モデルです
ビデオ、テキスト、アクションを入力として利用することで、システムはリアルな運転を実現します自動運転車の動作とシーンの特性を細かく制御しながら、シーン ビデオを生成できます。
テキスト プロンプトのみを使用してビデオを生成できます。
画像
モデルの原理は、大規模な言語モデルの原理と似ています。つまり、次のマークを予測します。
モデルは、ベクトル量子化表現を使用してビデオ フレームを離散化し、変換される将来のシーンを予測できます。予測シーケンスへの次のトークン。次に、拡散モデルを使用して、ワールド モデルの言語空間から高品質のビデオが生成されます。
具体的な手順は次のとおりです。
図
#最初のステップは理解しやすいもので、再コード化して配置し、さまざまな入力を組み合わせます。
特殊なエンコーダを使用してさまざまな入力をエンコードし、さまざまな入力を共有表現に投影します。テキストおよびビデオ エンコーダは入力を分離して埋め込みますが、操作表現は共有表現に個別に投影され、これらのエンコードされた表現は時間的に一貫しています。
配置が完了すると、ワールド モデルの重要な部分が表示されます。
自己回帰トランスフォーマーとして、シーケンス内の次のイメージ トークンのセットを予測できます。また、前の画像トークンだけでなく、テキストや操作のコンテキスト情報も考慮されます。
モデルによって生成されたコンテンツは、画像の一貫性を維持するだけでなく、予測されたテキストやアクションとの一貫性も維持します
チームは、GAIA の世界モデルのサイズを紹介しました。 1 は 65 億のパラメータで、A100 の 64 ブロックで 15 日間トレーニングされました。
最後に、ビデオ デコーダとビデオ拡散モデルを使用して、これらのトークンをビデオに変換します。
このステップの重要性は、ビデオのセマンティック品質、画像精度、時間的一貫性を確保することです
GAIA-1 のビデオ デコーダは 26 億パラメータの規模を持ち、32 台の A100 を使用してトレーニングされています15日以内に届きます。
GAIA-1 は原理的に大規模な言語モデルに似ているだけでなく、モデルの規模が拡大するにつれて生成品質が向上するという特徴も示していることは注目に値します。
#Pictureチームは、6 月に以前にリリースされた初期バージョンと最新の効果を比較しました。
後者は前者の 480 倍の大きさです。
動画のディテールや解像度などが大幅に向上していることが直感的にわかります。
写真実用化の観点から見ると、GAIA-1 の登場も一定の影響を与えており、主要クリエイティブチームはこれが変わるだろうと述べています。自動運転のルール
写真
その理由は 3 つの側面から説明できます:
- 安全性
- 包括的なトレーニング データ
- ロングテールシナリオ
まず、安全性の観点から言えば、世界モデルは未来をシミュレーションし、AIに自律走行車の安全性にとって重要な独自の決定を実現する能力を与えることができます。運転中。
第二に、トレーニング データも自動運転にとって非常に重要です。生成されるデータは、より安全で、コスト効率が高く、無限に拡張可能です。
生成 AI は、自動運転が直面するロングテール シナリオの課題の 1 つを解決できます。霧の天候で道路を横断する歩行者に遭遇するなど、よりエッジなシナリオに対応できます。これにより、自動運転の機能がさらに向上します。
Wayve とは何ですか?
GAIA-1 は英国の自動運転スタートアップ Wayve によって開発されました
Wayve は 2017 年に設立されました。投資家には Microsoft などが含まれ、その評価額はユニコーンに達しています。
創設者は Alex Kendall と Amar Shah で、二人ともケンブリッジ大学で機械学習の博士号を取得しています
写真
技術的な路線では、テスラと同様に、ウェイブはカメラを使用した純粋に視覚的なソリューションの使用を提唱し、高精度の地図を非常に早い段階で放棄し、「瞬時認識」路線をしっかりと守ります。
少し前に、チームがリリースした別の大型モデル LINGO-1 も広く注目を集めました。
この自動運転モデルは、走行中にリアルタイムでコメントを生成できるため、モデルの精度がさらに向上します。説明可能性
今年3月、ビル・ゲイツ氏もウェイブの自動運転車に試乗した。
写真
紙のアドレス: https://www.php.cn/link/1f8c4b6a0115a4617e285b4494126fbf
参考リンク:
[1]https://www.php.cn/link/85dca1d270f7f9aef00c9d372f114482[2]https://www.php.cn/link/a4c22565dfafb162a17a7c357ca9e0be
以上がルカン氏、自動運転ユニコーン詐欺に深く失望の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

6月10日消息,近日在Reddit社区上,网友Icy_Nectarine_6311爆料了一组关于特斯拉Model3的新照片,这一代号为“ProjectHighland”的车型在之前已经曝光了白色和黑色车身,而这次首次发现了一辆蓝色车型。根据照片显示,蓝色Model3Highland采用了一种类似于19英寸运动轮毂和冬季轮胎套件的轮毂设计,与之前的白色和黑色车型有所不同。不过,这款蓝色车型的轮毂没有带有特斯拉标志的黑色轮毂盖。此外,新款Model3的前大灯与之前曝光的照片一致,采用了更加时尚和动感

01感知:构建实时的4D自动驾驶场景1.特斯拉摄像头布局特斯拉的摄像头视野可以覆盖车身周围360°,在前向有120°鱼眼、长焦镜头用于加强观测,布局如上图。2.特斯拉图像数据预处理特斯拉采用的是36Hz的1280*960-12bit的图像原始数据,这相对于只有8-bit的ISP后处理数据多了4位信息,动态方位扩大了16倍。特斯拉这样处理的原因有2个:1)ISP基于rule-base的算法对原始信号做了自动对焦(AF)、自动曝光(AE)、自动白平衡(AWB)、坏点校正(DNS)、高动态范围成像(H

2 月 16 日消息,特斯拉的新自动驾驶计算机,即硬件 4.0(HW4)已经泄露,该公司似乎已经在制造一些带有新系统的汽车。我们已经知道,特斯拉准备升级其自动驾驶硬件已有一段时间了。特斯拉此前向联邦通信委员会申请在其车辆上增加一个新的雷达,并称计划在 1 月份开始销售,新的雷达将意味着特斯拉计划更新其 Autopilot 和 FSD 的传感器套件。硬件变化对特斯拉车主来说是一种压力,因为该汽车制造商一直承诺,其自 2016 年以来制造的所有车辆都具备通过软件更新实现自动驾驶所需的所有硬件。事实证

特斯拉Optimus进化了,价格“比车更低”。来源|量子位ID:QbitAI作者|金磊西风转载已获授权马斯克的人形机器人——特斯拉Optimus进化了,价格还“比车更低”。现在,成群结队的Optimus学会了像人一样缓慢前行:视频中它们还路过Cybertruck的生产间,满满的赛博朋克味道。而且Optimus们可不是简单的在走路而已,而是边走边发现并记忆周遭的环境:接下来,是更为细节的能力展示。例如特斯拉展示了Optimus电机转矩控制的能力,是能做到控制力道不打碎鸡蛋的那种:手活儿也是过关的,

6月10日消息,全国首家特斯拉GIGA实验室在成都隆重亮相,为成都市民带来了全新的特斯拉体验。这座被誉为特斯拉"成都最美门店"的实验室位于四川省成都市金牛区天府艺术公园,具体地址是天府1113号楼1层104号,即特斯拉天府111体验店。据小编了解,在这里,顾客们不仅可以与朋友相约畅聊小憩,还能沉浸式地体验特斯拉的制造奇迹,仅需45秒即可见证一辆汽车的诞生。特斯拉的超级工厂被冠名为"GIGA",这个词源于计量单位,代表着"数十亿"的含义。

7月14日消息,特斯拉今日宣布推出一款新车型——特斯拉Cyberquad。这款面向儿童的玩具车将在特斯拉国内官网以及天猫/京东特斯拉官方旗舰店上架,标价11990元。虽然这个价格对于一款玩具车来说并不便宜,但这并没有阻止国内特斯拉粉丝们对它的热情。在上架时,由于人数过多,特斯拉官网甚至出现了卡顿现象,导致消费者无法成功加购。然而,截至目前,特斯拉官网仍然无法成功购买该商品。据小编了解,特斯拉Cyberquad的设计灵感源自特斯拉最酷炫的Cybertruck电动皮卡,车身采用特斯拉标志性的LED大

为了满足对人工智能和机器学习模型越来越大的需求, 特斯拉创建了自己的人工智能技术,来教特斯拉的汽车自动驾驶。最近,特斯拉在Hot Chips 34会议上,披露了大量关于Dojo(道场)超级计算架构的细节。本质上,Dojo是一个巨大的可组合的超级计算机,它由一个完全定制的架构构建,涵盖了计算、网络、输入/输出(I/O)芯片到指令集架构(ISA)、电源传输、包装和冷却。所有这些都是为了大规模地运行定制的、特定的机器学习训练算法。Ganesh Venkataramanan是Tesla自动驾驶硬件高级总

7月4日消息,特斯拉近日宣布在北美地区对Model3和ModelY的标准色进行了调整。据悉,特斯拉将北美地区Model3和ModelY的标准色改为了"冷光银",而除了银色之外的所有颜色都需要额外付费,包括黑色和白色。特斯拉旗下的ModelY作为例子,目前提供了五种车漆选择。除了标准的冷光银外,还有珍珠白(多涂层)、深海蓝、纯黑和红色(多涂层)。然而,除了冷光银之外的其他四种颜色都需要额外支付费用。其中,深海蓝和珍珠白车漆需额外支付1000美元(约7250元人民币),纯黑车漆需


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

Dreamweaver Mac版
ビジュアル Web 開発ツール
