テスラのエロン・マスク最高経営責任者(Elon Musk)はこのほど、同社のテスラロボット(Tesla Bot)を発売した。オプティマス(Optimus)と呼ばれるこのロボットは、足を引きずってステージを歩き、手を振り回し、腕を振り回し、動作が遅い。マスク氏は、すべてが計画通りに進めば、このロボットは3~5年以内に2万ドルを費やす可能性があると予測している。しかし問題は、それが私たちのためにできることです。しかし、私たちが深く研究する前に、テスラのロボットを駆動する主要な設備を見てみましょう。
テスラロボットアクチュエータ
これ アクチュエータ 任意のロボットの主要な駆動システムです。ロボットは運動部品のあるコンピュータにすぎない、あるいは言い換えれば、ロボットはアクチュエータとセンサのあるコンピュータにすぎないと言えます。テスラはロボットのために独自のアクチュエータを開発し、3種類の回転アクチュエータと3種類のタイプを使用している リニアアクチュエータ.
テスラがなぜ標準化されたリニアアクチュエータを使用していないのか知りたいなら、例えば FIRGELLI アクチュエータ。これは、ロボットが最終的に軽量化、省エネ、高電力密度、低コストを実現するために独自のシステムを開発しなければならないという制約があるためです。テスラは、このロボットを1台2万ドルで小売したいと主張している。それ自体は、23個のアクチュエータ、強力なPC、大量のセンサ、バッテリパックが必要なため、数時間以上継続することができ、強固なスケルトンを加えて接続することができます。
テスラロボットリニアアクチュエータ
テスラが開発したリニアアクチュエータは特定のキャラクタに高度な特異性を持っており、ロボット以外の他のアプリケーションにはあまり役に立たないことを意味しています。彼らのアクチュエータは惑星ローラシステムを採用しており、テスラは惑星ローラシステムと呼ばれている。しかしこれは基本的にボールねじ設計のコードであり、モータの中間にある従来の電機子コイルではなくブラシレスコアモータを使用して設計することにした。これは、ボールねじの設計が非常に効率的で、消費電力が低いが、コストも高いことを意味します。彼らはブラシレス電源システムを使用しています。これは寿命が大幅に速くなり、ソフトウェアによって制御される高度に特定の駆動モードを可能にすることを意味しています。
旅行の長さは約2「長いです。ピアノを500キロの重さで持ち上げている写真のように、これは大きな重さです。なぜこれだけの重さを持ち上げる必要があるのか知りたいかもしれません。これは、金属骨格に取り付けたときにアクチュエータの移動には移動の行程を大きくする必要があるからです。そのため、ロボットの足を動かす場合、足は約150度、または2フィートを超える長さで移動する必要があります。0度から3フィートの弧度まで左右に振る。人間は10万年以上も進化した体で足の筋肉を利用することができるようになったが、リニアアクチュエータで実現するのは容易ではない。だから私が言いたいのは、アクチュエータは500 kgの重量を2インチ以上に引き上げることができるが、アクチュエータがレバーに接続されると、力は著しく低下し、レバー率に依存するが、速度は増加し、これは良いトレードオフである
テスラロボットのデモンストレーション。
2022年9月30日に発表された最新のBot演説に対するテスラ自身の見解
エレン・マスク献上:W私たちはあなたに見せるために非常にエキサイティングなものがあります。私はあなたが印象的になると思います。私は確かに私たちのOptimusロボットにいくつかの期待を設定したいと思っています。あなたが知っているように、去年はロボットの服を着た人にすぎませんでしたが、私たちはまだいません。私たちは長い道のりを歩いています。私はあなたが知っていると思います。それに比べて、とても印象的になると思います。全自動運転における人工知能の進歩と、それをより多くの用途にどのように応用するかについてお話しします人間型ロボットのような現実世界の人工知能の問題に関わることが多く、それを超えて ここテスラで私たちがしていることがAGIに有意義な貢献をする可能性があると思います。そして、私たちは公開されている会社であるため、ガバナンスの観点からそれを行う良いエンティティを実際に教えてくれたと思います。在庫のクラスとそれは一般の人々がテスラをコントロールします、そして私はそれが実際に良いことだと思います。多分私は狂っていないかもしれません私は知りません。ええ、AIオートパイロットでの進歩とDojoとの進歩について多くのことを話します。そして、チームを連れ出し、長いQ&Aを行うので、タフに尋ねることができます質問。実存的な質問が必要なものは何でも、できるだけQ&Aの時間を確保したい場合は技術的な質問をしてください。
やあみんなミラノ私はオートパイロットで作業していて、ゴムです。私はリジーなプロジェクトの機械エンジニアです。
機械的メカニズムケーブルはありませんええ私はあなたたちと一緒に参加したいです
今夜でもそれはあなたが準備ができているのを見るのは初めてでしたテスラ車で実行される自動運転コンピューターは、これが文字通り、ロボットがテザーが今夜ステージにあったのは文字通り初めてであるため、ロボットは実際に私たちがあなたに見せた以上に多くのことをすることができますそれがその顔に落ちたくなかったので、今すぐロボットが他の多くのことをしているビデオをいくつか紹介します。
ええ、私たちは過去数ヶ月にわたって私たちがやったことをもう少し見せたかった離れて、ただ歩き回ってステージで踊り、謙虚な始まりですが、自動操縦ネットワークが実行されているのを見ることができます
その新しいプラットフォームでは、それについて直接芽のために再訓練されていますそれはあなたが見ることができますレンダリングされたビューはロボットです。ロボットが見ている世界は何なのか、このようなオブジェクトを非常に明確に識別することです。オートパイロットが行ったのと同じプロセスを使用して、ネットワークをトレーニングしてデータを収集し、その後、
上半身をもう少し説明する例です
今後数ヶ月間、数ヶ月でネイタンになろうとすることをしようとすることこれは、実際にはフリーモント工場の実際の駅でもあります。
あなたが見たのは私たちがバンブルCと呼んでいるものであることを今日見せなければならないことはそれだけではありません。チームは信じられないほどの仕事をしており、実際には楽観主義者のボットを持っています
両方のアクチュエータバッテリーパック制御システムで設計された完全なテスラ歩く準備ができていませんでしたが、数週間で歩くと思いますが、ロボットと、実際に生産に入るものにかなり近いものを見せたいと思いました。そうすることはそれを引き出しましょう
オプティマスプロダクションユニットには、能力があると予想しています
すべての指を独立して親指を動かすには、2つを持っています
自由の程度で、それは反対の親指と左と右手の両方を持っているので
ツールを操作し、便利なことをすることができます。私たちの目標は便利なものを作ることです
ヒューマノイドロボットはできるだけ早く、
私たちが車の設計に使用する同じ規律は、それが可能になるように製造用にそれを設計するために言うことです信頼性が高い低コストでロボットを大量に作るので、それは非常に重要なことです。 tは知性を持っています
自分で世界をナビゲートすると、彼らも非常に高価です、そして、これは楽観的な社会であり、非常に有能なロボットですが、おそらく最終的には非常に大量のユニットで作られており、車よりもはるかに低いと予想されます。
おそらく2万ドル未満が私の推測だと思います
楽観的な可能性は非常に効果的に感謝されていると思います
いつものように、いつものようにテスラのデモが暑くなっていますだからそれは良いことですそれは良いですええ、チームが着用し、チームは信じられないほどの仕事をしました。彼らがやったことを非常に誇りに思っていることは、彼らが本当に素晴らしい仕事をしたことです私はこのチームの全体に手を差し伸べたいと思っているので、あなたは今、オプティマスを洗練するためにまだやるべきことがまだあることを知っていますそれを改善することは明らかにこれがOptimusバージョン1であり、それが本当にこのイベントを開催している理由です。何百万人もの人々とそれが好きな可能性を助けることができるように規模を拡大します。資本に制限がない時点で一人当たりの生産性は、経済がその時点で何を意味するのかは明らかではありません。豊富な未来の未来はあなたが人々に貧困がない場合
製品やサービスの面で必要なものを何でも持つことができますそれは本当に文明の根本的な変革です。明らかに、変革が肯定的で安全であることを確認したいと考えていますが、それがテスラがこれを行っているエンティティと考えている理由です。一般の人々は非常に重要であり、見落とされるべきではありません。これは不可欠だと思います。なぜなら、テスラがやっていることが好きではないなら、一般大衆がテスラで株式を購入して投票することができるからです。
これは私があなたに知って欲しいことをすることができないことが非常に重要であるように大したことです時々人々はそうではないと考えていますが、それは真実ではないので、これを実現する企業エンティティが一般の人々が適切に影響を与えることができることが非常に重要であることを知っています。私はあなたが自動運転車が確かに世界に多大な影響を与えることを知っていると言った。
少なくとも半桁の輸送の生産性おそらく、おそらくより多くのUMの楽観主義者は、実際に何が均等であるかが明らかではないように、経済的生産量の2桁の潜在的な改善があると思いますが、私たちはこれを行う必要がある正しい方法でこれを行う必要がありますそれは慎重かつ安全に、そして結果が文明にとって有益なものであり、そして私がこれができないと人類は明らかに重要であることを保証します。ここで正しいことをすることを本当に気にかけていることは常に正しいことをしたいと思っており、善意で地獄への道を支払うことはありません。そこで私たちはそれをしたいので、正しいことをしたいので、あなたは私たちに加わり、それを実現するのを手伝うことを知っています。
さて、あなたは今日いくつかのロボットを見たので、クイックタイムラインの要約をしましょう。
コンセプトですが、コンセプトは私たちをそれほど遠くに導きません。
実生活の学習をできるだけ早く入手して、出てきて皆さんのために小さなルーチンをしたロボットを手に入れてください
6か月以内に、それからソフトウェア統合ハードウェアのアップグレードに基づいて構築しましたが、それ以来数か月にわたって
並行して、私たちはここで次の世代を設計しています
ですから、この男は、私たちがすべてを活用していることがわかっている車両設計プロセスの種類の基礎に根ざしています
私たちがすでに持っていることは明らかに昨年から多くの変化がありますが、いくつかのことがあります
まだ同じです。
いくつかの理由で重要ですが、私たちが人体がどれほど素晴らしいかを考えるのに多くの時間を費やすのは楽しいです
この信じられないほどの動きの範囲は通常本当に驚くべき強さです
運動とは、指先を目の前の椅子に置くと、膨大な範囲の動きがあることに気付くでしょう
たとえば、指先を動かすことなく、肩と肘があります。それらの関節をすべて動かすことができます
その主な機能を知っているロボットは、本当に有用な仕事をすることです。
それは必ずしもそれらの自由度のすべてをすぐに必要としないかもしれないので、私たちはそれを最小限に剥奪しました
28の基本的な自由度の、そしてもちろんそれに加えて私たちの手の
人間はいくつかのことでもかなり効率的であり、他の時間ではそれほど効率的ではないので、たとえば私たちは小さなものを食べることができます
数時間自分自身を維持するための食べ物の量は素晴らしいですが、私たちがただ座っているときはいません
攻撃的ですが、私たちはちょっと非効率的です私たちはちょっと燃えるようなエネルギーなので、ロボットプラットフォームで私たちが何をしているのか
やろうとするのは、アイドル電力消費が可能な限り低くなることを最小限に抑えることです。
スイッチをフリップして、すぐにロボットが有用な仕事をするものに変わります
それでは、この最新世代についていくつかの詳細について話しましょう。
オレンジは私たちが少しでも青で私たちの電気システムで到達するアクチュエーターです
だから今、私たちは一種の人間ベースの研究を持っていて、私たちは両方とも私たちの最初の開発プラットフォームを持っています
このデザインのために引き出すための研究と実行再び、私たちはその車両のデザインを使用しています
基礎なので、デザインと分析を通じてコンセプトからそれを取り入れ、
次に、コストや効率性などのために最適化する方法に沿って構築と検証
これらは、この製品を最終的にスケーリングするための重要なメトリックであるため
私たちの部品数を減らし、可能な限りのすべての要素の消費電力を削減します。
私たちの四肢でのセンシングと配線を減らして、あなたがあなたの手と足の多くの塊を想像することができます
動き回るのが非常に困難で消費的であり、私たちは両方を集中させます
プラットフォームの物理的中心への配電と私たちの計算
したがって、胴体の真ん中には、実際には胴体です。バッテリーパックがあります。これは2.3キロワット時間のサイズです
これは約1日分の仕事に最適ですこのバッテリーについて本当にユニークなこと
パックは、すべてのバッテリーエレクトロニクスがパック内の単一のPCBに統合されているので、すべてを意味します
センシングから、充電管理と電力分布の融合からすべてのものにあります
ある場所では、車両製品とエネルギー製品の両方を活用して転がします
これらの重要な機能はすべてこのバッテリーに含まれるため、合理化された製造は非常に効率的であり、
単純な冷却方法バッテリー管理と安全性、そしてもちろん、Teslaを活用できます
既存のインフラストラクチャとサプライチェーンを作るために、私たちの脳のように進むことができます
頭の中ではありませんが、私たちの胴体にもかなり近いです。
オートパイロットハードウェアと両方を活用したいすべての車両に完全な自動運転コンピューターを出荷し、
ヒューマノイドプラットフォーム用のソフトウェアですが、要件とフォームファクターが異なるため
最初にいくつかのことを変えるので、私たちはまだ人間の脳が行うすべてをするつもりです
ビジョンデータの処理複数の感覚入力と通信に基づいて、分割された2番目の決定を行う
したがって、通信をサポートするために、ワイヤレス接続とオーディオサポートが装備されています
また、ロボットと人の両方を保護するために重要なハードウェアレベルのセキュリティ機能もあります
ロボットの周りにあるので、私たちは一種のコアができました
私たちはこの男にいくつかの手足が必要になるでしょう、そして私たちは私たちのアクチュエーターと私たちの完全なことについてあなたに少しあなたに見せたいと思っています
機能的な手も同様ですが、それを行う前に、私は少し話すつもりのマルコムを紹介したいと思います
ロボットの構造基盤[拍手]
ありがとう
テスラには、非常に複雑なシステムを完成させる機能があります。
ここでは、実際の物理的なクラッシュの上に重ねられたモデル3のシミュレーションクラッシュが
実際、このモデルの複雑さをあなたにアイデアを与えることがどれほど正確であるかは信じられないほどです
それはすべての結び目ボルトンワッシャーすべてのスポット溶接を含み、それは3500万度の自由度を持っていますそれは非常に驚くべきものです
そして、私たちがこのようなモデルを持っていなければ、私たちは世界で最も安全な車を作ることができないだろうと言うのは本当です
ロボットに影響を与えるために、自動車側からの能力と方法を活用できますか
さて、モデルを作成でき、クラッシュソフトウェアがあったので、ここで同じソフトウェアを使用しました。
これの目的は、それが理想的には倒れていないことを確認することですが、それは表面的なダメージではありません
たとえば、ロボットの脱臼した肩に相当する腕でギアボックスを壊したくありません
修正が困難で高価なので、私たちは与えられた仕事に取り掛かりたいと思っていました
同じモデルを採取することもでき、以前に解決されたモデルからの入力を使用してアクチュエーターを駆動できる場合
それを生き返らせるので、これはロボットにこれらをしてほしいタスクの動きを生み出しています
タスクは、一連のタスクが何であれ、2階を歩いてしゃがみ込んでいる箱を拾い上げています
モデルこれは単純な歩行を示しています私たちは私たちを助けるすべてのコンポーネントにストレスを作成することができます
コンポーネントを最適化これらは踊るロボットではありません
実際、モーダルの動作ロボットの最初の5つのモードと通常、人々がロボットを作るとき、彼らは確実にします
最初のモードは、10 hertzに向かって上位のシングルフィギュアの周りに上がっています
誰がこれをするのか、歩行のコントロールを簡単にすることは、あなたが保証できないなら歩くのは非常に難しい
あなたの足がぐらつき、それは1つのロボットを作っても大丈夫です私たちは何千もの数百万を作りたいです
炭素繊維チタンからそれらを作るという贅沢はありません。
とても硬いので、これらの高いターゲットを持つことはできません私はそれらを愚かなターゲットと呼びます
私たちはそれらをより低いターゲットで動作させる必要がありますので、それについて考えればそれはうまくいくでしょう
これは、私たちは水浸しのゼリーと骨の袋だけで投げ込まれています。
私の足は10 hertzで振動しません私たちは低頻度で動作しますので私たちは
ロボットが実際にコントロールを難しくすることができることを知っているので、これからモーダルデータと
それを歩くことを可能にする制御システムにそれを剛性と供給
税金を少し変えるだけで、私たちはそこからインスピレーションを得ることができます
生物学と私たちは、膝の機械的な利点が実際にはかなり表現していることがわかります。
4つのバーリンクと同様に、それは非常に非線形であり、実際には驚くことではありません。
膝のトルクを膝のトルクに曲げると、曲がっているときはずっと多いと思います。
まっすぐなので、あなたは非線形機能を期待するでしょう、そして実際に生物学は非線形です
これは非常に正確に一致するので、それが4つの表現です
リンクは明らかに物理的には4つのバーリンクではありません。特徴は似ていると言ったので、私はそれを賭けています
あまり科学的ではないもう少し科学的になろうと私たちはこのグラフを通してすべてのタスクをプレイしましたが、これは
私たちがストレスについてしたと言ったタスクをしゃがむ歩行のピケットを見せているのですが、それがええと、
水平軸の膝に対する膝は、膝がこれらすべてを行う必要性を示しています
タスクを実行してから、ピークの上部にサーフィンをすることでカーブをかけます。それはこれが必要なものだと言っています
ロボットにこれらのタスクを実行させます
したがって、実際には緑の曲線である4つのバーリンクを見ると、
4つのリンクが実際に線形化されている力の特性は、実際に言っていることが力を下げたということです
それがアクチュエータが可能な限り低い力を持っている理由です。
青い曲線は何ですか?
ここに私の足から突き出て、アクチュエータを装着してシンプルな2つのバーリンクがあります
それはあなたがシンプルな2バーリンクでできる最善のことであり、それがより多くの力を生み出すことを示しています
効率的ではないアクチュエーターなので、実際にはどのように見えますか
あなたが見るように、あなたが見るように、それは膝に非常にしっかりとパッケージ化されていますあなたは良いものを見る
1秒で透明になると、アクチュエータで動作しているフルバーリンクが表示されます。
アクチュエータの力と変位を行い、今あなたをコンサートに渡します
だから私は私はあなたにデザインプロセスとアクチュエーターについて話したいと思います
私たちのロボットのポートフォリオuhなので、
パワートレインデザインに関しては、車とロボットがここで重要な最も重要なことはエネルギーの質量とコストです
私たちは車からロボットにデザインエクスペリエンスのほとんどを引き継いでいます
したがって、特定のケースでは、2つのドライブユニットとドライブユニットのある車が表示されます
時刻0〜60マイルの車を加速するか、運転するために使用されます
都市は28のアクチュエーターと28のロボットと
アクチュエータレベルでのタスクは何なのかは明らかではないので、タスクがあります
階段や登山、または翻訳する必要がある重い物を運ぶような高レベルです
ジョイント仕様へのジョイントしたがって、モデルを使用します
それは私たちの関節のトルク速度軌跡を生成します
その後、私たちの最適化モデルに供給され、実行されます
最適化プロセスこれは、
ロボットは回転して歩いていることができるので、このトルク速度があるとき
私たちはアクチュエータの効率的なマップの上に置いた軌跡で、私たちは一緒にできます
消費電力とエネルギー蓄積を生成するための軌跡
タスク対時間のエネルギーを使用すると、システムを定義できます
特定のアクチュエータのコストとクラウドに簡単なポイントを入れてから
これは、クラスターと赤い線で解決することにより、数十万のアクチュエーターのためにパレートの前面を示しています
Xが示すように最適なものを探す優先領域はどれですか
この特定のジョイントのために選んだ好ましいアクチュエータのデザインなので、今度はすべてのジョイントに対してこれを行う必要があります
最適化する28のジョイントがあり、クラウドを解析します。すべてのジョイントに対して再びクラウドを解析します
今回のスペックと赤い軸は、すべてのオーダーメイドのアクチュエータのデザインを示しています
ここでの問題は、ユニークなアクチュエータのデザインが多すぎることと
私たちがまだ対称性を利用しても、何かを作るには多すぎます
製造可能なユニークなアクチュエータデザインの量を減らすことができる必要があるので、何かを実行します
今回は再びクラウドを解析する共通性研究と呼ばれます
同時に複数のジョイントの共同パフォーマンス要件を同時に満たすアクチュエーターなので
結果として生じるポートフォリオは6つのアクチュエーターであり、カラーマップに中央の図を表示します
ええと、アクチュエータはこのスライドでも見ることができます3つのロータリーと
3つの線形アクチュエーターはすべて、質量あたりの優れた出力力またはトルクを持っています
特にロータリーアクチュエーターには、高速側の角度接触に統合された機械的なクラッチがあります
ボールベアリングと高速側と低速側のクロスローラー
ベアリングとギアトレインはひずみ波ギアであり、3つの統合センサーがあります
こことオーダーメイドの恒久的な磁石機械線形アクチュエーター
リニアアクチュエータには惑星ローラーと逆惑星のねじがあります
効率と圧縮、耐久性を可能にするギアトレインとして
したがって、私たちの線形アクチュエーターの力能力を実証するために
その限界の下でテストするために実験を設定しました
そして、私はあなたにビデオを楽しませます
そのため、アクチュエーターは持ち上げることができます
ハーフトーンナインフットコンサートグランドピアノ
そして
これは要件ですそれは私たちの筋肉ができるので、持っているのはいいことではありません
それらが直接駆動されたり、四頭筋筋が同じことをすることができるときに直接駆動されるときも同じ
膝が力を変換するアップギアリンクシステムであるというだけです
私たちの丘の端エフェクターの速度に、
人体の敏ility性なので、これは人体について驚くべき主なものの1つです。
この時点で私の役割を締めくくり、私はあなたに手について話すつもりだった同僚のマイクを歓迎したいと思います
デザインありがとうございましたコンスタンティノス
ですから、人間とヒューマノイドのアクチュエータがどれほど強力であるかを見ました
人間も信じられないほど器用です人間の手は動く能力を持っています
毎秒300度で数万の触覚センサーがあります
そして、それは私たちの日常生活のほぼすべてのオブジェクトを把握して操作する能力を持っています
私たちのロボットハンドデザインのために、私たちは生物学に触発されました。
私たちの指は、柔軟で強い金属腱によって駆動されます私たちは広く完成する能力を持っています
開口部の電力は、小さな薄くて繊細なオブジェクトの精密な握りのために最適化されているが
だから、なぜ人間のようなロボットの手がうまくいっているのは主な理由だからです。私たちの工場と私たちの周りの世界は
人間工学に基づいているように設計されているので、それが意味するのは、工場のオブジェクトが把握できることを保証することです
しかし、それはまた、私たちが今まで見たことがないかもしれない新しいオブジェクトが、人間の手と私たちによって把握される可能性があることを保証します
ロボットの手も同様に、これらのオブジェクトは私たちの手に設計されていると言っているので、かなり興味深いです
新しいオブジェクトに付随するために私たちの手に変更を必要とする代わりに
私たちの手に関するいくつかの基本的な統計は、6つのアクチュエーターと11の自由度があるということです。
指を駆動してセンサーフィードバックセンサーフィードバックを受信することは本当に重要です
私たちが把握しているオブジェクトについてもう少し学びましょう。
私たちの手は宇宙にあります私たちの手の重要な側面の1つは、それがこの適応性を適応的にしているということです
基本的に、手が把握されているオブジェクトに適応できるようにする複雑なメカニズムとして関与しています
別の重要な部分は、このクラッチメカニズムが保持できるように、バック以外の運転可能な指駆動があることです
そして、私たちがどのように進んだかを聞いたばかりのハンドモーターをオンにすることなくオブジェクトを輸送します
Tesla Botハードウェアの設計に進みました。これをミラノと私たちの自治チームに引き渡して、これをもたらします
ロボットトゥライフマイクに感謝します
大丈夫ええと、ビデオで前に示したすべてのクールなものが投稿されました
過去数年にわたってオートパイロットを行った驚くべき言葉のおかげで、ほんの数ヶ月で可能です
これらのコンポーネントのほとんどは、あなたがそれについて考えれば、ボット環境に非常に簡単に移植されました
車輪のロボットから脚のロボットまで、それらのコンポーネントの一部はかなり似ており、他の一部は必要です
より重いリフティングそうなので、たとえば私たちのコンピュータービジョンニューラルネットワーク
オートパイロットからボットの状況に直接報告されていますそれはまったく同じ占有ネットワークです
ここでボットで実行されているオートパイロットチームで、後でもう少し詳細に話しかけていること
このビデオは本当に変更された唯一のことは、私たちが思い出さなければならなかったトレーニングデータです
また、あなたの輝きフィールドで作られた作業を使用して得るためにこれらの占有ネットワークを改善する方法を見つけようとしています
たとえば、ボット環境の本当に大きなボットレンダリング
マシンは、ボットが対話しなければならないかもしれないと読んでください
考えるべきもう一つの興味深い問題は、主にそのGPSのシグナルの感覚を持つ屋内環境にあります。
たとえば、最寄りの充電ステーションを見つけるために、目的地に移動しようとしているので、トレーニングを受けています
高頻度を識別するためのより多くのニューラルネットワークは、
ボットカメラは、ボットがその環境に移動すると、時間の経過とともにフレーム間でそれらをストリーミングして追跡します
そして、私たちはそれらのポイントを使用して、その環境内のボットのポーズと軌跡のより良い推定を取得します。
歩いています私たちはまた、かなりの仕事をしました
シミュレーション側で、これは文字通りロボットの移動を統合したオートパイロットシミュレーターです
これは、オペレーターシミュレーターシミュレーターで実行されているモーションコントロールコードのビデオであり、
ロボットの進化は時間の経過とともに歩きますので、ご覧のとおり、4月に非常にゆっくりと始めて加速し始めます
過去数か月にわたって腕のバランスをとるなど、より多くの関節とより深い高度な技術のロックを解除するにつれて
したがって、運動は特に1つのコンポーネントです。これは、車からボットに移動すると非常に異なります。
環境なので、もう少し深さを保証すると思います。同僚にこれについて話し始めてほしいと思います。
今は外国人
こんにちはみんな私はフェリックス私はプロジェクトのロボット工学エンジニアであり、私は歩くことについて話すつもりです
簡単な右の人々は毎日それをしているようですあなたはそれについて考える必要さえありません
しかし、たとえば、エンジニアリングの観点から挑戦している歩行にはいくつかの側面があります
自分の良い表現を持つことを意味する身体的自己認識
手足の質量あなたの足のサイズは何ですか、あなたもエネルギー効率の良いゲートを持っている重要です
さまざまなスタイルのウォーキングがあり、それらのすべてが等しく効率的であると想像できます
最も重要な維持バランスは落ちないでください、そしてもちろん動きも調整します
あなたのすべての手足のうち一緒にいるので、今では人間はこれをすべて自然に行いますが、エンジニアやロボット奏者として私たちは持っています
これらの問題について考えること、そして私たちが私たちの移動計画と制御においてそれらにどのように対処するかをあなたに示すつもりなら
積み重ねて、運動計画と債券の表現から始めます
ロボットの運動学のダイナミクスと接触特性のモデルとそのモデルと目的のモデルを意味します
ボットのパス私たちの移動プランナーは、システム全体の参照軌跡を生成します
これは、モデルの仮定に関して実行可能な軌跡を意味します
プランナーは現在、3つの段階で動作します。足音の計画を開始し、モーション写真システム全体で終了します
そして、これがどのように機能するかを少し深く掘り下げましょう。このビデオでは、計画よりも足音が計画されているのがわかります
希望のパスに続いて地平線があり、私たちはこれから始めて、その後
人間と同じように、つま先をオフにしてストライキを獲得して、これらの足跡をつなぐ軌跡
そして、これは私たちにシステムの高効率のために大きな歩幅と膝の曲がりを減らします
最後の段階は、大量の軌跡の中心を見つけることです。
私たち全員が計画が良いことを知っているので、バランスを保つシステム全体
また、実際にそれらを実現する必要があります
[拍手]ありがとうフェリックスこんにちはみんな私の名前
アナンドですか、私はコントロールについてあなたに話をするつもりですので、フェリックスのモーションプランを見てみましょう
実際のロボットに現実の世界に話しかけて、何が起こるか見てみましょう
それはいくつかのステップを要し、それは少し残念です
しかし、私たちはそれを機能させるいくつかの重要な作品をここに欠けています
フェリックスが言及したように、モーションプランナーは理想化されたバージョンを使用しています
それ自体とそれの周りの現実のバージョンこれは正確ではありません
また、軌跡やレンチの枝を通して意図を表明します
それが世界に運動したい力とトルク
現実は、類似のモデルよりもはるかに複雑です。ロボットはそうではありません
簡略化されたバイブレーションとモードコンプライアンスセンサーノイズなど
そして、あなたが現実の世界にボットを置くとき、それは現実の世界に何をしますか
まあ、予期しない力は、プランナーが本質的に知らない、そしてそれは本質的にモデルのダイナミクスを引き起こします
特に、二重運動のように動的に安定しているシステムに不安定化を引き起こします
だから私たちはそれについて何ができるか、私たちはセンサーを使用している現実と私たちの理解を測定します
ここで私に国家の推定とステータスを行う世界は、態度と骨盤のポーズを見ることができます
本質的には、ロボットが歩いているときに追跡される大量軌道の中心とともに、人間の前庭系
オフィス環境には、必要なすべてのピースがあります
ループを閉じるために、より良いボットモデルを使用して、現実の理解を使用します
私たちは州の推定を通じて得たものであり、私たちが望むものと私たちが期待するものと私たちが期待するものを比較しました
現実は、
ここのロボットここロボットは確かに突き出されていることに感謝していませんが、そうではありません
直立しているという見事な仕事ここでの最後のポイントはロボットです
散歩だけでは手と腕を使う必要があります
役に立つ操作について話しましょう
[拍手]
みなさん、こんにちは私の名前はテスラボットのエリックロボティクスエンジニアです。話したい
ロボットが現実の世界で物事を操作する方法について私たちはオブジェクトを操作したいと思っていました
できるだけ自然に見え、すぐにそこに着くので、私たちがやったことは
このプロセスを2つのステップに分けています。
それらをデモンストレーションと呼んでから、これらのモーション参照をオンラインで現在の現実世界の状況に適合させました
それで、私たちはオブジェクトを拾うという人間のデモを持っているとしましょう。
手の場所を表すキーフレームの束としてここで視覚化されたデモンストレーション
肘を胴体を使用して、逆運動学を使用してそれをロボットにマッピングできます。
これらの多くは今、私たちは一緒に作業できるライブラリがありますが、単一のデモはそうではありません
現実世界に広がる変化、例えば、これは非常に特殊な箱にしか適用されません
場所があったのでもう一つ作りました
トラック・オプティマイザ、手がどこにあるべきかを解決するロボットのバランス
動作を現実世界に適応させる必要がある場合、例えば
ボックスがこの位置にある場合、最適化器は作成されます
次はミラノで話し合います
オプティマス次はどうするラリー
はい、だから私たちが過去数ヶ月間に何をしてきたのかをよく知ってほしいです。
ええ、私たちはいくつかの役に立つことを始めましたが、遠くて役に立たない--まだ長い道のりがあります
私たちの前では、うん、次の数週間での最初のことは、少なくともオプティマスを得ることだと思う
Bumble Cと同様に、あなたが以前見た別のバグプロトタイプ、Beyondもあるかもしれませんが、私たちも始めます
私たちの工場の実際の使用例に焦点を当て、本当にこの問題を解決しようとしましたが、私はすべてを使い切ってしまいました
前述の現実世界におけるこの製品の導入に必要な要素
うん、室内ナビゲーションは管理やサービスのすべての人にとって優雅であることを知っています。
製品の規模を拡大するために必要なコンポーネントですが、私はあなたの状況を知りませんでしたが、その後
今夜のショーを見て、私たちは次の数ヶ月か数年以内に完成できると確信しています。私は
この製品が現実になり、経済全体を変えたので、Optimusチーム全体に感謝します
この数ヶ月の仕事はとても不思議だと思います。これはわずか6、8ヶ月で完成しました。ありがとうございました。
非常に[拍手]
ありがとうございました
やあ、私はアショーク、私はミラノと一緒に自動運転チームを指導して、神様、それを超えるのは難しいです
オプティマスの部分は彼がどうしてもやってみる
ええ、ここ数年で製造されたテスラはすべてあると思います
自動車を自動運転させるハードウェア私たちはソフトウェアを開発してきました
昨年の今頃、私たちはますます高い自主権を増やしました
その時から、約2000台の車が私たちのFSDテスト版ソフトウェアを運転していました
ソフトウェアのロバスト性と機能を向上させ、これまでに16万人のお客様に提供してきました
はい[拍手]
これは無料ではありません。エンジニアリングチームの過去1年間の汗と血から来ています。
例えば昨年は75000のニューラルネットワークモデルを訓練しました
8分ごとにモデルが出てきて、チームから出てきて、それを評価します
クラスタ、そして私たちは281モデルの本当に自動車の性能を高める車種を発売します
この革新的な空間はスタック全体で計画ソフトウェアが発生している
インフラストラクチャ・ツールは雇用さえすべて進歩している
FSGテスト版ソフトウェアは、ナビゲーションできるはずの車を完全に運転することができます
駐車場から駐車場への疾病管理・予防センターへの信号と駐車標識駐車
交差点を曲がる際の物体との交渉など
これらはすべて、私たちが車で動作するニューラルネットワークを介したカメラの流れに由来しています
サーバや自動車上で動作しているものには戻らず、世界モデルを形成するすべての出力を生成します。
自動車の周りでは、計画ソフトウェアはこれに基づいて自動車を駆動する
今日は、システムを構成する多くのコンポーネント、つまりネットワークの占有を基礎として議論します
システムの幾何学的レイヤーこれはマルチカメラ映像神経です
画像から全世界の物理占有率を予測するネットワーク
ロボット、だから物理的に存在するもの、木の壁、建物、自動車の壁、何
あなたは知っていますか?それが具体的に存在するかどうかを予測して、それはそれらとそれらの未来の運動を予測しています
幾何学的な基礎の上に、私たちはより多くの意味層を持っています。
道路をナビゲートするにはもちろんレンズが必要ですが、道路にはたくさんの
さまざまなチャネルがあり、さまざまな方法で接続されているため、一般的なコンピュータでは非常に難しい問題です
平面集合とその連結性を予測する視覚技術により、言語に深く入り込むことができます
テクノロジー、そしてコンピュータビジョンだけでなく他の分野から最新のテクノロジーを取り入れてこのタスクを遂行します
車両には、それらを制御するために完全な運動状態が必要です
これらはすべてニューラルネットワークのビデオストリームから直接ネットワークに流れ込んで多くの
処理して、完全な運動状態、位置決め速度、加速度、これらすべてを出力します。
ネットから直接出てきて、最小限の後処理しか必要ありません。これは私にとって本当に面白いです。なぜなら、
これは私たちがどのような世界に住んでいるのかさえも考えられます。これらのネットワークは第4位を予測しています
これらの物体を検出することさえできないと考えられている場合、これらの位置の導関数
無料ではありませんが、大量のデータが必要なので、複雑な自動タグがあります
元のセンサデータでスキャンするシステムは、
サーバが高価なニューラルネットワークを実行するためには、情報をタグに抽出するために数時間かかることがあります。
その上で、私たちのシミュレーションシステムを使って統合します
画像を作成します。これはシミュレーションなので、通常はすべてのラベルが付いています
これらはすべて潤滑性の良いデータエンジン配管を通っています
いくつかのデータを使ってベースラインモデルを訓練し、それを車に運び、故障が何であるかを見てみましょう。一旦故障が分かったら
艦隊を掘削し、適切なラベルを提供できないことを特定し、訓練セットにデータを追加しました
このプロセスは問題を系統的に解決し、私たちは車で実行するすべてのタスクに対してこのようにしました
はい、これらの新しい大規模なニューラルネットワークを訓練するために、今年は訓練インフラを約
40%から50%ですので、今日は複数の
米国でクラスタを訓練し、人工知能コンパイラも開発した
これらのニューラルネットワークに必要な新しい動作をサポートし、最良の底辺にマッピングします
ハードウェアリソースと私たちの今日の推理エンジンを配布することができます
船上の2つの独立系の単一ニューラルネットワークは、本質的には2つの相互接続された独立したコンピュータである
シンプルな自動運転コンピュータでは、これを実現するためにエンドツーエンドを厳格に制御する必要があります
この新しいシステムの遅延により、FSDプラットフォーム全体により高度なスケジューリングコードを導入しました
これらのすべての車の中で動作するニューラルネットワークがベクトル空間を生成し、これも
ロボットや車の周りの世界、そして計画システムをその上で実行し、軌跡を得る
モデルベースの最適化された組み合わせを使用して、衝突を回避したり目的地にスムーズに到達したりする
さらに、迅速な最適化に役立つニューラルネットワーク
今日、私たちは本当にこれらの分野のすべての進展を紹介することができて嬉しいです。私たちにはエンジニアリングリーダーが待機しています
これらの異なるブロックとこれらの動力を説明してください。自動車だけでなく、同じ部品もオプティマス上で動作しています。
ミラノで以前展示されていたロボットについて、私はチームが計画部分の議論を始めることを歓迎します
こんにちは、parel jointです。このクロスシーンを使ってみましょう
この交差点に近づくために自動運転機で計画と意思決定を行う方法を直接探究します
小さな通りで、私たちが入る前に
交差点の反対側の歩行者は横断することにした
横断歩道を使わずにこの歩行者に対して右から車にまで譲る必要があります
歩行者と交差点の反対側の車両との関係も理解しています
私たちが素早く解決する必要があるオブジェクト内の依存関係の多くが
人間は本当に得意だということです場面を見てみるとあらゆる相互作用が最も評価されると
有望なものとして、一般に合理的なものを選択する
これらの相互作用のいくつかを見てみましょう自動操縦システムがこれを前にして
側面のプロファイルで非常に攻撃的な発射をする歩行者は明らかに私たちは、
歩行者と私たちは、ペデストリアンと彼の可愛いペットを、ゆっくりと前進させることができただろう
歩行者歩行者と車との間の隔たりのために私たちは車のジャークになり
右側からのものですが、これが使用可能な安全な相互作用のみである場合には、この対話を拒否するべきではありません
最後に、私たちは、最初はゆっくりと時間を見つけることを選択することを選択した
すべてのエージェントがパスした後で、操作を終了し、終了します。
これらの相互作用のすべてを評価することは特にモデリングに関心を持っているときには些細なこと
他の薬剤に対するより高い導関性 ( 例えば、縦方向のものなど )
純粋に衝突チェックに頼るときに、右からの車が要求する車が必要とするジャーク
モジュール式の予測は、有効な相互作用の多くを見逃すことになるため、これまでに得られるものだけです。
これは基本的に、エゴの軌道上でのマルチエージェント・ジョイントの軌道計画問題を解決するために基本的に低下する。
他のすべてのエージェントはどれだけの速さでどれだけの速さで最適化できるか
この最適化問題を実行すると、多くのインクリメンタル近似が発生した後でも、 10 ミリ秒の順序で閉じられます。
現在では、典型的な混雑する予測不能な左には、それぞれ 20 個を超えるオブジェクトが
複数の異なる将来モードを持つオブジェクトの場合、関連する対話の組み合わせの数が増加します
プランナーは 50 ミリ秒ごとに決断を下す必要がありますこれをリアルタイムで解決するためには
相互作用探索と呼ばれるフレームワークに依存していますこれは基本的には並列化された研究の集まりです
ここでの州間の移動は、キネマティックのエゴの運動的状態に対応する
他のエージェントの状態 ( 名目上の将来の複数のマルチモーダル予測と、シーン内のすべての静的エンティティー )
行動空間は物事が面白いということで、私たちは一組の機動的な軌道を使う
多数の間分の決定について分岐する候補者と、より長い間のインクリメンタル目標について
ホライズン・マニューバ、ウォーク・スルー・ウォーク・ウォーク・ウォーク・ウォーク・ウォーク・ウォーク・ウォーク
私たちは、これらが表現されるものとして、視界を移動することによって、次のようなビジョン測定
これを使用してゴールのセットを作成するだけでなく、潜在的な機能と同様に、スパースの抽出
以下に対応するレーン・ネットワークまたは非構造化領域からの再度のレーンの候補
私たちがこれらの金の束を持っていると、人間のデモに由来する確率マスク
私たちは、古典的な最適化のアプローチとともに、私たちの方法を組み合わせることによって、シードの軌道を作る
ネットワーク・プランナーは、顧客フィードからのデータを再トレーニングしてから、これらの無料のデータを取得します。
私たちはこれらの軌道を利用して、最も重要な相互作用を発見する相互作用の分岐を開始します。
私たちの場合、これは、私たちがそれの前で主張するか、またはそれに屈するかどうかという、歩行者に対する相互作用であると考えられる
当然左側の選択肢は高率の選択肢で、優先順位を付けない可能性が高いため、当社支店をさらに追加することができます
この最適化を実現するためのより複雑な相互作用をより多くの複雑な相互作用をもたらすという選択肢があります
問題は徐々に多くの制約を伴うもので、その研究はより多くの相互作用分岐への分岐を維持する
より多くの目標はこのノードのそれぞれの評価においてうそをつく
それぞれのノードの内部での研究が始まったのは
私のような制約が段階的に追加されるという古典的な最適化手法を用いた軌道
これはかなり良いものだとしても 1 回につき 1 ~ 5 ミリ秒で 1 ~ 5 ミリ秒近くかかるでしょう
100 を超える対話を評価しない場合、これはスケールしません。
そこで私たちは軽量の照会可能なネットワークを構築しプランナーのループで走らせることができました
これらのネットワークは、フリートからの人間のデモンストレーションで訓練され、リラックスした時間制限を持つオフラインのソルバーと
これを使ってランダウン・ランタイムを 1 つのアクションにつき 200 マイクロ秒まで下げることができました
これだけでは十分ではありません今でも十分な研究が必要なので十分ではないのです
検索スペースを効率的に整理する必要があります。そのためには、各項目のスコアを設定するために、
これらの軌跡のいくつかはかなり標準的なものですが衝突チェックの束をたくさんすることでジャークというものを分析します
顧客のフリート・データが、ここでも重要な役割を果たすために、実際に必要とされるものが必要です。
私たちは 2 セットの軽量の変量ネットワークを運営していますこれらのネットワークの 2 つのセットを
FST のベータフリートからの介入で、結果として得られるものとしてのスコアを提供する
次の数秒の間に介入し、 2 番目は人間の行動に起因する人間のデータを提供することに依存している
人間の推進された軌道に与えられた選択された行動がどの程度近くにあるかについての得点
得点は、相互作用をさらに分岐させ、計算を集中させ続けるために、探索空間を整理するのに役立つ
最も有望な結果は、これについての冷静な部分である
アーキテクチャーとは、お客様がお客様が提供するデータ・ドリブン・アプローチの間にクールな混合を
多くの手で設計されたコストに依存する必要はなく現実に物理学に基づく検査でそれを基盤にしているのです
私が説明したことの多くは現場で観察できるものと同じものでした
フレームワークは、 8 つのカメラからのビデオ・フィードを使用する、その背後にあるオブジェクトに拡張する
世界の 3D 占有率を生成するために、ここにある青色のマスクは
可視性領域は基本的に最初にブロックされるという
あなたがこの可視性マスクを消費するシーンではゴースト・オブジェクトと呼ばれるものを生成します
産卵地域をモデル化しこの幽霊の状態遷移をモデル化した場合には上に見える
制御応答を調整している場合には , オブジェクトが正しく
その存在の可能性の関数はとても良い人間のような行動を引き出すことができます
これらの占有ネットワークをどう生成するかについて詳しく説明するためにこれを記入しておきます
私の名前はフィル・フィル私が過去 1 年間に構築した占有ネットワークの詳細を共有します
このネットワークは私たちの車の周囲の 3D で物理的な作業をモデル化するための解決策です現在は
お客様が視覚化しています。ここでご覧になるのは、社内開発ツールの道路ネットワーク出力です
稼働中のネットワークは 80 台のカメラのビデオ・ストリームを入力として単一の統一されたボリュームを生成します
私たちの車の周りのすべての 3D ロケーションに対して、ベクトル空間に直接占有すること
ビデオの接触があることから、その場所が多く占有されている確率を予測する
瞬時に眼中にある障害物を予測することができる
それぞれの場所ごとに、カーブ・カー・歩行者などの一連のセマンティクスが生成されます。
ここに色分けされている色の低いデブリス
モデルが一般化されたネットワークであるため、占有フローも動作に対して予測される
静的オブジェクトと動的オブジェクトが明示的に生成されることを示すことはありません。
ここにスイング・トレーナーのようなランダムな動きをモデル化する
このネットワークは現在、すべてのテスト環境で FSD コンピューターを使用して実行されています。
私たちの神経加速器を使って 10 ミリ秒ごとに非常に効率的な実行を
このようにして、各カメラ画像を最初に再認証するアーキテクチャを見てみましょう。
カメラの校正と画像が表示されたのはネットワークに与えられたもので
典型的な 8 ビットの RGB イメージです一番上にある画像から分かるように
12 ビットの生の写真の画像をネットワークに提供することで 4 つの
より多くの情報を、 16 倍のダイナミックな範囲に加え、削減された
アドビの ISP が間違っていないため、レイテンシはもう一組のレコードを持っていて、
FPS をバックボーンとして画像スペースの機能を抽出し、次の 3D 位置を構成します。
キーおよび値がアテンション・モジュールに適合するように、 IMG スペース・フィーチャーを使用して照会する
アテンション・モジュールの出力は、高次元の空間処理機能です。
これらの特殊機能は、一時的に車両のオードメトリーを使用
この空間的時間的特徴の最後の動きを引き出す
最終的な占有率と占有率のフロー出力を生成する D 畳み込みのセットを通して
それらは固定サイズのボクサー・グレーとして形成されており、制御上の計画に十分なほど正確ではない
高解像度を得るためには、 1 ボクセルのフィーチャーマップにも生成します。このマップは、 3D 空間で MLP にフィードされます。
任意の位置に位置と意味を取得するための照会をポイントします
このモデルをよく知ってから別の例を見てみましょう右側には関節バスがあります
バスの出発点として、ここでは L 字形のボクサーとして強調されている
まず、カートの前面を青で回転させて、前頭型バスがゼロを持つと予測されるモデルを青で示します
占有率フローと s-バスが、バス全体を青に移動させる
そしてネットワークがバスの正確な曲率を予測していることも分かります
これは従来のオブジェクト検出ネットワークにとって非常に複雑な問題です私がこの問題を
1 つのキュボイドを使用するか、曲率に適合するためには 2 つを使用するが、占有ネットワーク
私たちが気にしているのは目に見える空間の中の占有物なので正確に曲率をモデル化することができます
ボクセルのグレードの他に、占有ネットワークはドライブリの表面を作る
乾燥した表面には、 3D 幾何学と意味構造の両方があるが、それらは特に治癒においてコントロールが非常に有用である
曲がらみのある道路が曲面を曲がらり、ボクセル・グレーはその代わりに独立している
ボクセルのグリッドは実際にはここで暗示されていますヒーローのクエストにあります
予測されている表面の 3D 形状を見ることができます
プランナーは、この情報を使用して、ヒルクレストのためにさらにスローダウンする必要があるかどうかを判断することができます。また、
ボクセルの等級が表面で一貫して君臨していることを見る
Box のソースと表面に加えて私たちも最近のニューラル・レディング・フィールドでの突破口に興奮しています
私たちは両方とも光の色の特徴を取り入れています
ネットワーク・トレーニング、および Nerf の入力状態としてのネットワーク出力を使用することによる
アショクは非常に興奮していますこのことが彼の個人的な週末のプロジェクトとしての彼の
これらの神経を基にしています私はアカデミアがこれらの神経を
ファウンデーションは、言語のための大容量データ・セットのように、言語のためのモデルを開発しますが、視覚神経
コンピュータ・ビジョンの基盤モデルを提供することになりますなぜならそれらは幾何学や幾何学に基づいて
これらのネットワークを監視し、オントロジーを定義するための要件の凍結を提供します。
これらの画像を区別するために監督は自由ということになります未来のことを考えると
画像が入ってくるということを知っているということでネットワークが一貫性を生み出し
私が観察したすべての像に対して異なる表現になる場面の容積表現
個人的には未来のコンピュータ・ビジョンの未来だと思いますが今は私たちが初期の作業をしているのは分かっていますが
テスラそしてアカデミアでの未来について考えてみましょう
1 つのシュトツ予測というのは容積率の大きさの組み合わせです
私の個人的な賭けによる性的賭けですこれは初期の結果の
3 次元のデータから 3D レコンストラクションを提供する代わりに、画像空間における RGB の完全再投影に焦点を当てます。
1 次目標は、警告 3D スペースを正確に表現することで、これをすべての目的に対して実行したいと考えています。
あらゆる天候や照明の環境における世界のデータを無料で提供することができます
問題を解決するために皆さんを探していますそして最終的には占有ネットワークが訓練され
大きな自動レベルのデータセットを持っている人がいない状態で私はティムに話をします
このネットワークを訓練するために必要なのはフィル
[ 拍手 ] 誰もがトレーニングの話をします
2 つのビデオを見てきました 4 つか 5 つのビデオをご覧になっています
より多くのクリップスについてもっと心配したいと思っています
フィルだけの占有するネットワークが動画を撮るだけで 14 億人
ネットワークを訓練するためのフレームがありますもしあなたが見たものをネットワークに 1 万本持っていたら 1 時間はかかるでしょう
もし 1 つの GPU があるとしてもそうでない GPU が 1 万時間かかると
訓練の仕事が正しい速さで走るのを待つことができる人間の時間というのは
平行線に行く必要があるということですこれにはもっと計算が必要なので
スーパーコンピュータを構成するスーパーコンピュータを 3 つのスーパーコンピュータを作り
14000 gpus のうち、 10 000 gpus を訓練用に使用し、約 4 千個を使用します。
これらのビデオの自動ラベル付けのための gpus は、分散管理されたビデオの 30 ペタバイトに保存されている
お客様のデータ・セットを、お客様の考え方と同様に、固定されたものとして考えるべきではない
100 万フレームの画像を使っていると想像してみてください非常に流動的なものとして考えなければなりません
これらのクラスターを 1 日ごとに 50 万以上のビデオが集まり
これらのビデオピソンビデオのインスタンスを毎秒 400 万個追跡しています
これは私たちが捉える必要があるということです保存政策を支配するためには
分散されたビデオ・キャッシュは、これらすべてが膨大な量のインフルなものであり、これらはすべて、私たちが構築して管理する
家では 40 000 を買えるだけではない
あと 30 ペタバイトのフラッシュ mvme をつなぎ合わせ、それを一緒にするだけで、実際には実際には多くのことを実行する
仕事をしたいと思いますが実際には皆さんが実際にやりたいことは
GPU や Dojo になるかもしれませんこれは後でお話ししますが
システムのすべての部分に障害を発生させたいということを意味します。
この加速器をアウトパフォームする必要がありますこれは非常に複雑なので
お客様のストレージが、すべてのデータをノードに配信するために必要なサイズと帯域幅を確保する必要があることを意味します。
これらのノードは、機械学習にフィードするための CPU とメモリーの適切な量を必要とする必要があります
この機械学習フレームワークは GPU に引き渡す必要がありますそしてトレーニングを始めますが
信頼できる方法で数百または数千の GPU を使用する必要があります
logstap という方法で高速で接続する必要があります相互接続が非常に複雑になることもありますが
2 番目の点で道場についてお話したいと思います
私たちがクラスターで行った最適化は多くのビデオを利用して
ビデオはとても似ています映像やテキストについてのトレーニングとは全く違いますビデオはとてもよく確立されていると思います
文字通りより複雑なものになりますそれが私たちが終わらせる必要がある理由です
ストレージ層を加速して加速度を最適化することができますなぜなら光子の数を訓練しているからです
私たちのフリートから直接来ているビデオでは、私たちが直接列車を乗せるようなビデオは、全く投稿していない
私たちが選択した枠の中にあるものを探しているものを
彼らが依存しているフレームは iFrame やキーフレームで共有され共有されるものにします
メモリは GPU からのダブルバーへと移動し、ハードウェアのデコーダを使用するだけで、
実際に GPU 上でビデオを解読していますこれは非常に良いニシキのニシキのピートンピトルクの拡張です
稼働中のネットワークのために 30 以上のトレーニング速度を向上させ、基本的に全体を解放しました。
他のことをするために CPU を使っているだけですただ単にトレーニングだけでは
もちろん皆さんにはある種の地上の真実が必要ですそれは興味深い問題ですが
あなたの地上の真実を保管する目的はあなたが必要な地上の真実に到達したいということです
最適化のために最適化するために必要とする最小限のファイル・システム操作と最小サイズのロード
内部的に修正された 1 つの大きな装置として計算クラスターが表示される必要があるため、クラスター間のスループット
制約およびしきい値を設定することで、
私たちが使っているのは私たちが使っているものです私たちはこのことを私たちの根拠としている特徴キャッシュと推論出力を
たくさんのテンソルがそこにありますここにあるマンガだけがあなたのテーブルです
お店をお店にしたいと思います。ディスク上でロールアウトしたときには、何かをお使いになることを
例えばビデオタイム・スタンプのように、ヘッダ内にこれらすべてを入れ、最初のヘッダでインデックス付けします。
ディスク上のどこに行くかを正確にお読みになりますもしテンソルがあれば
異なる寸法を最後に連続した寸法として配置するための寸法で、異なるタイプのものも試行
これを圧縮して最も最適のものをチェックしますこれが実際には大きな一歩であるということです
機械学習ネットワークからの無知の出力を、以下の周囲に回転させる機能を提供
私たちが保管するときにはストレージの効率を最大 20 度まで向上させることができます
列をサイズ順に並べ、すべての小さい列と小さな値が一緒になっているようにするために、
1 つの値がオーバーラップする可能性があります。これらの値は、後で使用する必要がないように、後で使用するために使用します。
別のファイル・システム操作を行って私がオンになっていることもあります
2 つのプロジェクトに触れました内部ではこれは非常に大きな持続的な取り組みの一部なのです
これらの最適化を通じて蓄積し集約することができるようになりました
2 倍の速さで占有するネットワークを占有するネットワークを増やすことができるようになっています。計算や移動を増やすと
数日ではなく数時間でこれを訓練することはできませんそれを手にしたいと思います
ジョンを計算する最大のユーザーは
私の名前はジョン・エモンズ、オートピロ・ビジョンのチームをリードします。 2 つのトピックをお話します
第一にレーンを予測する方法と 2 番目の方法は道路上の他のエージェントの将来の行動を予測する方法です
自動操縦の初期段階で、車線検出問題をイメージ空間の瞬時セグメンテーションの課題としてモデル化した
私たちのネットワークは非常にシンプルでしたがほんの数種類の種類の車体を印刷することができるだけでした
幾何学図形は、隣接してセグメント化できるイーグル・レーンを具体的に区分する。
レーンとそれにはフォークのための特別なケーシングがあり、この問題の単純化モデル化を
ハイウェイのような高度に構造化された道路で働いていましたが今日私たちはシステムを構築しようと
より複雑な操作をすることができます。具体的には、交点で左右に曲折をしたいと考えています。
この単純化されたモデル化を適用しようとすると道路の位相がかなり複雑で多様化することがあります
ここで問題が起こるのはほんの一瞬一瞬のことで
私たちがやろうとしているのは自分たちのコネクティビティーにおけるラメのスパークのセットを予測することです
このグラフを予測するニューラル・ネットワークは、ノードがレーン・セグメントで、エッジがエンコードされている
これらのレーン間の接続を利用して、レーンを検出することができます。
ニューラルネットワークは 3 つの構成要素で構成されています 1 つ目の構成要素には
8 つのビデオ・ストリームをエンコードする、畳み込み層の注目層と他のニューラル・ネットワーク層
車両のカメラで、豊かな視覚表現を作り出す
そしてこのデジタル表現をコード化されたロードマップと共に拡張します私たちがコード化したデータを
私たちがレーン・ガイダンス・モジュールと呼ぶ、追加のニューラル・ネットワーク層の集合。このマップは HD マップではなく、
様々な道路の車線カウント、およびその他の属性のセットを交差するレーンのトポロジーに関する有用なヒントを提供しています。
ここで最初の 2 つのコンポーネントを作るのに役立つ
世界をエンコードする高密度テンソルだが、私たちが本当にしたいのは、この高密度テンソルを
それらのコネクティビティーでのレーンのスマート・セットは、イメージのような問題にアプローチします
入力が高密度テンソルで、出力テキストが特別な言語になると予測される場合の位置決めタスク
私たちはテスラのコネクティビティでランネスをエンコーディングするために開発しました言葉と言葉を
トークンは、トークンの中のトークン接頭部修飾子の Ordering における、 3D スペース内のレーン位置です。
タスクを言語としてモデリングすることにより、これらのレーン間の結合関係をエンコードします。
問題は、最近の自己回帰的なアーキテクチャーと、複数のものを処理するための言語コミュニティからの技術を活用することができる
私たちがコンピュータのビジョンの問題を解決するだけでなく私たちが最先端のものを適用していることが問題の変調性にもなります
言語モデリングと機械学習はより一般的に私はこの言語構成要素をより詳しく説明することにします
画面に描かれているのは衛星画像ですこれは地域の面積を表しています
先端の先端を車で車線グラフと呼んでいます最終的にはこの神経をどうするかということです
まず最初に私たちの最初のものを作りたいと思います
この緑のドットでは、この緑のドットの位置は次のようにエンコードされます。
今、このインデックスを直接予測することはないということを 3D 世界によるコースグリッドへのインデックス
あまりにも計算コストがかかりすぎるので格子ポイントが多すぎてカテゴリー型を予測することができないからです
これに対する配布は両方ともトレーニング時間とテスト時間に影響を与えるのではなく私たちがすることは
世界は、まず、可能な場所について熱マップを予測し、次に、最も可能性の高い場所でラッチを掛けます。
これを基に予測を洗練し、正確な点を得ることができる
私たちはこのトークンの位置がどこにあるか分かりませんがこの事件では新しいタイプを知りませんが
レーンは開始トークンとしてアプローチします。これは、スター・トークンが存在しないためです。
私たちの言語の付加的な属性を最初のフォワードパスから予測しそれらをエンコードし
一緒に組み合わされたテンソルのセットを生成する、学習された追加埋め込みを使用すること
これは私たちのランゲージの言語の最初の言葉ですここでの文章の中でまず最初に
次に、次のレイン点を同様の方法で印刷することで、このプロセスを続行する
このレーンのポイントは新しいレーンの始まりではなく以前のレーンの継続ということです
これは継続的なトークンタイプではありませんが
このレーンは前に保護された平面に接続されています。これは、私たちが行う正確な形状を
一連のスプライン係数を取り戻し、このレーンをコード化します。
そしてそれを次の単語として追加しますこれらの継続レーンを予測し続けると、
予測グリッドの終わりには別のレーン・セグメントに移動しますが現在ではシアン・ドットが表示されます
それはそのピンクの点とは関係がありません実際にそれをフォークしているのは青のことだと
フォーク・タイプとフォーク・トークンがあることを示しています
実際に、 fork がユーザーの元になる以前のトークンをポイントします。
フォークポイントの予測値が実際には索引ゼロなので、実際には予想されていたようなトークンを元に戻すことができます
私たちは繰り返しこのプロセスを継続しています
「 Ling 」グラフでトークンをトークン化した後、ネットワークは文トークンの終わりを予測します。
私たちがこれを行う理由は単に複雑なものを作りたいからという理由だけではないということです
これはニューラルネットワークのような完全なマシンを開発するという感じですが
道路に沿ってレーンをセグメント化しようとしていますが、例えば、道路に沿ってレーンをセグメント化しようとしていますが、
はっきりしているのは、道路がはっきり見えず、 2 車線または 3 車線があり、あなたが言うことができないということ
単純なセグメンテーション・ベースのアプローチでは、両方とも 2.5 レーンの状態とその両方を描画するだけです。
後処理アルゴリズムは、そのような予測があるときには、すぐに失敗するだろう、そのような問題は、私の言う意味では終わらない
これらの結合性のある状態を交差点の中で予測する必要がありますこれは近道ではあり得ないということです
このセグメンテーションのような同じようなオーバーラップにアップグレードしなければならなかったのはハイワイヤーのようなものだということですがそれを改善しようとすると
これらを別々の層に配置するのは本当に難しい問題に過ぎません言語が現代的なものを得るためにとても良い枠組みを提供するのは
後処理でこれをすべて実行しようとすることを知っているのではないかということを知っているのではなく、事後のサンプル
しかしこれは自動操縦のためのものではありません私が思うにこれはオプティマスのために使うことができます
これを「レーン」と呼んでいますがここではご存知の方はご存知かもしれませんがエンコーディングの可能性を知っているかもしれません
工場の中や家の中にいる人たちが歩いているとか
ロボットに頼みましょうキッチンに話をさせてください工場のどこかの場所に
そして一連のパスウェイズを予測しますこの通路を通るとロボットがロボットを利用して
どうやってキッチンに行くかということですナビゲーションの問題を単純化するための素晴らしいフレームワークを提供するだけで
下流のプランナーはすべて正しいので最終的には
このレーン検出ネットワークは、ネットワークから直接接続されるコネクティビティーのレーンのセットです。
ここでの追加のステップはこれまでのところ単純化していませんが、密度の高い予測を分散したものとして
これは、ネットワークの直接的なフィルターに掛けられた出力の出力です。
私はレーンについて少しお話しました私たちの未来の経路をどうモデル化し予測するかということです
オブジェクトに関する他の意味論を 2 つの例を通して簡単に説明することができます
ここには車があります赤い光を走らせて私たちの手の前を向き
このような状況は、私たちが使用できるすべてのオブジェクトについて、 Horizon の短時間の軌道の将来を予測することです。
これらは、ここで危険な状況を予測し、衝突を避けるためにブレーキングやステアリング操作が必要であることを適用する必要があります
右側のビデオでは左側の車線の前に 2 台の車が駐車しています左車線の 1 つは
荷降ろしされているのでドライバーがなぜそこに駐車したのか分からないが重要なのは私たちの神経ネットワークが停止したと予言していたことです
これは赤い色です他の車線には静止していますがそれは静止していても
明らかに赤信号が緑に変わるのを待つだけです両方の物体が静止していても速度がゼロであってもそれが意味論として
ここで重要なのは、私たちが、目の前にある駐車した車の後ろに閉じ込められることがないように
これらのエージェント属性のすべてを予測すると、リアルタイム・システムを構築しようとするときに、いくつかの
私たちは、自動操縦が変化する環境にすぐに反応できるようにするために、私たちは目的のセクションスタックのフレーム率を最大化する必要がある
神経ネットワークが 2 つの段階に分割される推論レイテンシを最小化するためにミリ秒ごとにここで重要なのは
最初の段階では、エージェントが存在する場所を 3D スペースで識別しました。
2 段階目では、 3D の位置にあるセンサーを引っ張り、それを追加データで追加します。
することができます。その後、この仕様ステップで処理を行うことができます。
ニューラルネットワークでは、最も重要な領域に計算を集中させることで、待ち時間の一部に対して優れたパフォーマンスを提供します
それをすべてのオートピロット・ビジョン・スタックは、単に幾何学やキネマティクスだけを予測します。
世界は安全で人間的な運転を可能にする豊富なセマンティクスを予測しています
私たちが FSD のコンピュータ上でクールなニューラルネットワークをどうやって走らせているかを伝えることはできません
[ 拍手]
今日は私が SRI ですがこの FSC ネットワークを動かせるために必要なことを
私たちは今日の推定待ち時間のために最適化することができます
ジョンが話していた FSG レーン・ネットワーク
このトラックを始めたときこの FSC レーンネットワークを移動エンジン上でネイティブに実行できるかどうかを知りたいと思いました
FSD コンピュータで構築した社内のニューラルネットワークアクセラレータは
このハードウェアを組み立てる際にはシンプルでそれができることを確認しました
途方もなく高速なドット製品があるが、この建築は自動車である
回帰的で反復する場合に、内部ループ内の複数のアテンション・アテンション・ブロックを突き抜けています。
スパース・ポイントを直接的に生成することで、ここでの課題は、
高密度の点のある製品エンジンについての解析ポイント予測とスパースの計算を行うことで
移動のためにネットワークがヒート・マップを予測するように
現時点で最も可能性のある空間の位置は Arc Max と 1 の空間を
空間位置のインデックスの 1 つのハードエンコードを行う心臓操作
ここでは、この索引に関連付けられた埋め込み表から、この索引に関連付けられた埋め込みを選択する必要があります。
SRAM で検索テーブルを作りましたそして私たちは SRAM で検索テーブルを作りました
ちょうど行列の乗法でこのすべてのものを達成できるような、この埋め込みの次元は
この埋め込みをトークンキャッシュに格納したいというだけでなく
反復ごとに再計算するのではなく、将来のポイント予測のために再利用することで再計算する必要があります
これら全ての操作をドット・プロダクト・エンジンに対して行ったところでのトリックです私たちのチームが
これらのすべての操作を方法で旅行エンジンにマップする創造的な方法を見つけた
このハードウェアが設計されたときには想像もできなかったものですが
このモデルを作るために多くのオペレーションと機能を実装しています
パフォーマンスを最適化するだけでなく、受理の正確性を向上させることができる
これらの全てが 10 歳以下の 7500 万のパラメータモデルを実行するのに役立ちました
たった 8 ワットの電力を消費する待ち時間のミリ秒
しかしこれはこの車の中で唯一の建築物ではありません他の多くの建築モジュールやネットワークが
車の中でネットワークの規模を拡大する必要があります全てのネットワークの 10 億個のパラメータが
1000 個のニューラルネットワーク信号を結合させることで確実に
私たちは共同でそれらを最適化し計算を最大化し
使用率のスループットおよび待ち時間の最小化を最小限に抑えるためにコンパイラを構築する
構造を従来のコンパイラに共有するネットワークが巨大化し
150k ノードと 375k の接続を持つニューラル・ネッツのグラフは
それらを独立したサブグラフに分割し、それらのそれぞれをコンパル化
推論デバイスのためにネイティブにサブグラフをすると、ニューラル・ネットワークがある
このリンク時間最適化を実行する従来のリンカーに構造を共有するリンカー
計算メモリとメモリを使ってオフラインの最適化問題を解決することができます
帯域幅の制約が、車内で実行される最適化されたスケジュールによって提供されるようにする
実行時にハイブリッドスケジューリングシステムを設計しましたこれは基本的に
これらのネットワークをモデルに実行するために、 1 つの SOC および分散スケジューリングでの 1 つの SOC と分散スケジューリングでの異
計算の使用効率を 100 滴にするための並行して、あらゆるものを最適化する必要があります
ネットワーク・アーキテクチャーをすべてコンパイラーがチューニングすることによる、ソフトウェアのレイヤー
低遅延の高帯域幅 RDMA リンクを srcs をまたいで実装し、実際にはさらに深い帯域幅を実現する方法
加速器のキャッシュコヒーレントと非一貫性のないデータ・パスを理解し、最適化することは、
全てのレベルで最適化を行うことで最大フレーム率やミリ秒単位毎に最適化を
ここではこれがこれだけです
車内で動いているニューラルネットワークを可視化することができますこれは私たちのデジタル・ブレーンです
これらの操作は全くのものではないが、車内で実行されているいくつかの実際の操作を名称に掛けるのには
このネットワークを 10 億個のパラメーターによって訓練または訓練するためには大量のデータが必要とされます。
自動ラベル・パイプラインを使用してこれを実現する方法について
ありがとうシェリーありがとう
私はジュルゲン・チャンと私は自前で幾何学的なビジョンを率いています
オート・ラベリングについての話をしましょう
様々な種類のネットワークをサポートするためのあらゆる種類のラベリング・フレームワークがあります今日私は
正常に列車を編成し、一般化するために、すごいレーン網に焦点を当てます。
私たちが何千万回もの旅に出かけたと考えるネットワークは
おそらく 100 万の交差点であるかそれ以上に
どうやってそれを達成できるかということは十分達成可能であることは確かです
すでにティムの説明になっているので、 1 日に 500 000 回の現金が必要になるということで、私たちは旅行の量を
しかし、それらすべてのデータをトレーニング・フォームに変換することは、非常に難しい技術的な問題である
この課題を解決するために様々な方法のマニュアルを手にしました
1 番目の列から 2 番目の列までの 2 番目から 3 番目のものまで、約 100 倍の改善を提供しました
スループットは向上していますが私たちはより良いオート・ラベリングマシンを獲得しました
品質の高い多様性とスケーラビリティーを提供する
これらの要件を満たすために必要なのは膨大な量のエンジニアリング作業にもかかわらず
新秩序のラベリングマシンがマルチトリブの再構築によって 500 万時間分を交換できるようにする
10 000 回のラベリングのためのクラスターでのわずか 12 時間の手動ラベル付け
そこで私たちがどう解決したかというと最初のステップは高精度の軌道と構造の回復による
マルチカメラ・ビジュアル・インナーシャル・オドメトリー。ここでは、地上面を含むすべての機能がビデオから推測されます。
ニューラルネットワークによって追跡され、ベクトル空間に再構成される
車の軌跡の典型的なドリフト速度は 1.3 センチメートルになります
センチメートル当たり 0.45 ミリ・ラジアン毎メートルで、コンパクト計算機を考えるとかなりままである
リカバリー・サービスおよび未加工の詳細も、強さとして使用されます。
後の手動検証ステップのガイダンス ( これも FSD ごとに使用可能になります )
移動データとともに、前処理された軌道や構造を得るための車両
2 番目のステップはマルチタイプの再構築ですこれはこのマシンの大きな部分とコア部分です
ビデオは前に表示されたトリップがどのように再構成され位置合わせされているか
他の人が同じ車ではない他の人との他の交通手段を利用することでこれは複数の人が
コース整列合わせのペアごとの接合の最適化後に、さらに表面的な改良といったインターネット・ステップ
結局、人間の分析家がやってきて、ラベルをきめ細かく分析する
そのため、各ハッピー・ステップはクラスター上で既に完全に並列化されているため、
通常、プロセス全体では、ほんの数時間かかる
最後のステップは、実際には新しい旅行を自動ラベル付けすることです
ここでは、同じ複数の移動合わせエンジンを使用しますが、事前に構築された再構築と各新規配置の
それは、すべてのクリップを完全に再構成するよりもずっとシンプルであるため、
マニュアルの代わりに他のラベルに移動するのにかかる時間は 1 回につき 30 分
手動によるラベル付けの数時間、これはスケーラビリティーのキーでもあります。
この機械は、私たちがこの機械を使用している限り、この機械は
約 50 本の木が新たに注文されるように、計算やトリップのデータを
このシーンからラベルを貼られているものもありますここには 53 の異なる車があり
これが私たちが世界の宇宙空間を捉えて変革する方法なのです
私が注目したいのはネットワークの監視をどうするかということですが
私たちの車線にラベルを付けていますが、私たちは、プランナーや多くの仕事を行うほぼ全ての仕事に自動労働者を
物体やその他のキネマティクスなどの形状に関係する人のいないように、完全に自動的なものである
オート・フューチャーズはオート・ラベリングによるものばかりで、同じことは占有率にも当てはまります。
この周りに機械を作りましたもう一つのスライドをもう一つ戻すことができないように
それはクラスター上で並列化されているので、かなり簡単に聞こえるということですが、
こんなものが来るのは楽しいことではありませんしばらく前にこんなことがあるのは楽しいことではありません
自動ラベル付けが行われます。誰かがスクリプトを作成すると、作業が開始され、作業が開始されます。
ボリュームはかなり高いので明らかに解決策を必要としていますそこには他にも 2 人のエンジニアがいました
私たちのチームは興味をそそられています私たちがしなければならないことを知っているということは
基本的にはパイソンのような機能をしなければなりませんまず最初にクリップを引っ張ります
最終的にはネットワークの推論が別のネットワークの推論になりますがこれを実現するためには
大きさが大きいので、 1 日に 100 000 個のクリップを知っているか、 100 000 個のアイテムを知っているかをお知らせします。
それは良いことではありません技術者たちは少しのポストや少しの情報を知っています
肘のグリースをしています一方で私たちはもう少し後になって 20 人の
これらの機能のうち 100 万が 1 日ごとに 50 万倍ほどの
これらの機能の 1 トンをストリーミング・ファッションで走らせるということですそれは
トレーニングをするだけでなくオート・ラベリングも必要とされていますそれは実際にはトレーニングをすることで
ラベルを作成し、実動ラインのように、これに適用されるすべての同じコンセプトのような品質の在庫を生成します
ラベル・ファクトリーがあてはまれているのは車の工場が正しいということです
ええと、結構結構です
このセクションでは、ネットワークのために、いくつかの難題と興味深い例をいくつか共有したいと思います。
人間にとっては恐らく上からのものと同じくらいの例があります嘘や霧のような夜のようなものです
また、駐車している車による大いなる結論による結論と、雨の夜にも、カメラのレンズの上に雨が降っている。
これらは難題だが、一度元のシーンが他のクリップによって完全に再構成されると、それらのシーンはすべて
自動ラベル付けされているので、これらの難しいシナリオにより、カードがさらに良くなる
それでミディデイビッドにマイクを渡せ Sim がラベルの上に新しい世界を創り出していることをより詳しく知ることができます
あなた
私の名前はデビッドでシミュレーションについてお話ししますシミュレーションは重要な役割を果たす
ソースやラベルを付けるのが難しいデータを提供することはできないが、 3D シーンには気難しいほど遅い
模擬場面を私の後ろで演奏するのを例にとるために
サンフランシスコのマーケット・ストリートとの複雑な交差点には、次の 2 週間がかかります。
芸術家は完成し私たちのために私たちのために私たちは痛々しくゆっくりとした時間を使うこと
jaeganの自動化された地上の真実ラベル、いくつかのブランドの新しいツールがあります。これにより、これを手順的に生成できる
たった 5 分でこんな感じになりますこれは以前よりも数千倍も速く
自動化された地面を配管することによって始められるように、私たちのシーンの中に潜ることができる
ロード境界から始まるソフトウェア・フーディーニ内の模擬 World Creator ツールに対する真実ラベル
ラベルを使用して、実線のメッシュを生成し、レーン・グラフ・ラベルを使用してそれを再トポロジー化することで、重要な道路に情報を提供
クロスロード・スロープや詳細な素材の混合などの詳細
次に、直線データとスイープ形状をサーフェス上で使用し、それを道路に投影してレーン・ペイントを作成することができます。
中央の端を使用している次に、吐いたものを紡ぎす
アイランド幾何学によってランダム化された葉を取り込むことで場面の可視性を劇的に変化させます
現在では外の世界は一連のランダム化されたヒューリスティクスによりモジュラー・ビルディング・ジェネレータによって生成されることができる
無作為に配置された物を無作為に作成すると同時に視覚障害物を作ることができますが、
木は、それの下の葉を、細い線または縁の下に落とす
次に、地図データを持って、交通信号のようなものや、追跡することができる停止記号などの位置を知らせることができます
レーンの数のような重要な情報を収集し、正確な通りの名前を取得するための通常の
レーン・グラフを使って、レーンの接続性を判別し、レーンの方向性を判別できるようにします。
道路標識は道路標識付きの道路標識ですそして最後にレーンのグラフ自体が
ランダム化されたトラフィックの変量インサイダー・シミュレーターを作成するためにレーンの隣接性やその他の有用な測定基準を決定することができる
繰り返しますがこれは自動的にループしているアーティストで数分以内に起きていることですこれで私たちは
全てがデータとヒューリスティクスに基づいているのでかなり涼しいものもあります
単一の地面の真実の視覚的な変化を作り出すためのパラメーター、オブジェクトの配置と無作為としての微妙な変化が可能
都市のような環境の全く新しい生物や場所のような、より大きな変化への物質的なスワッピング
郊外部や田舎において、特定のものに対して無限の標的の順列を作ることができます。
真実を突き出す必要があるということですそしてこれらの全てが
私たちは地上の真実を変えることでこれをさらに一歩進めることができます
ジョンは自分のネットワークに、方向性ロードマーキングにもっと注意を払うよう望んでいると言う
近日中の左折車線をより正確に検出するために私たちは車線グラフを内側から順番に変更し始めることができます
この交差点を通して完全に新しい流れを作るのを助けるシミュレーター ( シミュレーター )
より正確な予測を作成するために、ネットワークの注意を道路のマーキングに集中させます。これは、この方法をどのようにして
ツールを使用することで、実際の世界からは得られない新しいデータを作成できます
このツールの真の力はそのアーキテクチャにあり我々が全てのタスクを無限に並列に実行できるかどうかということです
目の真実を変えるために、タイルの創造者ツールが動作を変えるのを見た
その隣のものにラベルを入れると、タイル抽出ツールを使用できます。
このデータを約 150 メートルの大きさのジオハッシュ・タイルに分割して
データを個別の形状やインスタンスファイルに保存することで簡単にデータを提供できるようになります
未来のためにエンジンの不可知性をレンダリングすることを可能にする
タイル・ローダー・ツールを使用すると、現在行っているジオハッシュ ID を使用して、これらのキャッシュ・タイルをいくつでも呼び出すことができます。
通常、フリート・ホットスポットまたは興味深い陸地グラフを中心とした、 5 つのタイルまたは 3 個の 3 つのタイルで
タイル・ローダーの位置は、これらのタイル・セットを消費の U 資産に変換します
Unreal Engine によって、最初のスライドで見たものから完成したプロジェクト・プロダクトを提供します。
これは私たちの地図を見ることができる大きさとスケールのためのものです
サンフランシスコの都市の通りの大半を簡単に生成できるようになりました数年も仕事も数年もかかりませんでしたが
2 週間で 1 人の人が 2 週間の間に全ての人の管理を続けて
ツールの中で PDG ネットワークを使ってこのデータを使用することで
これを計算して、これらのすべてのタイル・セットを一晩再生成すると、すべての環境が
新しいオントロジーと信号が絶えず存在するため、トレーニングにとって非常に重要な一貫した品質と特徴
解放されて完全な円を手にするために
これらすべてのタイル集合を地上の真実データから生成しましたこれには本物の世界からの奇妙な複雑さが含まれています
手続き上の視覚と交通の多様性を組み合わせることで制限付きのデータを作成します
Sim セクションから学習するネットワークを提供し、それをケイトに渡して、私たちがどのようにしてできるのかをケートに
すべてのデータを使用して自動操縦性を向上させます
私の名前はケイト・パークです私がここにいるのはデータエンジンの話ですが
データを通してニューラルネットワークを改善することで私たちがどのように介入介入を決定するかを
データを利用してこの特定のクリップの人生を歩きますこのシナリオでは
オートピロットは変化に近づいており、交差する車両がトラフィックのために停止済みであるということを間違って予測する
私たちが車の中でスローダウンする車は車の中には誰もいないということですこれは私たちが作ったものです
不正確な予測を識別するためのツールは、ラベルを訂正し、これを分類します
このクリップは、 126 のうちの 1 つであるという評価セットにクリップする
私たちはこのことを理由に駐車した車と診断されています
技術資源の慣習によらずに、この評価セットを治すことができる
この課題を解決するための難問を解決するために
何千もの例を採る必要がありますテスラは私たちのデータを使い
不正の要求データを調達し、前に表示されたツールを使用して
現在のモデルの誤った予測を外科的に標的にすることで、我々が最も価値のあるものを加えるだけである
私たちの訓練の例としては 13 900 のクリップを手術的に修正し
なぜならこれらは現在のモデルがモデルアーキテクチャを変える必要すらないという例です
この新しい価値のあるデータによる簡単な更新では、この問題を解決するには十分であり、もはや予測できないように見える
オレンジで示されているように止まっているが、赤で示されたように停めた車が停止した
アカデミアでは人はデータ定数を保持しているがテスラにはデータがあるということが
時間と時間を見て、そのデータは最も決定論的なレバーではないとしても最良のものの 1 つであるというのは、まさにその反対です。