Elon Musk, uitvoerende hoof van Tesla, het onlangs die maatskappy se Tesla Bot onthul. Die robotkode-genaamd Optimus skuifel oor 'n verhoog, waai met sy hand en pomp sy arms in 'n stadige spoed dansbeweging. Musk voorspel dat die robot binne drie tot vyf jaar $ 20.000 kan kos as alles volgens plan verloop. Maar die vraag is, wat kan dit vir ons doen? Maar voordat ons daarby ingaan, kyk ons na die hooftoestelle wat die Tesla -bot dryf.
Tesla Bot Actuators
Die Aktuators is die belangrikste aandrywingstelsel vir enige robot. U kan sê dat 'n robot niks meer is as 'n rekenaar met bewegende dele nie, of met ander woorde, 'n robot is 'n rekenaar met aktuators en sensors. Tesla het sy eie aktuators vir die bot ontwikkel, dit gebruik 3 soorte roterende aktuators en 3 soorte Lineêre aktuators.
As u wonder waarom Tesla nie gestandaardiseerde lineêre aktueerders soos die gebruik het nie FIRGELLI Aktuator, dit is omdat hulle verskeie beperkings het, wat beteken dat hulle hul eie stelsels moet ontwikkel om die robotte uiteindelik liggewig, kragdoeltreffende, hoë drywingsdigtheid en lae koste te kry. Tesla het beweer dat hulle die Bot vir $ 20.000 elk in die kleinhandel wil kry. Dit op sigself is 'n groot bestelling vir iets wat Gong 23 aktuators benodig, en 'n kragtige rekenaar, baie sensors en 'n batterypak om dit meer as 'n paar uur te laat duur, plus 'n sterk skelet om dit alles bymekaar te hou.
Tesla bot lineêre aktuators
Die lineêre aandrywers wat Tesla ontwikkel het, is baie spesifiek vir 'n spesifieke rol, dit beteken dat hulle nie regtig baie van nut sou wees vir enige ander toepassing as 'n robot nie. Hul aktuators gebruik 'n planetêre rolstelsel en Tesla noem dit, maar dit is basies kode vir die ontwerp van balle vir balleskroef, en in plaas van 'n tradisionele magnetiese ankerspoel in die middel van die motor, het hulle besluit om 'n borsellose kernmotor -ontwerp te gebruik. Dit beteken dat die ontwerp van die ballees baie doeltreffend is en minder krag gebruik, maar ook duurder. En hulle gebruik 'n borsellose kragstelsel wat beteken dat die lewendige span aansienlik vinniger sal wees en dat dit baie spesifieke dryfmodusse wat deur die sagteware beheer word, moontlik maak.
Die lengte van die reis is slegs ongeveer 2 "lank, en soos die foto daarvan wys dat hulle 'n klavier op 500 kg oplig, is dit baie gewig. U wonder miskien waarom dit soveel gewig moet oplig? metaal skelet, die Actuators Travel moet die stoke versterk van wat dit beweeg. Dus, as dit die been van 'n robot beweeg, moet die been ongeveer 150 degs kan beweeg, of oor 'n lengte van 2 voet wat die been nodig het om van te swaai Ongeveer nul tot 'n boog van 3 voet. Die Huma-liggaam wat meer as 100,000 jaar ontwikkel het, stel ons in staat om dit te doen met ons beenspiere, maar om 'n lineêre aktuator te doen, is geen maklike taak nie. Die punt is dus die punt i ' m maak is dat, alhoewel die aktuator 500 kg gewig oor 2 duim kan lig, sodra die aktuators aan 'n hefboom gekoppel is, word die krag aansienlik verminder, afhangende van die hefboomverhouding, maar die snelheid verhoog wat sorg vir 'n lekker handel -Of.
Tesla Bot -aanbieding.
Hier is wat Tesla self te sê gehad het oor die nuutste botaanbieding wat hulle op 30 September 2022 gegee het
Elon Musk het geskenke: WEk het 'n paar opwindende dinge om jou te wys, ek dink jy sal redelik beïndruk wees. Ek wil wel 'n paar verwagtinge stel ten opsigte van ons Optimus -robot, soos u verlede jaar weet, was dit net 'n persoon in 'n robotpak, maar ons het nie 'n lang pad gekom nie, en ek dink jy weet dit in vergelyking met dit gaan baie indrukwekkend wees. En ons gaan praat oor die vooruitgang in AI vir volle selfbestuur, sowel as hoe hulle op meer van toepassing isOor die algemeen na die regte wêreldprobleme soos 'n humanoïde robot en selfs verder gaan. Ek dink daar is 'n mate van potensiaal dat dit wat ons hier by Tesla doen, 'n betekenisvolle bydrae tot AGI kan lewer, en ek dink eintlik sê ons vir ons 'n goeie entiteit om dit vanuit 'n bestuursoogpunt te doen, want ons is 'n beursverhandelde maatskappy wat ons een het klas van voorraad en dit beteken dat die publiekBeheer Tesla en ek dink dit is eintlik 'n goeie ding, so as ek mal word, kan jy my dit afvuuris belangrik, miskien is ek nie mal nie, ek weet nie. So ja, so ons gaan baie praat oor ons vordering in AI Autopilot sowel as die vordering met Dojo, en dan gaan ons die span uitbring en 'n lang vrae en vrae doen, sodat u Tough kan vra vrae. Wat u ook al wil hê dat eksistensiële vrae tegniese vrae wil hê as dit soveel tyd vir vrae en vrae as moontlik wil hê, so kom ons kyk daarmee dat u raai wat daagliks is.
Hey ouens, ek is Milan, ek werk aan Autopilot en dit is rubber, ek is Lizzy 'n Meganiese Ingenieur aan die projek ook in orde, sou ons die BOT moet oprig voordat ons die eerste keer vorentoe gaan, probeer ons hierdie robot sonder enige rugsteunkrane
Meganiese meganismes geen kabels niks ja, ek wil met julle saamwerk
Vanaand, maar dit was die eerste keer dat ons jou gereed moet sien, laat ons gaanSelfbestuurende rekenaar wat in u Tesla-motors loop, is dit letterlik die eerste keer dat die robot sonder 'n band op die verhoog was, dit is dit, so die robot kan eintlik baie meer doen as wat ons jou net gewys het, ons het ons gewys Net nie wou hê dat dit op sy gesig moet val nie, so ons sal u nou 'n paar video's wys van die robot wat 'n klomp ander dinge doen, ja, dit is minder riskant.
Ja, ons wou 'n bietjie meer wys wat ons die afgelope paar maande gedoen hetmet uitmekaar en net rondloop en op die verhoog dans en net nederige begin, maar jy kan sien dat die neurale netwerke van die outopilot loop as
is net opgelei vir die knop direk op die nuwe platform wat my natmaak kan sien'N Geregeerde siening is dat dit die robot is wat die wêreld is wat die robot sien, so dit is baie duidelik om voorwerpe soos hierdie die voorwerp te identifiseer wat dit moet optel om dit op te tel. Ons gebruik dieselfde proses as vir Autopilot om data te versamel in die opleiding van u netwerke wat ons dan op die
robot, dit is 'n voorbeeld wat die bolyf 'n bietjie meer illustreer
Iets wat ons oor die volgende paar maande wil probeer om neer te spyker, sou ek tot perfeksie sêDit is regtig 'n werklike stasie in die Fremont -fabriek waaraan dit werk.
Dit is nie die enigste ding wat ons vandag moet wys nie, sodat dit wat u gesien het, Bumble C noem, dit is ons soort rowwe ontwikkelingsrobot wat semi-off-the-shelf Actuators gebruik, maar ons het eintlik 'n stap verder gegaan as dit alreeds. Die span het 'n ongelooflike werk gedoen en ons het eintlik 'n optimistiese bot met 'n
Tesla is volledig ontwerp by beide Actuators Battery Pack Control SystemAlles wat dit nie heeltemal gereed was om te loop nie, maar ek dink dit sal oor 'n paar weke loop, maar ons wou jou die robot wys en iets wat eintlik redelik naby is aan wat in produksie gaan, en jou al die dinge wys wat dit kan Doen dit laat ons dit uitbring
Ons verwag om in Optimus -produksie -eenheid een te hê, wat die vermoë is
Om al die vingers onafhanklik van die duim te beweeg, het twee
grade van vryheid, so dit het opponable duime en beide linker- en regterhand so
Dit is in staat om gereedskap te bedryf en nuttige dinge te doen, ons doel is om nuttig te maak
humanoïde robot so vinnig as moontlik en ons het dit ook ontwerp met behulp van die
dieselfde dissipline wat ons gebruik om die motor te ontwerp, wat wil sê om dit te ontwerp vir vervaardiging sodat dit moontlik isMaak die robot in 'n hoë volume teen lae koste met 'n hoë betroubaarheid, so dit is ongelooflik belangrik. Ek bedoel dat u almal baie indrukwekkende humanoïde robotdemonstrasies gesien het, en dat dit wonderlik is, maar wat mis hulle? Hulle mis 'n brein, hulle doen dit nie T het die intelligensie om
Navigeer die wêreld alleen en hulle is ook baie duur,en in 'n lae volume gemaak, terwyl dit die optimistiese samelewing en 'n uiters bekwame robot is, maar in 'n baie hoë volume gemaak is, waarskynlik uiteindelik miljoene eenhede, en dit sal na verwagting veel minder as 'n motor kos.
Ek sou sê waarskynlik dat minder as twintigduisend dollar my raaiskoot sou wees
Die potensiaal vir optimisties is dat ek dit baie effektief waardeer
mense hey soos gewoonlik kom Tesla -demo's warmSo okay dit is goed, dit is goed um ja, die spanne sit aan en die span het 'n ongelooflike hoeveelheid werk ingestel, dit is u werkdae wat u sewe dae per week weet wat die olie van 03:00 af is om vandag tot die demonstrasie te kom, ek is vandag Super trots op wat hulle gedoen het, is dat hulle regtig 'n goeie werk gedoen het, ek wil net 'n hand gee aan die hele opsie van hierdie span, sodat u weet dat daar nou nog baie werk gedoen moet word om Optimus en Dit is duidelik dat dit net Optimus -weergawe een is, en dit is regtig die rede waarom ons hierdie geleentheid hou, wat is om van die mees talentvolste mense in die wêreld te oortuig soos julle om by Tesla aan te sluit en dit te help om dit 'n werklikheid te maak en dit tot die uitvoering te bring skaal sodanig dat dit miljoene mense en die en die potensiaal wat hy daarvan hou, kan help, is die gees regtig, want jy moet sê soos wat 'n ekonomie is, is 'n soort produktiewe entiteite die produktiwiteit van die produktiwiteit UH Capital Times -uitset produktiwiteit per capita op die punt waarin daar nie 'n beperking op kapitaal is nie, dit is nie duidelik wat 'n ekonomie selfs op daardie stadium beteken nie, word 'n ekonomie kwasiaal oneindig, so wat u weet om in die hopelik goedaardige scenario te werk toekoms van oorvloed 'n toekoms waar daar geen armoede is waar mense jy is nie
kan hê wat u wil in terme van produkte en diensteDit is regtig 'n fundamentele transformasie van die beskawing, soos ons dit weet, wil ons natuurlik seker maak dat transformasie positief en veilig is, maar dit is ook die rede waarom ek dink dat Tesla as 'n entiteit is wat 'n enkele klas voorraad in die openbaar verhandel deur die besit van die Die publiek is baie belangrik en moet nie oor die hoof gesien word nie, ek dink dit is noodsaaklik, want as die publiek nie hou van wat Tesla doen nie, kan die publiek aandele in Tesla koop en anders stem.
Dit is 'n groot saak, want dit is baie belangrik dat ek nie net kan doen wat ek wil hê jy weet nieSoms dink mense dat dit nie, maar dit is nie waar nie, so jy weet dat dit baie belangrik is dat die korporatiewe entiteit wat dit laat gebeur, iets is wat die publiek behoorlik kan beïnvloed, en daarom dink ek dat die Tesla -struktuur ideaal is daarvoor en soos soos Ek het gesê dat u weet dat selfbestuurde motors beslis 'n geweldige impak op die wêreld sal hê, ek dink hulle sal die
produktiwiteit van vervoer met minstens 'n halwe orde van grootte miskien 'nOrde van grootte miskien meer UM -optimiste, dink ek, het miskien 'n twee -orde van potensiële verbetering in ekonomiese produksie, asof dit nie duidelik is dat dit nie duidelik is wat die limiet eintlik is nie, maar ons moet dit doen op die regte manier wat ons moet doen Dit is noukeurig en veilig en sorg dat die uitslag een is wat voordelig is vir die beskawing en en een wat die mensdom sodra ek nie kan nie, dit is ook uiters belangrik, so en ek hoop dat u dit sal oorweeg om by Tesla aan te sluit om die doelwitte by Tesla We te bereik Omgee regtig om die regte ding hier te doen, streef altyd daarna om die regte ding te doen en om die pad regtig nie met goeie bedoelings na die hel te betaal nie, en ek dink die pad na die hel is meestal geplavei met slegte bedoelings, maar elke nou en dan is daar 'n goeie bedoeling in daar, so ons wil dit doen, doen die regte ding um, so jy weet dit oorweeg om by ons aan te sluit en te help om dit te laat gebeur daarmee, laat ons jou toe oorgaan na die volgende fase reg op dankie Elon
Goed, so jy het vandag 'n paar robotte gesien, laat ons 'n vinnige tydlyn -oorsig doen, so ons het verlede jaar die Tesla Bot onthul
konsep, maar 'n konsep kom ons nie baie ver nie, ons het geweet dat ons 'n werklike ontwikkelings- en integrasieplatform nodig het
Kry die regte leer so vinnig as moontlik, sodat die robot wat uitgekom het en die klein roetine vir julle gedoen het
het dit binne ses maande gebou op die opgradering van sagteware -integrasie -hardeware oor die maande sedertdien, maar
Parallel het ons ook die volgende generasie hier ontwerp
Hierdie man is dus gewortel in die basis van die soort voertuigontwerpproses wat u weet dat ons almal gebruik
Die leer wat ons reeds het, is natuurlik baie wat sedert verlede jaar verander het, maar daar is 'n paar dinge
wat nog dieselfde is, sal u sien dat ons nog steeds hierdie baie gedetailleerde fokus op die ware menslike vorm het, dink ons
Sake om 'n paar redes, maar dit is lekker dat ons baie tyd spandeer om na te dink oor hoe verbasend die menslike liggaam is
Hierdie ongelooflike bewegingsreeks is gewoonlik 'n prettige krag
Oefening is as u u vingerpunt op die stoel voor u sit, sal u agterkom dat daar 'n groot verskeidenheid bewegings is
U het in u skouer en u elmboog byvoorbeeld sonder om u vingerpunt te beweeg, u kan daardie gewrigte alles beweeg
oor die plek um, maar die robot wat u weet wat die belangrikste funksie is, is om werklike nuttige werk te verrig en
Dit het miskien nie noodwendig dadelik al die grade van vryheid nodig nie, so ons het dit tot 'n minimum soort afgestroop
van 28 fundamentele grade van vryheid en dan natuurlik ons hande, benewens dit
Mense is ook redelik doeltreffend by sommige dinge en in ander tye nie so doeltreffend nie, so ons kan byvoorbeeld 'n klein
hoeveelheid kos om onsself vir 'n paar uur te onderhou, dit is wonderlik, maar as ons net 'n soort sit
aanstoot, maar ons is nogal ondoeltreffend, ons is net 'n soort brandende energie, so op die robotplatform wat ons is
Dit is om te doen is dat ons die ledige kragverbruik dit so laag as moontlik sal laat daal, en op die manier kan ons net
Draai 'n skakelaar en die robot word onmiddellik omskep in iets wat nuttige werk doen
Laat ons dus in 'n paar detail oor hierdie nuutste generasie praat, sal ons hier op die skerm sien
Oranje is aktuators wat ons in 'n bietjie en in blou sal kry
Noudat ons ons soort menslike navorsing het en ons ons eerste ontwikkelingsplatform het, het ons albei
Navorsing en uitvoering om weer vir hierdie ontwerp te trek, gebruik ons die voertuigontwerp
fondament sodat ons dit van konsep deur ontwerp en analise neem en
Bou en validering dan op die pad wat ons gaan optimaliseer vir dinge soos koste en doeltreffendheid
Omdat dit kritieke statistieke is om hierdie produk na skaal te neem, hoe gaan ons dit goed doen
Gaan ons deeltelling en ons kragverbruik van elke moontlike element wat ons gaan doen, verminder
verminder die waarneming en die bedrading aan ons ledemate wat u kan voorstel dat u baie massa in u hande en voete gaan
Wees redelik moeilik en kragverbruik om rond te beweeg en ons gaan albei sentraliseer
Kragverspreiding en ons bereken na die fisiese middelpunt van die platform
Dus, in die middel van ons bolyf, is dit die bolyf dat ons ons batterypak het, wat op 2,3 kilowatt uur groot is
wat perfek is vir die werk van 'n volle dag wat regtig uniek is aan hierdie battery
Pack is dit het al die batteryelektronika wat in 'n enkele PCB in die pak geïntegreer is, so dit beteken alles
van waarneming tot die samesmelting van ladingbestuur en kragverspreiding is alles op een
Op een plek gebruik ons ook beide ons voertuigprodukte en ons energieprodukte om te rol
al die sleutelfunksies in hierdie battery, so dit is 'n vaartbelynde vervaardiging baie doeltreffend en
Eenvoudige verkoelingsmetodes batterybestuur en ook veiligheid en natuurlik kan ons Tesla's gebruik
Bestaande infrastruktuur en voorsieningsketting om dit so aan te gaan na ons brein
Nie in die kop nie, maar dit is ook baie naby in ons bolyf, ons het ons sentrale rekenaar, so
skepe volledige selfbestuurende rekenaars in elke voertuig wat ons vervaardig, ons wil die outopilot-hardeware en
die sagteware vir die humanoïde platform, maar omdat dit anders is in vereistes en in vormfaktor, is ons
gaan eers 'n paar dinge verander, so ons gaan nog steeds alles doen wat 'n menslike brein doen
Verwerking van visie -data wat gesplete tweede besluite maak gebaseer op veelvuldige sensoriese insette en ook kommunikasie
Om kommunikasie te ondersteun, is dit toegerus met draadlose konnektiwiteit sowel as klankondersteuning
En dan het dit ook sekuriteitsfunksies op hardeware wat belangrik is om die robot en die mense te beskerm
rondom die robot, so nou dat ons ons soort kern het
Ons gaan 'n paar ledemate op hierdie man benodig en ons wil u graag 'n bietjie oor ons aktuators en ons ten volle wys
funksionele hande ook, maar voordat ons dit doen, wil ek Malcolm voorstel wat 'n bietjie daaroor gaan praat
Ons strukturele grondslag vir die robot [applous]
Dankie
Tesla het die vermoë om hoogs ingewikkelde stelsels te finaliseer, dit word baie meer ingewikkeld as 'n ongeluk wat u kan sien
Hier is 'n gesimuleerde ongeluk op Model 3 bo -op die werklike fisiese ongeluk
Dit is eintlik ongelooflik hoe akkuraat dit is net om u 'n idee te gee van die kompleksiteit van hierdie model
Dit bevat elke knoop Bolton -wasser elke plek sweis en dit het 35 miljoen grade van vryheid, dit is nogal verbasend
En dit is waar om te sê dat as ons nie modelle soos hierdie het nie, ons nie die veiligste motors ter wêreld sou kon maak nie
Kan ons ook ons vermoëns en ons metodes van die motorkant gebruik om 'n robot te beïnvloed
Wel, ons kan 'n model maak, en aangesien ons 'n ongeluk het, het ons dieselfde sagteware hier gebruik, kan ons dit laat val
Die doel hiervan is om seker te maak dat dit ideaal val, maar dit is oppervlakkige skade
Ons wil byvoorbeeld nie sy ratkas by sy arms breek wat gelykstaande is aan 'n ontwrigte skouer van 'n robot nie
Moeilik en duur om reg te maak, so ons wou homself afstof met 'n werk wat gegee is
As ons ook dieselfde model kan neem en die aktuators kan dryf met behulp van die invoer van 'n voorheen opgeloste model
om dit lewendig te maak, so dit lewer die mosies vir die take wat ons wil hê die robot moet dit doen
Take haal bokse op en draai hurk wat bo -op stap, ongeag die stel take wat ons kan speel
model Dit wys net eenvoudige wandelinge, ons kan die spanning skep in al die komponente wat ons help
optimaliseer die komponente wat dit nie dans nie, is dit nie
Eintlik die modale gedrag die eerste vyf modusse van die robot en gewoonlik as mense robotte maak, sorg hulle
Die eerste modus is om die boonste enkele figure op na 10 Hertz
Wie is dit, doen dit om die kontroles van stap makliker te maak, dit is baie moeilik om te loop as u nie kan waarborg nie
Waar u voet rondloop, is dit goed om een robot te maak, ons wil duisende miljoene maak
Ons het nie die luukse om dit uit koolstofvesel -titanium te maak nie, ons wil dit op plastiese dinge maak
Nogal so styf, sodat ons nie hierdie hoë teikens kan hê nie, sal ek hulle dom teikens noem
Ons moet hulle by laer teikens laat werk, so is dit dat dit goed gaan werk as u daaraan dink, jammer
Dit, maar ons is net sakke met sopagtige jellie en bene wat ingegooi is, ons is nie 'n hoë frekwensie as ek daarop staan nie
my been ek vibreer nie teen 10 hertz nie, ons mense werk met 'n lae frekwensie, so ons
weet dat die robot eintlik kan dit net moeiliker maak, sodat ons die inligting hiervan neem, die modale data en
die styfheid en voed dit in die beheerstelsel wat dit toelaat om te loop
net om belasting effens te verander en na die knie te kyk waaruit ons inspirasie kan kry
biologie en ons kan kyk wat die meganiese voordele van die knie is, dit blyk dat dit eintlik heeltemal verteenwoordig
soortgelyk aan die Four Bar Link en dit is nogal nie-lineêr wat regtig nie verbasend is nie, want as
U dink dat as u u been op die wringkrag op u knie buig, baie meer is as dit gebuig is as wanneer dit is
reguit, sodat u 'n nie-lineêre funksie sou verwag en die biologie in werklikheid nie-lineêr is
Dit pas dit baie akkuraat, so dit is die voorstelling van die vier deur
Link is klaarblyklik nie fisies nie, maar ek het gesê dat die eienskappe dieselfde is, maar ek wed
Nie baie wetenskaplik nie, laat ons 'n bietjie meer wetenskaplik wees, ons het al die take deur die deur hierdie grafiek gespeel, maar dit
wys pikette van staptogte met die take wat ek gesê het oor die spanning en dit is die praat
Die knie teen die kniebuig op die horisontale as Dit toon die vereiste dat die knie al hierdie dinge moet doen
take en sit dan 'n kromme daardeur om bo -op die pieke te surf, en dit sê dit is wat nodig is om
Laat die robot hierdie take doen
As ons dus na die vier balk-skakel kyk, is dit eintlik die groen kromme en dit sê dat die nie-lineariteit van die
Vier deur Link is eintlik die kenmerk van die krag wat dit regtig sê, dit het die krag verlaag
Dit is wat die aktuator die laagste moontlike krag het, wat die doeltreffendste is om energie stadig te verbrand
wat is die blou kromme goed, die blou kromme is eintlik as ons nie 'n vierkaart skakel nie, het ons net 'n arm gehad
Ek steek hier uit my been met 'n aktuator daarop 'n eenvoudige twee balk skakel
Dit is die beste wat u met 'n eenvoudige twee balk -skakel kan doen en dit wys dat dit baie meer krag in die
aktuator wat nie doeltreffend sou wees nie, hoe lyk dit in die praktyk
Wel, soos jy sal sien, maar dit is baie styf verpak in die knie, sal jy 'n goeie sien
deursigtig binne 'n sekonde sien u die volledige balk -skakel daar wat op die aktuator werk, dit word bepaal
Force en die verplasings op die aktuator en gee jou nou oor na konsertina
Ek is dus ek wil graag met u praat oor die ontwerpproses en die aktuator
portefeulje UH in ons robot, so daar is baie ooreenkomste tussen a
motor en die robot as dit kom by die ontwerp van kragstuur, die belangrikste ding wat hier belangrik is, is energiemassa en koste
Ons dra die meeste van ons ontwerpervaring van die motor na die robot oor
In die spesifieke geval sien u dus 'n motor met twee ry -eenhede en die dryfeenhede
word gebruik om die motor 0 tot 60 myl per uur te versnel of a
stede ry webwerf terwyl die robot met 28 aktuators en
Dit is nie duidelik wat die take op aktuatorvlak is nie, so ons het take dat
is hoër vlak soos om trappe te stap of te klim of 'n swaar voorwerp te dra wat in vertaal moet word
gewrig in gewrigspesifikasies, daarom gebruik ons ons model
wat die wringkragsnelheidsbane genereer vir ons gewrigte wat
gaan daarna gevoer word in ons optimaliseringsmodel en om deur te loop
die optimaliseringsproses Dit is een van die scenario's wat die
Robot is in staat om te doen wat draai en loop, so as ons hierdie wringkrag het
baan het ons 'n doeltreffendheidskaart van 'n aktuator gelê en kan ons saam
die baan om die kragverbruik en die energie -ophoping op te wek
energie vir die taak teenoor tyd, so dit stel ons in staat om die stelsel te definieer
koste vir die spesifieke aktuator en plaas 'n eenvoudige punt in die wolk, dan doen ons dit
Dit vir honderde duisende aktuators deur op te los in ons groep en die rooi lyn dui die Pareto -front aan
wat die voorkeurgebied is waar ons optimaal sal soek, sodat die x aandui
Die voorkeur -aktuator -ontwerp wat ons vir hierdie spesifieke gewrig gekies het, moet ons dit nou doen vir elke gewrig
het 28 gewrigte om te optimaliseer en ons ontleed ons wolk ons ontleed ons wolk weer vir elke gewrig
spesifikasies en die rooi as hierdie keer dui die maat Aktuator -ontwerpe vir elke
Gesamentlike die probleem hier is dat ons te veel unieke aktuatorontwerpe het en
Selfs as ons voordeel trek uit die simmetrie, is daar nog te veel om iets massa te maak
vervaardigbaar Ons moet die hoeveelheid unieke aktuatorontwerpe kan verminder, daarom bestuur ons iets
Commonality Study genoem, waarvoor ons ons wolk weer hierdie keer wil ontleed
aktuators wat terselfdertyd aan die gesamentlike prestasievereistes vir meer as een gewrig voldoen, so die
Die resulterende portefeulje is ses aktuators en dit vertoon in 'n kleurkaart die middelste figuur
UM en die aktuators kan ook in hierdie skyfie gesien word, ons het drie roterende en
Drie lineêre aktueerders wat almal 'n groot uitsetkrag of wringkrag per massa het
Veral die roterende aktuator het 'n meganiese koppelaar wat op die hoek van die snelheid van die snelheid geïntegreer is
kogellager en aan die hoë snelheidskant en aan die lae snelheid van 'n kruisrol
Laer en die rattrein is 'n stamgolfrat en daar is drie geïntegreerde sensors
hier en die maat permanente magneetmasjien die lineêre aktuator
Ek is jammer dat die lineêre aktuator planetêre rollers het en 'n omgekeerde planetêre skroef
As 'n rattrein wat doeltreffendheid en verdigting en duursaamheid moontlik maak
Dus om die kragvermoë van ons lineêre aktuators te demonstreer
het 'n eksperiment opgestel om dit onder sy perke te toets
En ek sal jou die video laat geniet
Ons aktuator kan dus ophef
'N Half toon nege voet konsert Grand klavier
en
Dit is 'n vereiste dat dit nie iets lekker is om te hê nie, want ons spiere kan dit doen
dieselfde as hulle direk aangedryf word as hulle direk aangedryf word, of quadricep spiere dieselfde kan doen
Dit is net dat die knie 'n UP -hefverbindingstelsel is wat die krag omskakel
in die snelheid aan die einde effektor van ons heuwels vir doeleindes om aan die
menslike liggaam se behendigheid, so dit is een van die belangrikste dinge wat verbasend is aan die menslike liggaam en ek is
Sluit my deel op hierdie punt af en ek wil my kollega Mike verwelkom wat met u oor die hand gaan praat
Ontwerp baie dankie dankie Constantinos
Ons het dus net gesien hoe kragtig 'n mens en 'n humanoïde aktuator kan wees
Mense is ook ongelooflik vaardig dat die menslike hand die vermoë het om te beweeg
teen 300 grade per sekonde het dit tienduisende tasbare sensors
En dit het die vermoë om byna elke voorwerp in ons daaglikse lewe te begryp en te manipuleer
Vir ons robothandontwerp is ons geïnspireer deur biologie, ons het vyf vingers 'n optelbare duim
Ons vingers word aangedryf deur metaal senings wat buigsaam en sterk is, ons het die vermoë om wyd te voltooi
Diafragma -krag gryp terwyl dit ook geoptimaliseer word vir presisie -gryp van klein dun en delikate voorwerpe
So waarom 'n menslike soos robothand goed, is die hoofrede dat ons fabrieke en die wêreld rondom ons is
Ontwerp om ergonomies te wees, so wat dit beteken, is dat dit verseker dat voorwerpe in ons fabriek begrypbaar is
Maar dit verseker ook dat nuwe voorwerpe wat ons nog nooit vantevore gesien het nie, deur die menslike hand en deur ons
Robotiese hand ook die omgekeerde is baie interessant, want dit sê dat hierdie voorwerpe vir ons hand ontwerp is
In plaas daarvan om veranderinge aan ons hand aan te bring om 'n nuwe voorwerp te vergesel
'N Paar basiese statistieke oor ons hand is dat dit ses aktuators en 11 grade van vryheid het, dit het 'n in-hand-beheerder wat
dryf die vingers en ontvang die terugvoer van sensorterugvoer sensor is baie belangrik om
Leer 'n bietjie meer oor die voorwerpe wat ons begryp en ook vir propriosepsie, en dit is die vermoë om te erken waar
Ons hand is in die ruimte een van die belangrikste aspekte van ons hand is dat dit aanpasbaar is
is in wese betrokke as ingewikkelde meganismes wat die hand in staat stel om aan te pas by die voorwerpe wat aangegryp word
Nog 'n belangrike deel is dat ons 'n nie-rug-dryfbare vingeraandrywing het met hierdie koppelingsmeganisme om ons te hou
en vervoer voorwerpe sonder om die handmotors aan te skakel, het jy net gehoor hoe ons gaan
Ons het te werk gegaan met die ontwerp van die Tesla Bot -hardeware, nou sal ons dit aan Milaan en ons outonomie -span oorhandig om dit te bring
robot tot lewe dankie Mike
Goed, so al die oulike dinge wat ons vroeër in die video gewys het, is geplaas
Moontlik net binne 'n paar maande danksy die ongelooflike woord wat ons die afgelope paar jaar outopilot gedoen het
Die meeste van hierdie komponente het redelik maklik na die botsomgewing oorgedra as u daaraan nadink, ons beweeg net
Van 'n robot op wiele tot 'n robot op bene, sodat sommige van hierdie komponente redelik dieselfde is en ander benodig
Meer swaar opheffing so byvoorbeeld ons rekenaarvisie neurale netwerke
Direk van outopilot na die BOTS -situasie berig dat dit presies dieselfde besettingsnetwerk is
dat ons later met 'n bietjie meer besonderhede praat met die Autopilot -span wat nou op die bot is
Hierdie video Die enigste ding wat regtig verander het, is die opleidingsdata wat ons moes onthou
Ons probeer ook maniere vind om die besettingsnetwerke te verbeter met behulp van werk wat op u glansvelde gemaak is om te kry
regtig 'n wonderlike volumetriese weergawe van die botsomgewings, byvoorbeeld hier sommige
masjien lees dat die bot moontlik moet omgaan
Nog 'n interessante probleem om na te dink, is in binnenshuise omgewings meestal met die gevoel van GPS sein hoe kan u
Gaan na die bestemming sê byvoorbeeld om die naaste laaistasie te vind, sodat ons opgelei het
meer neurale netwerke om sleutelpunte met hoë frekwensie in die
Bots -kamerastrome en spoor dit mettertyd oor rame terwyl die bot na sy omgewing navigeer
En ons gebruik die punte om 'n beter skatting van die botsposisie en baan binne sy omgewing te kry
Dit is loop, ons het ook nogal 'n bietjie werk aan die
Simulasiekant en dit is letterlik die outopilot -simulator uh waaraan ons die beweging van die robot geïntegreer het
kode en dit is 'n video van die bewegingsbeheerkode wat in die Simulator -simulator van die operateur uitgevoer word
Evolusie van die robotte loop mettertyd, en soos u kan sien, het ons in April redelik stadig begin en begin versnel
Namate ons die afgelope paar maande meer gewrigte en dieper gevorderde tegnieke soos arms in balans ontsluit
En dus is die beweging spesifiek een komponent wat baie anders is as ons van die motor na die bots beweeg
omgewing en daarom dink ek dit regverdig 'n bietjie meer diepte en ek wil graag hê dat my kollegas hieroor moet praat
nou vreemd
Hallo almal, ek is Felix, ek is 'n robotika -ingenieur oor die projek en gaan praat oor stap
lyk maklik reg. Mense doen dit elke dag dat jy nie eens daaraan moet nadink nie
Maar daar is enkele aspekte van stap wat byvoorbeeld uitdagend is vanuit ingenieursperspektief
fisiese selfbewustheid wat beteken dat u 'n goeie voorstelling van uself het wat die lengte van u ledemate is
die massa van u ledemate, wat is die grootte van u voete, alles wat belangrik is, het ook 'n energie -effektiewe hek wat u het
Kan u voorstel dat daar verskillende style van stap is en almal is ewe doeltreffend
Die belangrikste hou balans nie val nie en koördineer natuurlik ook die mosie
van al u ledemate saam, so nou doen mense dit alles natuurlik, maar as ingenieurs of robotici
om na te dink oor hierdie probleme en as ek u gaan wys hoe ons dit aanspreek in ons beweging en beheer
stapel sodat ons begin met bewegingbeplanning en ons voorstelling van die band wat
beteken die model van die robot se kinematiese dinamika en die kontakteienskappe en die gebruik van die model en die gewenste
Pad vir die bots wat ons LOMOMOTION -beplanner verwysingsbane vir die hele stelsel genereer
Dit beteken uitvoerbare trajekte ten opsigte van die aannames van ons model
Die beplanner werk tans in drie fases wat begin om voetstappe te beplan en eindig met die hele bewegingsfoto -stelsel
En kom ons duik 'n bietjie dieper in hoe dit werk, so in hierdie video sien ons dat voetstappe beplan word oor beplanning
Horizon volg die gewenste pad en ons begin hiervan en voeg dan by vir
Trajekte wat hierdie voetstappe verbind met behulp van tone af en opbrengste staking net soos die mense net soos mense doen
En dit gee ons 'n groter vordering en minder kniebuiging vir die hoë doeltreffendheid van die stelsel
Die laaste fase is dan om 'n sentrum van massa -baan te vind wat ons 'n fooi dinamies uitvoerbare beweging van die
hele stelsel om balans te hou, aangesien ons almal weet dat planne goed is, maar ons
Moet dit ook in werklikheid besef, laat ons sê dat u weet hoe ons dit kan doen
[Applous] Dankie Felix Hallo almal my naam
Is Anand en ek gaan met u praat oor kontroles, so laat ons die bewegingsplan neem dat Felix
Het net oor gepraat en dit in die regte wêreld geplaas op 'n regte robot, kom ons kyk wat gebeur
Dit neem 'n paar tree en val goed af, dit is 'n bietjie teleurstellend
Maar ons mis 'n paar sleutelstukke hier wat dit sal laat werk
Soos Felix noem, gebruik die bewegingsbeplanner 'n geïdealiseerde weergawe van
homself en 'n weergawe van die werklikheid rondom dit, dit is nie presies korrek nie
dit spreek ook sy voorneme uit deur trajekte en moersleuteltakke van
Kragte en wringkragte wat dit op die wêreld wil uitoefen om te lok
Die werklikheid is baie ingewikkelder as enige soortgelyke model, ook die robot is nie
vereenvoudig dat dit vibrasies en modusse nakomingsensorgeluid en aan en aan het
En wat doen dit aan die regte wêreld as jy die bot in die regte wêreld plaas
Wel, die onverwagte magte veroorsaak ongemodelle dinamika wat die beplanner in wese nie weet nie en dit
veroorsaak destabilisasie veral vir 'n stelsel wat dinamies stabiel is soos tweevoetige beweging
So, wat kan ons daaraan doen, ons meet die werklikheid dat ons sensors gebruik en ons begrip van
Die wêreld wat my hier beraming en status doen, kan u die houding en bekkenposisie sien
in wese die vestibulêre stelsel in 'n mens saam met die middelpunt van die massa -baan wat opgespoor word wanneer die robot loop
In die kantooromgewing het ons nou al die stukke wat ons benodig
om die lus te sluit, sodat ons ons beter botmodel gebruik, gebruik ons die begrip van die werklikheid wat
Ons het deur die beraming van die staat opgedoen en vergelyk dit wat ons wil hê teenoor wat ons die werklikheid verwag
werklikheid doen ons om regstellings by die gedrag van die
robot hier die robot waardeer dit beslis nie om gepik te word nie, maar dit nie
bewonderenswaardige taak om regop te bly. Die finale punt hier is 'n robot wat
Wandelings is nie genoeg nie, ons moes sy hande en arms gebruik
Wees nuttig Laat ons praat oor manipulasie
[Applous]
Hallo almal, my naam is Eric Robotics Engineer op Teslabot en ek wil praat
oor hoe ons die robot laat dinge het in die regte wêreld manipuleer ons voorwerpe terwyl ons voorwerpe wil manipuleer
lyk so natuurlik as moontlik en kom ook vinnig daarheen, so wat ons gedoen het, is
Ons het hierdie proses in twee stappe opgebreek.
Noem hulle demonstrasies en dan het ons hierdie bewegingsverwysings aanlyn aangepas vir die huidige werklike wêreldsituasie
Laat ons dus sê dat ons 'n menslike demonstrasie het om 'n voorwerp op te tel, ons kan 'n bewegingsopname daarvan kry
demonstrasie wat hier gevisualiseer word as 'n klomp sleutelrame wat die liggings van die hande voorstel
die elmboë Die bolyf kan ons dit op die robot gebruik met behulp van omgekeerde kinematika en as ons 'n
baie hiervan het ons nou 'n biblioteek waarmee ons kan werk, maar 'n enkele demonstrasie is nie
veralgemeenbaar vir die variasie in die regte wêreld, byvoorbeeld, sou dit slegs vir 'n boks in 'n baie spesifieke werk
ligging, so wat ons ook gedoen het, is om hierdie verwysingsbane deur 'n
Trajekoptimaliseringsprogram wat oplos vir waar die hand moet wees, hoe die robot moet balanseer
Tydens UH wanneer dit die mosie moet aanpas by die regte wêreld, byvoorbeeld
As die kassie op hierdie plek is, sal ons optimiseerder dit skep
Trajek in plaas daarvan gaan Milaan oor UH praat
Wat is die volgende vir die Optimus Uh Tesla y dankie Larry
reg, so hopelik het julle nou 'n goeie idee gekry van wat ons die afgelope paar maande gedoen het
Um ons het iets begin doen wat bruikbaar is, maar dit is nog lank nie nuttig nie, daar is nog 'n lang en opwindende pad
voor ons um ek dink die eerste ding binne die volgende paar weke is om ten minste optimus te kry
gelyk aan Bumble C Die ander prototipe wat u vroeër gesien het, en waarskynlik verder as ons ook gaan begin
fokus op die regte gebruiksaak by een van ons fabrieke en gaan regtig probeer om dit vas te spyker en ek is almal opraak
Die elemente wat nodig was om hierdie produk te ontplooi in die regte wêreld wat ek vroeër genoem het
U weet u binnenshuise navigasie grasieus vir bestuur of selfs om almal te bedien
komponente wat nodig was om hierdie produk op te skaal, maar ek weet nie van jou nie, maar daarna
As ek vanaand sien wat ons gewys het, is ek redelik seker dat ons dit binne die volgende paar maande of jare kan regkry en ek maak
Hierdie produk is 'n werklikheid en verander die hele ekonomie, so ek wil die hele Optimus -span vir die harde bedank
Werk die afgelope paar maande Ek dink dit is redelik verbasend alles is in skaars ses of agt maande gedoen dankie
baie [applous]
dankie hey almal
Hallo ek is Ashok, ek lei die Autopilot -span saam met Milaan God, dit kom so moeilik om dit te bowe te kom
Optimus -afdeling Hy sal nietemin in elk geval probeer
Um elke Tesla wat die afgelope paar jaar gebou is
hardeware om die motor self te laat ry, het ons aan die sagteware gewerk
Voeg hoër en hoër vlakke van outonomie by. Hierdie keer het ons verlede jaar gehad
Ongeveer 2 000 motors wat ons FSD -beta -sagteware sedertdien ry, het ons aansienlik
het die sagteware verbeter as robuustheid en vermoë dat ons dit nou na 160 000 kliënte gestuur het
Jip [Applous]
Dit is nie gratis gekom nie, dit kom van die sweet en bloed van die ingenieurspan die afgelope een jaar
Ons het byvoorbeeld 75 000 neurale netwerkmodelle opgelei net die laaste jaar
Ongeveer 'n model elke agt minute wat u weet wat uit die span kom en dan evalueer ons dit op ons groot
groepe en dan stuur ons 281 van die modelle wat die werkverrigting van die motor verbeter
En hierdie ruimte van innovasie vind plaas in die hele stapel die beplanningsagteware die
infrastruktuur Die gereedskap wat selfs alles huur, vorder na die volgende vlak
Die FSG Beta -sagteware is baie in staat om die motor te bestuur waarvandaan dit moet navigeer
Parkeerterrein vir parkeerterrein Hantering van CDC -bestuur Stop vir verkeersligte en stoptekens
Onderhandel met voorwerpe by kruisings en maak draaie en so aan
Dit alles kom van die kamerastrome wat deur ons neurale netwerke gaan wat op die motor self loop
Nie terugkom na die bediener of iets wat dit op die motor loop nie en lewer al die uitsette om die wêreldmodel te vorm
rondom die motor en die beplanningsagteware ry die motor op grond daarvan
Vandag gaan ons in baie van die komponente wat die stelsel uitmaak wat die besettingsnetwerk as basis optree
meetkundige laag van die stelsel Dit is 'n multikamera-video neurale
netwerk wat uit die beelde die volle fisieke besetting van die wêreld voorspel
die robot so alles wat fisies aan bome muur muur geboue motors mure wat
Het u dit voorspel of dit spesifiek aanwesig is, dit voorspel dit saam met hul toekomstige beweging
Boonop het hierdie basisvlak van meetkunde meer semantiese lae om
navigeer op die paaie waar ons die lens natuurlik benodig, maar dan het die paaie baie
verskillende bane en hulle verbind op allerlei maniere, so dit is eintlik 'n baie moeilike probleem vir 'n tipiese rekenaar
Visie -tegnieke om die stel vliegtuie en hul konnektiwiteite te voorspel, sodat ons die hele tyd in die taal bereik het
Tegnologieë en dan die moderne kuns uit ander domeine getrek en nie net rekenaarvisie om hierdie taak te maak nie
moontlik vir voertuie Ons het hul volle kinematiese toestand nodig om dit te beheer
Dit alles kom direk uit neurale netwerke -videostrome Raw Video Streams kom in die netwerke deur
van verwerking en lewer dan die volle kinematiese toestand uit wat die snelheid van die snelheidsposisie alles posisioneer
direk uit die netwerke kom met 'n minimale posverwerking wat vir my regtig fassinerend is, want hoe gaan dit
Dit is selfs moontlik in watter wêreld leef ons daarin dat hierdie magie moontlik is dat hierdie netwerke vierde voorspel
afgeleide instrumente van hierdie posisies wanneer mense dink dat ons nie eens hierdie voorwerpe kan opspoor nie
My mening is dat dit nie gratis gekom het nie, dit het tonne data nodig, so ons het 'n bietjie gesofistikeerde motoretikettering gehad
stelsels wat deur rou sensordata skyn, loop 'n ton vanlyn bereken op die
bedieners Dit kan 'n paar uur duur duur neurale netwerke distilleer die inligting in etikette wat ons oplei
neurale netwerke in die motor bo hierop gebruik ons ook ons simulasiestelsel om sinteties te wees
Skep beelde en aangesien dit 'n simulasie is, het ons triviaal al die etikette
Dit alles gaan deur 'n goed geoliede pyplyn vir data-enjin waar ons eers
Lei 'n basislynmodel op met 'n paar databasis na die motor, kyk wat die mislukkings is, en sodra u die foute ken
Ons myn die vloot vir die gevalle waar dit misluk, bied die regte etikette en voeg die data by die opleidingsstel
Hierdie proses maak die probleme stelselmatig reg en ons doen dit vir elke taak wat in die motor loop
ja en om hierdie nuwe massiewe neurale netwerke hierdie jaar op te lei, het ons ons opleidingsinfrastruktuur met grofweg uitgebrei
40 tot 50 persent sodat ons vandag ongeveer 14 000 GPU's oor meerdere sit
Opleidingsgroepe in die Verenigde State het ons ook aan ons AI -samesteller gewerk wat
ondersteun nou nuwe bedrywighede wat deur die neurale netwerke benodig word en karteer dit die beste van ons onderliggende
Hardewarebronne en ons inferensie -enjin is vandag in staat om die uitvoering van
'N Enkele neurale netwerk oor twee onafhanklike stelsel op skepe in wese twee onafhanklike rekenaars met mekaar verbind
Binne die eenvoudige selfbestuurende rekenaar en om dit moontlik te maak, moet ons 'n noue beheer op die einde van die einde hou
Latency van hierdie nuwe stelsel, sodat ons meer gevorderde skeduleringskode oor die volledige FSD -platform ontplooi het
Al hierdie neurale netwerke wat saam in die motor loop, produseer die vektorruimte, wat weer die model van die
wêreld rondom die robot of die motor en dan werk die beplanningstelsel bo -op hierdie trajekte wat
Vermy botsings of glad maak vordering na die bestemming met behulp van 'n kombinasie van modelgebaseerde optimalisering
plus neurale netwerk wat help om dit vinnig te optimaliseer
Ons is deesdae baie opgewonde om vordering op al hierdie gebiede aan te bied waarmee ons die ingenieurs lei
Kom in en verduidelik hierdie verskillende blokke en hierdie krag nie net die motor nie, maar dieselfde komponente loop ook op die optimus
robot wat Milaan vroeër getoon het met die verwelkoming van die paneel om oor die beplanningsafdeling te begin praat
Hallo alles, ek is Parel Joint Laat ons hierdie kruisingscenario gebruik
Duik direk na hoe ons die beplanning en besluitneming in outopilot doen, sodat ons hierdie kruising nader
van 'n systraat af en ons moet oorgee aan al die regstreekse voertuie, want ons is op die punt om die
kruising Die voetganger aan die oorkant van die kruising besluit om die pad oor te steek
Sonder 'n kruispad moet ons hierdie voetgangeropbrengste aan die voertuie van regs en
Verstaan ook die verband tussen die voetganger en die voertuig aan die ander kant van die kruising
Baie van hierdie intra-objek-afhanklikhede wat ons vinnig moet oplos
en mense is baie goed hiermee, ons kyk na 'n toneel verstaan al die moontlike interaksies wat die meeste evalueer
belowende een en oor die algemeen 'n redelike een kies
Laat ons dus kyk na enkele van hierdie interaksies wat die outopilotstelsel geëvalueer het, kon ons voor hierdie
voetganger met 'n baie aggressiewe bekendstelling in 'n syprofiel nou is ons natuurlik 'n gek vir die
Voetganger en ons sou die voetganger en sy oulike troeteldier oorgeslaan het, kon ons stadig vorentoe beweeg
Vir 'n gaping tussen die voetganger of die voertuig van regs is ons 'n gek na die voertuig
van regs af kom, maar u moet nie hierdie interaksie heeltemal verwerp as dit slegs veilige interaksie beskikbaar is nie
Laastens het die interaksie wat ons uiteindelik gekies het, aanvanklik die redelike vind
Gaping en dan die maneuver klaar nadat al die agente verbygegaan het
Nou is die evaluering van al hierdie interaksies nie triviaal nie, veral nie as u omgee vir modellering nie
die hoër orde afgeleides vir ander middels, byvoorbeeld wat die lengte is
ruk wat deur die voertuig van regs af benodig word as u voorlê, vertrou slegs op botsingskontroles met
Modulêre voorspellings sal u net so ver kry omdat u baie geldige interaksies sal misloop
Dit kom basies neer op die oplos
al die ander agente nou hoeveel u ooit optimaliseer, sal daar 'n beperking wees op hoe vinnig u kan
Begin hierdie optimaliseringsprobleem, dit is naby aan die orde van 10 millisekondes, selfs na baie inkrementele benaderings
Nou, vir 'n tipiese, onvoorspelbare linkse, sê dat u meer as 20 voorwerpe elk het
voorwerp met verskeie verskillende toekomstige modusse Die aantal relevante interaksiekombinasies sal opblaas
Ons die beplanner moet elke 50 millisekondes 'n besluit neem, so hoe los ons dit in reële tyd op
Ons vertrou op 'n raamwerk wat ons noem as interaksie -soektog, wat basies 'n paralleliseerde navorsing is oor 'n klomp
maneuver trajekte Die staatsruimte hier stem ooreen met die kinematiese toestand van ego die kinematiese
toestand van ander middels Die nominale toekomstige veelvuldige multimodale voorspellings en al die statiese entiteite op die toneel
Die aksieruimte is waar dinge interessant raak, ons gebruik 'n stel maneuverbaan
kandidate om 'n klomp interaksionele besluite te vertak en ook langer inkrementele doelwitte
Horizon Maneuver Laat ons baie vinnig deur hierdie navorsing gaan om 'n idee te kry van hoe dit werk
Ons begin met 'n stel visie -metings, naamlik bane bewegende voorwerpe wat dit voorgestel word as
yl ekstraksies sowel as latente funksies Ons gebruik dit om 'n stel doelwit te skep
kandidate bane weer vanaf die Lanes -netwerk of ongestruktureerde streke wat ooreenstem met
'N Waarskynlikheidsmasker afgelei van menslike demonstrasies sodra ons 'n klomp van hierdie goud het
kandidate Ons skep saadbane met behulp van 'n kombinasie van klassieke optimaliseringsbenaderings sowel as ons
Netwerkbeplanner is weer opgelei in data van die kliëntevoer sodra ons 'n klomp van hierdie gratis kry
Trajekte Ons gebruik dit om te begin vertak oor die interaksies wat ons die mees kritieke interaksie vind
In ons geval sou dit die interaksie wees ten opsigte van die voetganger, of ons nou daarvoor beweer of daaraan gee
Dit is duidelik
Die opsie aan die regterkant en dit is waar ons meer en meer ingewikkelde interaksies inbring
Probleem inkrementeel met al hoe meer beperkings en dat navorsing voortduur om te vertak oor meer interaksies wat vertak
Op meer doelwitte lê nou baie truuks hier in die evaluering van elk van hierdie nodus
van die navorsing in elke node aanvanklik het ons begin met die skepping
Trajekte met behulp van klassieke optimaliseringsbenaderings waar die beperkings soos ek beskryf het, inkrementeel bygevoeg sou word
En dit sal nou een tot vyf millisekondes per aksie neem, al is dit redelik goed
nommer wanneer u meer as 100 interaksies wil evalueer, dit is nie skaal nie
Dus het ons uiteindelik 'n liggewig navraagbare netwerke gebou wat u in die lus van die beplanner kan hardloop
Hierdie netwerke word opgelei in menslike demonstrasies van die vloot, sowel as vanlynoplossers met ontspanne tydsbeperkings
Hiermee kon ons die rundown -tydsduur afbring om 200 mikrosekondes per aksie te sluit
Om dit nou alleen te doen, is nie genoeg nie, want u het nog steeds hierdie massiewe navorsing wat u moet gaan
deur en u moet die soekruimte doeltreffend snoei, sodat u 'n DO -punteleer op elkeen moet doen
Van hierdie trajekte is min hiervan redelik standaard.
Eintlik benodig vir 'n gegewe maneuver. Die kliëntvloot -data speel hier 'n belangrike rol
Ons bestuur twee stelle van weer liggewig veranderlike netwerke wat mekaar regtig aangevul het, een van hulle opgelei
ingrypings van die FST -beta -vloot wat 'n telling gee oor hoe waarskynlik 'n gegewe maneuver is
ingrypings oor die volgende paar sekondes en tweede, wat slegs op menslike demonstrasies is
'n telling op hoe naby u gekose optrede aan 'n menslike gedrewe baan is
Die punteleer help ons om die soekruimte te snoei. Hou verder op die interaksies en fokus op die rekenaar
die belowendste uitkomste Die cool deel hieroor
Argitektuur is dat dit ons in staat stel om 'n koel mengsel te skep tussen UH -data -gedrewe benaderings waar u
hoef nie op baie hand-ontwerpte koste te vertrou nie, maar dit ook in werklikheid met fisika-gebaseerde tjeks
nou baie van wat ek beskryf het met betrekking tot die agente wat ons op die toneel kon waarneem, maar dieselfde
Raamwerk strek tot voorwerpe agter okklusies. Ons gebruik die video -voer van agt kameras
Om die 3D -besetting van die wêreld te genereer, stem die blou masker hier ooreen met die
sigbaarheidstreek Ons noem dit dit word basies geblokkeer
okklusie wat u in die toneel sien, verbruik ons hierdie sigbaarheidsmasker om te genereer wat ons noem as spookvoorwerpe wat u
Kan nou links bo sien as u die spawn -streke en die staatsoorgange van hierdie spook modelleer
voorwerpe korrek as u u beheerreaksie as 'n
funksie van daardie bestaan waarskynlikheid dat u 'n paar baie mooi menslike gedrag kan onttrek
Nou sal ek dit deurgee om te vul om meer te beskryf oor hoe ons hierdie besettingsnetwerke genereer
hey ouens, my naam is Phil Uh, ek sal die besonderhede deel van die besettingsnetwerk wat ons die afgelope jaar bou
Hierdie netwerk is ons oplossing om die fisieke werk in 3D rondom ons motors te modelleer en dit word tans nie in ons
Die visualisering van klante en wat ons hier sal sien, is die padnetwerkuitset van ons interne dev -instrument
Die Occupancy Network neem videostrome van al ons 80 kameras as insette 'n enkele verenigde volumetriese
besetting in vektorruimte direk vir elke 3D -ligging rondom ons motor
voorspel die waarskynlikheid dat die ligging baie bewoon word, aangesien dit videokontakte het
in staat is om struikelblokke te voorspel wat onmiddellik gesluit is
Vir elke ligging lewer dit ook 'n stel semantiek soos voetgangers van die randsteen
en lae puin as kleur hier gekodeer
Besettingsvloei word ook voorspel vir beweging, aangesien die model 'n algemene netwerk is
dit vertel nie statiese en dinamiese voorwerpe eksplisiet wat dit kan produseer nie en
model
Hierdie netwerk werk tans in alle Teslas met FSD -rekenaars en dit is
Ongelooflik doeltreffend loop ongeveer elke 10 millisekondes met ons neurale versneller
So, hoe kan ons hierdie werk kyk na die argitektuur.
Die kamerakalibrasie en die beelde is hier aan die netwerk gegee, dit is eintlik nie
Die tipiese 8-bis RGB-beeld soos u kan sien uit die eerste beelde bo-op, ons is
gee die 12 bit rou foto -rekeningprent aan die netwerk, want dit het vier
stukkies meer inligting Dit het 16 keer beter dinamiese omvang sowel as verminder
latency Aangesien ons nie meer die verkeerde ISP in Adobe het nie, gebruik ons 'n stel rekords en terug met
FPS as 'n ruggraat om beelde -ruimte -funksies te onttrek, konstrueer ons 'n stel 3D -posisie
navraag saam met die IMG -ruimtefunksies as sleutels en waardes in 'n aandagmodule pas
Die uitset van die aandagmodule is 'n hoë dimensionele ruimtelike kenmerke
Hierdie spesiale kenmerke word tydelik in lyn gebring met behulp van voertuig -odometrie
Om beweging af te lei, hou hierdie ruimtelike temporele kenmerke
deur 'n stel D -omwenteling om die finale besetting en besettingstroomuitset te lewer
Dit word gevorm as 'n vaste grootte bokser grys, wat miskien nie presies genoeg is om op beheer te beplan nie
Om 'n hoër resolusie te kry, produseer ons ook per voxel -funksie -kaarte wat in MLP met 3D -ruimtelike
Puntnavrae om posisie en semantiek op enige arbitrêre plek te kry
Nadat ons die model beter geweet het, kyk ons na 'n ander voorbeeld hier, het ons 'n artikulêre bus wat langs regs geparkeer is
sy ry hier uitgelig as 'n L-vormige bokser as ons nader, die bus begin
beweeg die blou Die voorkant van die wa word blou eerste aangedui dat die model voorspel dat die voorste bus 'n nul het
Besettingsvloei en die S-Bus hou aan om die hele bus blou te beweeg
En u kan ook sien dat die netwerk die presiese kromming van die bus voorspel
Wel, dit is 'n baie ingewikkelde probleem vir die tradisionele netwerk vir objekopsporing, want u moet sien of ek gaan
Gebruik een kuboïed of miskien 'n twee om by die kromming te pas, maar vir beroepnetwerk
Aangesien ons net omgee, is die besetting in die sigbare ruimte en kan ons die kromming presies modelleer
Behalwe die voxel -graad, lewer die besettingsnetwerk ook 'n bestuurbare oppervlak
Die bestuurbare oppervlak het beide 3D -meetkunde en semantiek. Dit is baie nuttig vir beheer, veral vir genesing
en krom paaie die oppervlak en die voxel grys word nie onafhanklik voorspel nie
Voxel Grid sluit eintlik in lyn met die oppervlak hier, ons is op 'n held -soeke waar jy
kan sien dat die 3D -meetkunde van die oppervlak mooi voorspel word
Beplanner kan hierdie inligting gebruik om te besluit, miskien moet ons meer vir die Hillcrest vertraag en ook soos u kan
Sien die voxelgraad in lyn met die oppervlak konsekwent
Behalwe die boksbron en die oppervlak, is ons ook baie opgewonde oor die onlangse deurbraak in neurale lesingsveld of
Nerf Ons kyk na albei bevat 'n paar van die ligkleurfunksies in
Besettingsnetwerkopleiding sowel as die gebruik van ons netwerkuitset as die insettoestand vir NERF
In werklikheid is Ashok baie opgewonde hieroor, dit was 'n rukkie sy UH -persoonlike naweekprojek
Op hierdie senuwees omdat ek dink dat die akademie baie hiervan bou
Stigting modelleer UH vir taal met behulp van tonne groot datastelle vir taal, maar ek dink vir visie -senuwees
gaan die basismodelle vir rekenaarvisie bied omdat dit gegrond is in meetkunde en meetkunde
gee ons 'n lekker manier om toesig te hou oor hierdie netwerke en vries van die vereiste om 'n ontologie en die
Toesig is in wese gratis omdat u hierdie beelde onderskeibaar moet lewer, so ek dink in die toekoms hiervan
Besettingsnetwerk -idee waar u weet dat beelde inkom en dan produseer die netwerk 'n konsekwente
volumetriese voorstelling van die toneel wat dan differensieel gemaak kan word in enige beeld wat waargeneem is i i
Persoonlik dink dit 'n toekoms van rekenaarvisie UH en u weet dat ons op die oomblik 'n paar aanvanklike werk daaraan doen, maar ek
dink in die toekoms beide by Tesla en in die akademie, sal ons sien dat dit hierdie
Die kombinasie van een-skoot voorspelling van volumetriese besetting sal dit wees
my persoonlike weddenskap seksuele, so hier is 'n voorbeeld van vroeë resultaat van 'n
3D -rekonstruksie van ons gratis data in plaas daarvan om te fokus op die perfekte RGB -herprojeksie in die beeldruimte ons
Die primêre doel hier is om die waarskuwings 3D -ruimte vir bestuur akkuraat voor te stel, en ons wil dit vir almal doen
Ons gratis data oor die wêreld in alle weer- en beligtingstoestande en dit is natuurlik baie uitdagend
Probleem en ons is op soek na julle om uiteindelik te help om die besettingsnetwerk op te lei
met 'n groot datastel vir outo -vlak sonder enige mens in die lus en daarmee sal ek na Tim oorgaan om te praat
oor wat dit verg om hierdie netwerk op te lei, dankie Phil
[Applous] Goed, Hey Almal Kom ons praat oor 'n bietjie opleiding
infrastruktuur, so ons het 'n paar video's gesien wat u ken vier of vyf uh dink en omgee
Meer en bekommer ons meer oor baie meer snitte daaroor, so ons het gekyk
Die besettingsnetwerke net van Phil vul net video's, dit neem 1,4 miljard
rame om daardie netwerk op te lei wat u pas gesien het, en as u 'n honderdduisend GPU's het, sou dit een uur duur
Maar as u een GPU het, sal dit honderdduisend uur duur, so dit is nie
'n menslike tydperk wat u kan wag vir u oefenwerk om reg te loop, wil ons vinniger as dit stuur, sodat
beteken dat u parallel moet gaan, sodat u 'n meer rekenaar daarvoor nodig het, dit beteken dat u 'n
Superrekenaar, daarom het ons drie superrekenaars in die huis gebou
van 14 000 GPU's waar ons 10 000 GPU's gebruik vir opleiding en ongeveer vierduisend
GPU's vir outo -etikettering Al hierdie video's word in 30 petabyte van 'n verspreide bestuurde video gestoor
kas, jy moet nie aan ons datastelle dink soos vas nie, laat ons sê soos jy aan jou dink
ImageNet of iets waarmee u weet soos 'n miljoen rame, moet u dit as 'n baie vloeiende ding beskou, sodat ons 'n
'N Halfmiljoen van hierdie video's wat elke dag in en uit hierdie groep vloei
En ons volg 400 000 van hierdie soort Python -video -instansies elke sekonde
Dit is dus baie oproepe wat ons moet vaslê om die behoudsbeleid hiervan te reguleer
verspreide videokas so onderliggend aan dit alles is 'n groot hoeveelheid infrar wat ons bou en bestuur
in die huis sodat u nie net kan koop dat u 40 000 weet nie
GPU's en dan 'n 30 petabytes flash mvme en sit dit net saam en laat ons gaan trein uh dit neem eintlik baie
Werk en ek gaan 'n bietjie daarvan gaan wat u eintlik wil doen, is dat u u versneller wil neem
dat dit die GPU of dojo kan wees waaroor ons later sal praat en omdat dit die duurste is
komponent Dit is waar u u bottelnek wil plaas, en dit beteken dat elke deel van u stelsel is
sal beter moet presteer as hierdie versneller en dit is regtig ingewikkeld
beteken dat u berging die grootte en die bandwydte moet hê om al die data in die nodusse af te lewer
Hierdie nodusse moet die regte hoeveelheid SVE en geheuevermoë hê om in u masjienleer te voed
Raamwerk Hierdie masjienleerraamwerk moet dit dan aan u GPU oorhandig en dan kan u begin oefen, maar dan
moet dit doen oor honderde of duisende GPU op 'n betroubare manier op
logstap en op 'n manier wat ook vinnig is, so jy sal ook 'n interkonneksie nodig hê, baie ingewikkeld, sal ons meer praat
oor dojo in 'n sekonde, so eers wil ek jou na sommige neem
Optimalisering wat ons op ons groep gedoen het, sodat ons baie video's en
Video is baie anders as om te sê opleiding op beelde of teks wat volgens my baie goed gevestigde video is
letterlik 'n dimensie meer ingewikkelde um en daarom moes ons eindig
Om van die opberglaag af na die versneller te eindig en elke stuk daarvan te optimaliseer omdat ons op die fotontelling oefen
Video's wat direk uit ons vloot kom, oefen ons op diegene wat direk plaas, ons plaas dit glad nie
Die manier waarop dit net gedoen word, is dat ons presies na die rame wat ons kies vir ons groep, wat ons laai, insluit
rame waarop hulle afhanklik is, so dit is u iframes of u sleutelrame. Ons pak dit in.
geheue skuif dit in 'n dubbele balk van die GPU en gebruik dan die hardeware -dekodeerder wat net versnel word
Die video dekode
As u dit doen, het meer as 30 opleidingsnelheidstoename vir die besettingsnetwerke ontsluit en basies 'n geheel bevry
SVE om enige ander ding te doen, kan jy nie net met net oefen nie
Video's Natuurlik het u 'n soort grondwaarheid nodig. Uh en uh wat eintlik ook 'n interessante probleem is
Doelwit om u grondwaarheid te stoor, is dat u wil seker maak dat u die waarheid wat u benodig in die
minimale hoeveelheid lêerstelselbedrywighede en laai in die minimale grootte van wat u nodig het om te optimaliseer vir die totale
Kruisgroep deurvoer omdat u 'n rekenaargroep moet sien as een groot toestel wat intern reggestel is
Beperkings en drempels so hiervoor het ons 'n formaat uitgerol
is inheems aan ons wat klein genoem word, ons gebruik dit vir ons grondwaarheid ons funksie -kas en enige afleidingsuitsette
So baie tensors wat daar is, en so net die tekenprent hier, kom ons sê dit is jou uh is jou tafel wat jy is
wil bêre, dan is dit hoe dit sal lyk as u op die skyf uitgerol word, so wat u doen, is dat u alles neem wat u sou doen
Wil u indekseer, byvoorbeeld video -tydstempels wat u alles in die kop sit, sodat u in u eerste kopkop is
Lees u weet presies waarheen u op die skyf moet gaan, as u enige tensors het, gaan u probeer om die
afmetings om 'n ander dimensie laaste te plaas as die aangrensende dimensie en probeer dan ook verskillende soorte
kompressie dan kyk jy watter een die beste was en stoor dan die een, dit is eintlik 'n groot stap as jy dit doen
funksie caching onverstaanbare uitset vanaf die masjienleernetwerk draai om die
afmetings 'n bietjie 'n bietjie kan u tot 20 toename in die doeltreffendheid van die berging kry, as u dit ook stoor
het die kolomme volgens grootte bestel sodat al u klein kolomme en klein waardes saam is, sodat u na 'n soek na 'n
enkele waarde wat u waarskynlik sal oorvleuel met 'n lees oor meer waardes wat u later sal gebruik, sodat u nie hoef te doen nie
Nog 'n lêerstelselbewerking sodat ek kon aangaan en aangaan net aan
op twee projekte aangeraak wat ons intern het, maar dit is eintlik deel van 'n groot deurlopende poging om die te optimaliseer
Bereken dat ons in die huis het, so versamel en saamgevoeg deur al hierdie optimalisering ons nou op te lei
Besettingsnetwerke twee keer so vinnig net omdat dit twee keer so doeltreffend is, en nou as ons 'n klomp meer bereken en gaan
parallel ons kan dit nie binne ure in plaas van dae oplei nie, en daarmee wil ek dit aan oorhandig
die grootste gebruiker van Compute John
Hallo almal my naam is John Emmons, ek lei die Autopilot Vision -span, ek gaan twee onderwerpe saam met u bespreek
Die eerste is vandag hoe ons bane voorspel en die tweede is hoe ons die toekomstige gedrag van ander agente op die pad voorspel
In die vroeë dae van die outopilot het ons die baanopsporingsprobleem as 'n onmiddellike segmenteringstaak vir beeldruimte gemodelleer
Ons netwerk was super eenvoudig, maar dit kon in werklikheid slegs bane van 'n paar verskillende soorte druk
meetkunde spesifiek sou dit die arendbaan wat dit aangrensend kan segmenteer
bane en dan het dit 'n spesiale omhulsel vir vurke gehad en hierdie simplistiese modellering van die probleem saamsmelt
het gewerk vir hoogs gestruktureerde paaie soos snelweë, maar vandag probeer ons 'n stelsel bou
Dit is in staat om baie meer ingewikkelde maneuvers te wees, spesifiek wat ons links en regterdraaie wil maak by kruisings
waar die padtopologie nogal meer ingewikkeld en uiteenlopend kan wees as ons probeer om hierdie simplistiese modellering van die
probleem hier, dit breek net heeltemal af om 'n oomblik terug te neem
Ons probeer hier doen, is om die vonkstel van kreupel gevalle in hul konnektiwiteit te voorspel en wat ons wil doen, is om 'n
neurale netwerk wat hierdie grafiek basies voorspel waar die nodusse die baan -segmente is en die rande kodeer
Verbindings tussen hierdie bane, so wat ons het, is ons baanopsporing
neurale netwerk Dit bestaan uit drie komponente in die eerste komponent wat ons het
omwentelingslae en ander neurale netwerklae wat die video -strome van ons agt kodeer
kameras op die voertuig en lewer 'n ryk visuele voorstelling
Ons verbeter dan hierdie digitale voorstelling met 'n growwe padkaartkaart -data met 'n growwe padkaart waarmee ons kodeer
'N Stel addisionele neurale netwerklae wat ons die baanbegeleidingsmodule noem, is nie 'n HD -kaart nie, maar dit
Bied baie nuttige wenke oor die topologie van bane binne -in kruisings. Die baan tel op verskillende paaie en 'n stel ander eienskappe wat
Help ons die eerste twee komponente hier het 'n
digte tensor wat die soort van die wêreld kodeer, maar wat ons regtig wil doen, is om hierdie digte tensor te omskep in 'n
Slim stel bane in hul konnektiwiteite benader ons hierdie probleem soos 'n beeld
Onderskriftaak waar die inset hierdie digte tensor is en die uitsetteks voorspel word in 'n spesiale taal wat
Ons het by Tesla ontwikkel vir die kodering van bane in hul konnektiwiteite in hierdie taal van bane die woorde en
Tokens is die baanposisies in 3D -ruimte in die ordening van die inleidende wysigers in die tekens
Kodeer die bindingsverhoudinge tussen hierdie bane deur die taak as taal te modelleer
Probleem Ons kan gebruik maak van onlangse outoregressiewe argitekture en tegnieke uit die taalgemeenskap om die veelvoud te hanteer
Modaliteit van die probleem Ons los nie net die rekenaarvisieprobleem by Autopilot nie, ons pas ook die nuutste aan en
Taalmodellering en masjienleer Meer in die algemeen gaan ek nou 'n bietjie meer detail in hierdie taalkomponent
Wat ek hier op die skerm uitgebeeld het, is die satellietbeeld wat die plaaslike omgewing rondom die
voertuig Die stel neusrande is waarna ons die baangrafiek noem, en dit is uiteindelik wat ons uit hierdie neurale wil kom
netwerk Ons begin met 'n leë leisteen, ons wil ons eerste maak
Voorspelling hier by hierdie groen punt Hierdie groen kolletjie -posisie is gekodeer as
'n indeks in 'n kursusrooster wat die 3D -wêreld diskretiseer nou voorspel ons nie hierdie indeks direk nie
Omdat dit te berekenend duur sou wees om dit te doen, is daar net te veel roosterpunte en die voorspelling van 'n kategoriese
Verspreiding hieroor het albei implikasies tydens opleidingstyd en toetstyd, dus wat ons doen, is dat ons die
Wêreld grof, eerstens voorspel ons 'n hittekaart oor die moontlike liggings en dan hou ons op die waarskynlikste plek
Hierop verfyn ons dan die voorspelling en kry die presiese punt
Nou weet ons waar die posisie van hierdie teken is dat ons nie die tipe in hierdie geval ken nie, alhoewel dit die begin van 'n nuwe is
Baan, so ons benader dit as 'n begin -teken en omdat dit 'n ster -teken is, is daar geen
Bykomende eienskappe in ons taal neem ons dan die voorspellings uit hierdie eerste vorentoe en kodeer ons
met behulp van 'n geleerde addisionele inbedding wat 'n stel tensors produseer wat ons kombineer
wat eintlik die eerste woord in ons taal van bane is, voeg ons dit by die u ken die eerste posisie in ons sin hier
Ons gaan dan voort met hierdie proses deur die volgende baanpunt op 'n soortgelyke manier te druk
Nou is hierdie baanpunt nie die begin van 'n nuwe baan nie, dit is eintlik 'n voortsetting van die vorige baan
Dit is dus 'n voortsettingstipe -tipe, dit is nou nie genoeg om dit te weet nie
Hierdie baan is gekoppel aan die voorheen beskermde vlak wat ons wil kodeer vir die presiese meetkunde wat ons doen
regruk 'n stel spline -koëffisiënte, neem ons hierdie baan en kodeer ons dit
Weer en voeg dit by as die volgende woord in die sin, ons gaan voort om hierdie voortsettingsbane te voorspel totdat ons by die
einde van die voorspellingsnet
Dit is nie topologies gekoppel aan daardie pienk punt nie, dit is eintlik besig om van die blou te sorry
punt daar, so dit het 'n vurk tipe en vurk tokens
wys eintlik terug na vorige tokens waaruit die vurk ontstaan het, so jy
kan hier sien, die Fork Point -voorspeller is eintlik die indeks nul, so dit verwys eintlik na tokens dat dit al voorspel word soos jy sou in
taal Ons gaan hierdie proses oor en oor voort totdat ons al die van die
Tokens in die Ling -grafiek en dan voorspel die netwerk die einde van die sintoken
Ja, ek wil net daarop let dat die rede waarom ons dit doen, nie net is omdat ons iets ingewikkeld wil bou nie
Dit voel amper soos 'n volledige masjien hier met neurale netwerke dat ons eenvoudige benaderings probeer doen het
Voorbeeld uh probeer net die bane langs die pad of so iets segmenteer, maar dan is die probleem wanneer
Daar word onsekerheid gesê dat u nie die pad duidelik kan sien nie en daar kan twee bane of drie bane wees, en u kan nie sê nie
'N Eenvoudige segmenteringsgebaseerde benadering sou net 'n soort van 'n 2,5 baan -situasie en die
Postverwerkingsalgoritme sal skreeusnaaks misluk as die voorspellings so is, ja, die probleme eindig nie daar nie
U moet hierdie bindende toestande soos hierdie bindingsbane binne kruisings voorspel, wat net nie moontlik is met die benadering nie
Ashok se melding, daarom moes ons na hierdie soort oorvleuel soos hierdie segmentering net hooi word, maar selfs as jy baie hard probeer
U weet dat hulle op aparte lae plaas, dit is net 'n baie moeilike probleem wat taal net 'n baie aangename raamwerk bied vir moderne
Voorbeeld van 'n posterior in teenstelling met u, weet u om dit alles te probeer doen in na-verwerking
Maar dit stop nie eintlik vir net outopilot reg nie, dit kan weer vir optimus gebruik word, weet ek dat hulle dit nie sou wees nie
bane genoem, maar jy kan jou voorstel dat jy hier in hierdie stadium weet dat jy 'n soort paaie het wat soort van jy weet
plekke waar mense kan loop ja, dit is basies as jy in 'n fabriek is of in 'n huis ken
U kan net die robot vra, laat my asseblief met die kombuis praat, of as u na 'n plek in die fabriek lei
En dan voorspel ons 'n stel paaie wat u sou weet, gaan deur die gangetjies, neem die robot en sê dit okay dit
is hoe u in die kombuis kom, dit gee ons regtig 'n lekker raamwerk om hierdie verskillende paaie te modelleer wat die navigasieprobleem vergemaklik of die
Stroomafbeplanner in orde so uiteindelik waaruit ons kom
Hierdie baanopsporingsnetwerk is 'n stel bane in hul konnektiwiteite wat direk van die netwerk af kom
Geen addisionele stap hier om dit so ver te vereenvoudig nie, weet u digte voorspellings in onontbeerlikes
Dit is slegs 'n direkte ongefilterde uitset van die netwerk
Goed, so ek het 'n bietjie gepraat oor bane, ek gaan kortliks aanraak oor hoe ons die toekomstige paaie in
ander semantiek oor voorwerpe, so ek gaan net vinnig deur twee voorbeelde die video op die
Hier het ons 'n motor wat eintlik 'n rooi lig bestuur en voor ons draai wat ons doen om te hanteer
Situasies soos hierdie is dat ons 'n stel kort tyd Horizon toekomstige trajekte voorspel op alle voorwerpe wat ons kan gebruik
Dit om die gevaarlike situasie hier te voorspel en alles wat u weet, toe te pas rem en stuuraksie is nodig om 'n botsing te vermy
In die video aan die regterkant is daar twee voertuie voor ons.
As ek gelaai word, weet ek nie hoekom die bestuurder besluit het om daar te parkeer nie, maar die belangrikste is dat ons neurale netwerk voorspel het dat dit gestop is
wat is die rooi kleur daar, die voertuig in die ander baan, soos u opmerk, is ook stil, maar dit is 'n mens
Dit is duidelik dat u net wag dat die rooi lig groen word, alhoewel albei voorwerpe stilstaan en geen snelheid het nie, is dit die semantiek wat dit is
regtig belangrik hier sodat ons nie agter die ongemaklike geparkeerde motor vassteek nie
Die voorspelling van al hierdie agentkenmerke bied 'n paar praktiese probleme wanneer u 'n intydse stelsel probeer bou
Ons moet die raamtempo van ons voorwerpafdeling -stapel maksimeer sodat outopilot vinnig op die veranderende omgewing kan reageer
Elke millisekonde maak regtig hier van belang om die afleidingslatensie te minimaliseer. Ons neurale netwerk is in twee fases verdeel
In die eerste fase het ons plekke in 3D -ruimte geïdentifiseer waar agente bestaan
In die tweede fase trek ons dan tensors uit op daardie 3D -plekke voeg dit by met addisionele data wat op die
voertuig en dan weet ons, doen die res van die verwerking van hierdie spesifikasiestap die
neurale netwerk om te fokus, bereken op die gebiede wat die belangrikste is, wat ons uitstekende prestasie gee vir 'n fraksie van die latency -koste
As u dit alles saamstel
die wêreld Dit voorspel ook 'n ryk stel semantiek wat veilige en menslike bestuur moontlik maak
Ek gaan nie dinge aan die straat oorhandig nie, ons sal ons vertel hoe ons al hierdie oulike neurale netwerke op ons FSD -rekenaar bestuur, dankie
[Applous]
Hallo almal, ek is vandag sri, ek gaan 'n blik gee op wat nodig is om hierdie FSC -netwerke in die
motor en hoe kan ons vandag optimaliseer vir die afleidingslatensie uh fokus net op die
FSG Lanes Network waaroor John net gepraat het
Toe u met hierdie baan begin, wou ons weet of ons hierdie FSC Lanes -netwerk op die tripmotor kan bestuur
wat ons interne neurale netwerkversneller is wat ons in die FSD-rekenaar gebou het
Toe ons hierdie hardeware bou, het ons dit eenvoudig gehou en ons het seker gemaak dat dit een kan doen
ding belaglik vinnig digte dot produkte, maar hierdie argitektuur is outomaties
regressief en iteratief waar dit deur verskeie aandagblokke in die binneste lus geknars word
Die produseer yl punte direk by elke stap, so die uitdaging hier was hoe
Kan ons hierdie parse punt voorspelling en yl berekening op 'n digte puntproduk -enjin doen, kom ons kyk hoe ons dit gedoen het
op die reis sodat die netwerk die hittekaart van
mees waarskynlike ruimtelike liggings van die punt nou doen ons 'n boog maksimum en 'n een
hartbewerking wat die een harde kodering van die indeks van die ruimtelike ligging gee
Nou moet ons die inbedding wat met hierdie indeks geassosieer word, kies uit 'n inbeddingstabel wat gedurende
opleiding om dit op reis
Die afmetings van hierdie inbedding sodanig dat ons al hierdie dinge met net matriksvermenigvuldiging kon bereik
Nie net dat ons ook hierdie inbedding in 'n teken -kas wou stoor nie
Dat ons dit nie vir elke iterasie kan hergebruik nie, gebruik dit weer vir toekomstige puntvoorspelling, het ons sommige getrek
truuks hier waar ons al hierdie bedrywighede gedoen het net op die DOT -produkmotor, dit is eintlik lekker dat ons span
Het kreatiewe maniere gevind om al hierdie bedrywighede op die reismotor op maniere te karteer
Dit is nie eens voorgestel toe hierdie hardeware ontwerp is nie, maar dit is nie die enigste ding wat ons moet nie
Doen om hierdie werk te doen, het ons eintlik 'n hele aantal bewerkings en funksies geïmplementeer om hierdie model te maak
samestelling om die inname -akkuraatheid te verbeter, sowel as om prestasie te optimaliseer
Al hierdie dinge het ons gehelp om die 75 miljoen parametermodel net minder as 10 te bestuur
millisekonde van latency wat net 8 watt krag verbruik
Maar dit is nie die enigste argitektuur wat in die motor loop nie, daar is soveel ander argitektuurmodules en netwerke
Ons moet in die motor hardloop om 'n gevoel van skaal te gee. Daar is ongeveer 'n miljard parameters van al die netwerke
Gesamentlike vervaardiging van ongeveer 1000 neurale netwerkseine, so ons moet seker maak
Ons optimaliseer hulle gesamentlik en sodanig dat ons die rekenaar maksimeer
Gebruik deurvloei en verminder die latency, sodat ons 'n samesteller gebou het net vir neurale
netwerke wat die struktuur aan tradisionele samestellers deel soos u kan sien, neem die massiewe
Grafiek van neurale nette met 150K -nodusse en 375K -verbinding neem hierdie ding
verdeel dit in onafhanklike subgrafies en com dwing elkeen daarvan
subgrafies vir die inferensietoestelle, dan het ons 'n neurale netwerk
Linker wat die struktuur deel na die tradisionele skakelaar waar ons hierdie skakeltydoptimalisering uitvoer
Daar los ons 'n aflynoptimaliseringsprobleem UH op met rekenaargeheue en geheue
bandwydte beperkings sodat dit 'n geoptimaliseerde skedule het wat in die motor uitgevoer word
Op die runtime het ons 'n basterskeduleringstelsel ontwerp wat basies doen
Heterogene skedulering op een SOC en verspreide skedulering oor albei die SoC's om hierdie netwerke in 'n model te laat loop
parallelle mode om 100 druppels rekenaarbenutting te kry, moet ons oor al die
lae sagteware van die instelling van die netwerkargitektuur die samesteller alles
Die manier om 'n lae -latency hoë bandwydte RDMA -skakel oor beide die SRC's te implementeer en in werklikheid nog dieper te gaan
Die begrip en optimalisering van die kas samehangende en nie-samehangende datapaaie van die versneller in die SOC Dit is baie
van optimalisering op elke vlak om seker te maak dat ons die hoogste raamkoers kry en soos elke millisekonde tel
hier en dit is dit is net die dit is die
visualisering van die neurale netwerke wat in die motor loop, is dit ons digitale brein in wese soos u kan sien
Hierdie bewerkings is niks anders as net die matriksvermenigvuldiging om 'n paar regte bedrywighede wat in die motor loop nie
Om hierdie netwerk met 'n miljard parameters op te lei of op te lei, benodig u baie gemerkte data, sodat Aegon gaan praat
oor hoe bereik ons dit met die outo -etiketteringspyplyn
dankie uh dankie sherry
uh hi almal ek is Jurgen Zhang en ek lei 'n meetkundige visie by Autopilot
So ja, kom ons praat oor motoretikettering
Ons het dus verskillende soorte etiketteringsraamwerke om verskillende soorte netwerke te ondersteun, maar ek wil vandag graag
Fokus hier op die ongelooflike bane net om suksesvol op te lei en te veralgemeen
Hierdie netwerk na oral waar ons dink dat ons tien miljoene reise van
waarskynlik een miljoen kruising of selfs meer so
Hoe om dit dan te doen, sodat dit beslis haalbaar is om voldoende te kry
hoeveelheid reise omdat ons alreeds soos Tim vroeër verduidelik het, ons het reeds 500 000 reise per dag kontantkoers
Um is egter 'n baie uitdagende tegniese probleem om al hierdie data in 'n opleidingsvorm om te skakel
Om hierdie uitdaging op te los, het ons verskillende maniere van hand- en outo -etikettering probeer
Die eerste kolom tot die tweede van die tweede na die derde plek het elke voorskot ons byna 100x verbetering in
deurset, maar nog steeds UH het ons 'n nog beter motoretiketmasjien gewen wat kan voorsien
Voorsien verskaffers van goeie gehalte diversiteit en skaalbaarheid
Om aan al hierdie vereistes te voldoen, ten spyte van die groot hoeveelheid ingenieurspoging wat hier benodig word, het ons 'n
Nuwe bestel-etiketteringsmasjien aangedryf deur meervoudige rekonstruksie, sodat dit 5 miljoen uur kan vervang
Handmatige etikettering met net 12 uur op groep vir etikettering van 10 000 reise
So hoe ons opgelos het, is daar drie groot stappe. Die eerste stap is 'n hoë presisie -baan en struktuurherstel deur
Multi-kamera visuele traagheids-odometrie, so hier word al die funksies, insluitend grondoppervlak, afgelei van video's
deur neurale netwerke wat dan in die vektorruimte opgespoor en gerekonstrueer word
Die tipiese drywingstempo van hierdie baan in die motor is dus soos 1,3 sentimeter
per meter en 0,45 milli radiaan per meter, wat redelik ordentlik is, met inagneming van die kompakte rekenaar daarvan
vereiste as die hersteldiens en rou besonderhede word ook as 'n sterk gebruik
Voorligting vir die latere handverifiëringstap Dit is ook in elke FSD aangeskakel
voertuig sodat ons voorafverwerkte trajekte en strukture saam met die Trip-data kry
Die tweede stap is multi-2-rekonstruksie, wat die groot en kernstuk van hierdie masjien is
Die video wys dus hoe die voorheen getoonde reis gerekonstrueer en in lyn is
met ander reise basies ander reise van verskillende mense, nie dieselfde voertuig nie, so dit word deur meerdere gedoen
Internetstappe soos kursusbelyning paarsgewys ooreenstem met die optimalisering van gewrigte en verdere oppervlakverfyning
Uiteindelik kom die menslike ontleder in en finaliseer die etiket
Dus is elke gelukkige stappe reeds ten volle op die groep, so die
Die hele proses duur gewoonlik net 'n paar uur
Die laaste stap is eintlik outomaties etiketteer die nuwe reise
Hier gebruik ons dieselfde enjin met 'n multi-trip-belyning, maar slegs tussen voorafgeboude rekonstruksie en elke nuwe
reis, so dit is baie eenvoudiger as om al die snitte heeltemal te rekonstrueer
Daarom neem dit slegs 30 minute per reis na 'n ander etiket in plaas van handleiding
'n paar uur handmatige etikettering en dit is ook die sleutel tot skaalbaarheid
van hierdie masjien skaal hierdie masjien maklik so lank soos ons
het berekenings- en reisdata beskikbaar, sodat ongeveer 50 bome nuut bestel het
Hier word gemerk en sommige van hulle word hier getoon, so 53 uit verskillende voertuie
Dit is dus hoe ons die ruimtetydskyfies van die wêreld inneem en omskep in
Die netwerk toesig ja, een ding wat ek graag wil opmerk, is dat dit weer net gepraat het oor hoe ons outomaties is
etiketteer ons bane, maar ons het motorarbeiders vir byna elke taak wat ons doen, insluitend ons beplanner en baie van
Dit is volledig outomaties soos geen mense wat betrokke is byvoorbeeld vir voorwerpe of ander kinematika nie
Futures alles kom net van outo -etikettering en dieselfde is ook waar vir besetting en ons het regtig net
het 'n masjien rondom hierdie ja gebou, so as jy nie meer een skyfie kan teruggaan nie
Dit staan parallel op die groep, so dit klink redelik eenvoudig, maar
Dit was regtig nie, miskien is dit lekker om te deel hoe so iets oor UM kom, so 'n ruk gelede het ons nie gehad nie
motoretikettering glad nie en dan maak iemand 'n draaiboek wat begin werk, dit begin beter werk totdat ons 'n
volume wat redelik hoog is en ons het duidelik 'n oplossing nodig, en daar was dus twee ander ingenieurs in
Ons span wat soos u was, weet dit is 'n interessante ding wat u weet wat ons nodig het om 'n hele grafiek te bou
in wese python -funksies dat ons die een na die ander eers moet hardloop, trek jy die snit, dan doen jy 'n bietjie skoonmaak
'n bietjie netwerk -inferensie dan nog 'n netwerk -afleiding totdat u dit uiteindelik regkry, maar u moet dit as 'n
groot skaal, so ek sê ek sê vir hulle dat ons waarskynlik moet skiet vir u weet 100 000 snitte per dag of soos 100 000 items
Dit lyk goed en daarom sê die ingenieurs goed dat ons kan doen, weet jy 'n bietjie postgres en 'n bietjie
van elmboogvet ons kan dit doen, maar ons is 'n bietjie later en ons doen 20
miljoen van hierdie funksies elke dag weer, trek ons ongeveer 'n halfmiljoen in
Knipsels en op diegene wat ons 'n groot aantal funksies het, elkeen op 'n streaming, en dit is die soort rug
einde infra wat ook nodig is om nie net opleiding te doen nie, maar ook outo -etikettering ja, dit is regtig soos 'n fabriek
produseer etikette en soortgelyke produksielyne lewer UH -inventaris van gehalte op, soos al dieselfde konsepte wat hierop toegepas word
Etiketfabriek UH wat vir u van toepassing is, ken die fabriek vir ons motors wat reg is
okay uh dankie uh so ja so afsluiting
Hierdie afdeling UH, ek wil graag 'n paar meer uitdagende en interessante voorbeelde vir netwerke deel en selfs
Vir mense is dit waarskynlik van bo af soos voorbeelde vir 'n gebrek aan leuens of mistige nag of rotonde
en okklusies deur swaar okklusies deur geparkeerde motors en selfs reënerige nag met hul reëndruppels op kameralense
Dit is uitdagend, maar sodra hul oorspronklike tonele volledig deur ander snitte gerekonstrueer word
Outomaties gemerk sodat ons kaarte nog beter kan ry deur hierdie uitdagende scenario's
Laat ek nou die mikrofoon aan David deurgee om meer te wete te kom oor hoe SIM die nuwe wêreld bo -op hierdie etikette skep, dankie
julle
Weereens baie dankie my naam is David en ek gaan oor simulasie praat, so simulasie speel 'n kritieke rol in
die verskaffing van data wat moeilik is om te bron en of moeilik is om te etiketteer, maar 3D -tonele is berug
om byvoorbeeld die gesimuleerde toneel wat agter my speel, te produseer
komplekse kruising vanaf Marketstraat in San Francisco sou dit twee weke duur
Kunstenaars om te voltooi en vir ons is dit pynlik stadig, maar ek gaan praat oor die gebruik
Jaegan se outomatiese grondwaarde -etikette saam met 'n paar splinternuwe gereedskap wat ons in staat stel om dit prosedureel te genereer
toneel en baie hou daarvan in net vyf minute, dit is 'n duisend keer vinniger as voorheen
Laat ons dus in ons toneel ingaan soos hierdie geskep word, begin ons deur die outomatiese grond te pyp
Waarheid etikette in ons gesimuleerde wêreldskepper -gereedskap in die sagteware Houdini, begin met padgrens
Etikette Ons kan 'n soliede padnetwerk genereer en dit weer met die baangrafieketikette-etikette weergee
Besonderhede soos kruispad helling en gedetailleerde vermenging van materiaal
Vervolgens kan ons die lyndata gebruik en meetkunde oor sy oppervlak vee en dit na die pad projekteer om baanverf te skep
plakkers dan met behulp van mediaanrande wat ons kan kweek
Eilandgeometrie en bevolk dit met gerandomiseerde blare Dit verander die sigbaarheid van die toneel drasties
Nou kan die buitewêreld gegenereer word deur 'n reeks gerandomiseerde heuristieke, 'n modulêre bouopwekkers
Skep visuele obstruksies terwyl voorwerpe wat willekeurig geplaas word, soos brandkrane die kleur van die krommes kan verander
Bome kan blare onder dit verduisterende lyne of rande laat val
Vervolgens kan ons kaartdata inbring om posisies in te lig oor dinge soos verkeersligte of stoptekens wat ons kan opspoor
Dit is normaal om belangrike inligting soos die aantal bane te versamel en selfs akkurate straatname op die
teken hulself hierna met behulp van baangrafiek, ons kan die baanverbinding en die rigting van die rigting bepaal
Padmerke op die pad en hulle vergesel padtekens en uiteindelik met baangrafiek self
kan die aanpassing van die baan en ander nuttige statistieke bepaal om ewekansige verkeerspermutasies insider -simulator te veroorsaak
En dit is weer outomaties geen kunstenaars in die lus nie en gebeur binne enkele minute, en dit stel ons nou op om te doen
'n paar mooi dinge, want alles is gebaseer op data en heuristieke wat ons kan begin fuzz
parameters om visuele variasies van die enkelgrondwaarheid te skep, dit kan so subtiel wees soos voorwerpplasing en willekeurig
Materiaal omruil na meer drastiese veranderinge soos heeltemal nuwe biome of liggings van die omgewing soos stedelike
Voorstedelik of landelik Dit stel ons in staat om oneindige geteikende permutasies vir spesifieke te skep
grondwaarhede waarvoor ons meer grondwaarheid nodig het, en dit alles gebeur binne 'n klik van 'n
knoppie en ons kan selfs hierdie een stap verder neem deur ons grondwaarheid te verander
Sê self dat John wil hê dat sy netwerk meer aandag moet gee aan die rigtinggewende padmerke
Om 'n komende gevangene linkerbaan beter op te spoor, kan ons ons baangrafiek binne -in verander
die simulator om mense te help om heeltemal nuwe vloei deur hierdie kruising te skep om te help
Fokus die netwerk se aandag op die padmerke om meer akkurate voorspellings te skep, en dit is 'n goeie voorbeeld van hoe dit
Gereedskap stel ons in staat om nuwe data te skep wat nooit uit die regte wêreld versamel kan word nie
En die ware krag van hierdie instrument is in sy argitektuur en hoe ons alle take parallel met oneindig kan uitvoer
Skaal sodat u die Tile Creator -instrument in aksie gesien het om die grondwaarheid te omskep
Etikette in hul eweknieë Volgende kan ons ons Tile Extractor -instrument gebruik
Om hierdie gegewens in Geohash -teëls te verdeel, ongeveer 150 meter vierkantig in grootte
Ons stoor dan die data uit in aparte meetkunde- en instansielêers. Dit gee ons 'n skoon bron van data wat maklik is
las en stel ons in staat om die enjin vir die toekoms vir die toekoms te lewer
dan met behulp van 'n teëllaaierinstrument kan ons 'n aantal van die kasteëls oproep met behulp van 'n Geohash -ID wat ons tans doen
Ongeveer hierdie vyf by vyf teëls of drie by drie wat gewoonlik rondom vloothotspots of interessante landgrafiek gesentreer is
Liggings in die teëllaaier skakel ook hierdie teëlstelle in U -bates vir verbruik
deur die onwerklike enjin en gee u 'n voltooide projekproduk uit wat u in die eerste skyfie gesien het
En dit stel ons regtig op vir grootte en skaal soos u op die kaart agter ons kan sien
Ons kan maklik die meeste van die stadstrate in San Francisco genereer, en dit het nie jare of selfs maande se werk geneem nie, maar
Twee weke vir een persoon kan ons aanhou om almal te bestuur en te groei
Hierdie data wat ons PDG -netwerk binne die gereedskap gebruik, stel ons in staat om te gooi
Bereken daarop en regenereer al hierdie teëlstelle oornag. Dit verseker dat alle omgewings van
konsekwente kwaliteit en funksies wat baie belangrik is vir opleiding, aangesien nuwe ontologieë en seine voortdurend is
vrygestel en nou volle sirkel kom, want ons
het al hierdie teëlstelle gegenereer uit grondwaarheidsdata wat al die vreemde verwikkeldhede uit die regte wêreld bevat
En ons kan dit kombineer met die prosedurele visuele en verkeersvariëteit om onbeperkte geteikende data vir die
netwerk om van te leer en dit sluit die SIM -afdeling af wat ek aan Kate sal deurgee om te praat oor hoe ons kan
Gebruik al hierdie data om outopilot te verbeter dankie
Dankie David Hallo almal, my naam is Kate Park en ek is hier om te praat oor die datakoma wat die proses is waarmee ons
Verbeter ons neurale netwerke via data, ons gaan u wys hoe ons intervensies bepaal
via data en loop u deur die lewe van hierdie spesifieke snit in hierdie scenario
Autopilot nader 'n draai en voorspel verkeerd dat die voertuig wat vir verkeer gestop is, en dus
'n voertuig wat ons sou vertraag, want in werklikheid is daar niemand in die motor nie. Dit is net ongemaklik geparkeer. Ons het dit gebou
gereedskap om die verkeerde voorspellings te identifiseer, korrigeer die etiket en kategoriseer dit
Knip in 'n evalueringsstel Hierdie spesifieke snit is een van 126
dat ons as uitdagende geparkeerde motors op beurte gediagnoseer het
infra ons kan hierdie evalueringsstel saamstel sonder enige ingenieursbronne
vir hierdie spesifieke uitdaging om die uitdaging van die uitdaging op te los
Vereis duisende voorbeelde soos dit en dit is iets wat Tesla kan doen, gebruik ons ons data eenvoudig
aankope van infra -versoekdata en gebruik die gereedskap wat voorheen getoon is om die
Etikette deur chirurgies die verkeerde voorspellings van die huidige model te teiken, voeg ons slegs die waardevolste by
Voorbeelde van ons opleidingsstel Ons maak chirurgies op 13 900 snitte en UH
omdat dit voorbeelde was waar die huidige model sukkel, hoef ons nie eens die modelargitektuur a te verander nie
Eenvoudige manier om met hierdie nuwe waardevolle gegewens op te dateer, is genoeg om die uitdagingssaak op te los, sodat u sien dat ons nie meer voorspel nie
daardie kruisingsvoertuig so gestop soos in oranje getoon, maar geparkeer soos in rooi aangetoon
In die akademie sien ons gereeld dat mense data konstant hou, maar by Tesla
Die teendeel wat ons keer op keer sien dat data een van die beste, indien nie die mees deterministiese hefboom is nie
Om hierdie intervensies op te los, het ons u net die datasjinlus gewys
vir een uitdaging geval, naamlik hierdie geparkeerde motors by draaie, maar daar is baie uitdagingsgevalle, selfs vir een sein van
Voertuigbeweging Ons pas hierdie datakommotorlus toe op elke enkele uitdaging wat ons gediagnoseer het of dit busse is
Curvy Roads stop voertuie parkeerterreine en ons voeg nie net data by sodra ons nie
Doen dit weer en weer om die semantiese in werklikheid te vervolmaak. Ons het ons voertuigbewegingssein vyf keer opgedateer
En met elke gewigsopdatering wat op die nuwe data opgelei is, stoot ons ons voertuigbewegings akkuraatheid op en op
Hierdie data -enjinraamwerk is van toepassing op al ons seine of dit 3D is
multi-cam-video, of die data 'n mens gemerk is wat outomaties gemerk is of gesimuleer word, of dit nou 'n aflynmodel is of 'n
Aanlyn modelmodel en Tesla kan dit op skaal doen vanweë die vloot
Voordeel van die infra wat ons enjinspan gebou het en die etiketteringsbronne wat ons netwerke voed
Om al hierdie data op te lei, benodig ons 'n groot hoeveelheid rekenaar, so ek sal dit aan Pete en Ganesh oorhandig om oor te praat
Die Dojo Supercomputing -platform dankie [applous]
Dankie dankie Katie
dankie almal dankie dat jy daar in is, ons is amper daar, my naam is pete bannon ek bestuur die gewoonte
silikon- en lae spanningspanne by Tesla en my naam is Ganesh Venkat ek loop die
Doji -program
[Applous] Dankie dat ek gereeld gevra word waarom is 'n motor
Maatskappy Bou 'n superrekenaar vir opleiding en hierdie vraag fundamenteel
Verstaan die aard van Tesla in sy hart Tesla is 'n harde tegnologie
Onderneming regoor die onderneming werk mense hard aan wetenskap en ingenieurswese
Om die fundamentele begrip en metodes wat ons beskikbaar het, te bevorder
Om motors energie -oplossings robotte en enigiets anders te bou, kan ons dit doen
Verbeter die menslike toestand regoor die wêreld Dit is 'n super opwindende ding om deel te wees en dit is 'n voorreg om 'n baie
Klein stuk daarvan in die halfgeleiergroep vanaand gaan ons 'n bietjie oor dojo praat en jou 'n
Opdatering oor wat ons die afgelope jaar kon doen, maar voordat ons dit doen, wou ek 'n bietjie gee
agtergrond oor die aanvanklike ontwerp wat ons 'n paar jaar gelede begin het toe ons begin het, was om 'n
aansienlike verbetering aan die opleidingsvertraging vir ons outopilot -span van sommige van
Die grootste neurale netwerke wat hulle vandag opgelei het, loop langer as 'n maand, wat hul vermoë om vinnig te belemmer, belemmer
ondersoek alternatiewe en evalueer dit sodat u weet dat 'n snelheid van 30x sou wees
regtig lekker as ons dit op 'n mededingende en -energie -mededingende manier kan voorsien
Om dit te kan doen, wou ons 'n skyfie bou met baie rekenkundige rekenkunde
eenhede wat ons met 'n baie hoë doeltreffendheid kon benut en ons het baie tyd spandeer om te bestudeer of ons dit kan doen
met behulp van DRM verskillende verpakkingsidees wat almal misluk het en op die ou end alhoewel
Dit het gevoel soos 'n onnatuurlike handeling wat ons besluit het om DRAM as die primêre opbergingsmedium vir hierdie stelsel te verwerp en eerder te fokus
op SRAM ingebed in die chip SRAM bied ongelukkig 'n beskeie
hoeveelheid kapasiteit, maar buitengewoon hoë bandwydte en baie lae latency en dit stel ons in staat om hoë gebruik te bewerkstellig
met die rekenkundige eenhede die keuses
Van die spesifieke keuse het gelei tot 'n hele klomp ander keuses, byvoorbeeld as u virtuele geheue wil hê
bladsy tafels Hulle neem baie ruimte in. Ons het nie ruimte gehad nie, so geen virtuele geheue nie; ons het ook nie onderbreek nie
Accelerator is 'n blote bindingsrob stuk hardeware wat aan 'n samesteller aangebied word
In die samesteller is dit verantwoordelik vir die skedulering van alles wat op 'n terministiese manier gebeur, sodat daar nie nodig is nie of
Selfs die begeerte na onderbrekings in die stelsel het ons ook verkies om model te volg
parallelisme as 'n opleidingsmetodologie wat nie die tipiese situasie is nie
Die meeste masjiene gebruik deesdae data -parallelisme wat bykomende geheuekapasiteit verbruik wat ons natuurlik nie het nie
Dus het al hierdie keuses ons daartoe gelei om 'n masjien te bou wat redelik radikaal is
Anders as wat vandag beskikbaar is, het ons ook 'n hele klomp ander doelwitte gehad, een van die belangrikste was nee
perke, so ons wou 'n rekenaarstof bou wat op 'n ongebonde manier sou skaal vir die grootste deel wat ek natuurlik bedoel
Daar is nou en dan fisieke grense, maar jy weet amper of jou model was
Te groot vir die rekenaar, jy moes net 'n groter rekenaar koop, dit is waarna ons vandag gesoek het, die Way -pakket
masjiene word verpak, daar is 'n redelike vaste verhouding van byvoorbeeld GPU CPU's en
en DRAM -kapasiteit en netwerkvermoë en ons wou regtig alles verontdeel, sodat ons namate modelle ontwikkel het
wissel die verhoudings van die verskillende elemente en maak die stelsel meer buigsaam om aan die behoeftes van die
Autopilot -span ja, en dit is so waar, soos geen perke -filosofie ons leidende ster was nie
al die pad van al ons keuses was rondom dit en en vir die
punt dat ons nie wou hê dat die tradisionele datasentruminfrastruktuur ons moet beperk nie
kapasiteit om hierdie programme vinnig uit te voer
Daarom is jammer daaroor, dit is die rede waarom ons geïntegreer het
vertikaal ons datasentrum se hele datasentrum deur 'n vertikale te doen
Integrasie van die datasentrum Ons kon nuwe doeltreffendheidsvlakke uittrek. Ons kan krag optimaliseer
Afleweringsverkoeling en stelselbestuur regoor
die hele datasentrumstapel eerder as om boks per vak te doen en dit te integreer
daardie bokse in datasentrums en om dit te doen, wou ons ook
integreer vroeg om die grense van skaal UH vir ons uit te vind
Sagteware -werklading sodat ons dojo -omgewing in ons outopilot -sagteware baie vroeg geïntegreer het en baie geleer het
lesse en vandag gaan UH Bill Chang oor ons hardeware -opdatering sowel as sommige
van die uitdagings wat ons op die pad gehad het, en Rajiv Kurian sal u 'n
Kyk na ons samesteller -tegnologie en gaan oor sommige van ons oulike resultate
net daar gaan jy
dankie pete dankie ganesh um ek begin vanaand met 'n hoë vlak
visie van ons stelsel wat sal help om die weg te stel vir die uitdagings en die probleme wat ons is
oplos en dan ook hoe sagteware dit dan vir prestasie sal benut
Nou is ons visie vir dojo om 'n enkele verenigde te bou, 'n baie groot
Een sagteware sou 'n naatlose rekenaarvlak sien met wêreldwyd aanspreeklik
baie vinnige geheue en alles verbind met eenvormige hoë bandwydte en
Lae latency nou om dit te besef wat ons moet gebruik
digtheid om prestasie te bereik nou gebruik ons tegnologie om hierdie digtheid te kry om die vlakke van
hiërargie tot by die skaal uit die skaalstelsels
nou het Silicon Technology dit gebruik, dit het dit al dekades lank gedoen
het die wet van Moore gevolg vir digtheid en integrasie om prestasiekaal te kry
nou 'n belangrike stap om te besef dat visie ons opleidingsteël was, kan ons nie net 25 sterftes integreer nie
buitengewoon hoë bandwydte, maar ons kan dit op enige aantal bykomende teëls skaal deur dit net aanmekaar te koppel
Nou verlede jaar het ons ons eerste funksionele opleidingsteëls ten toon gestel en ons het destyds reeds werklading gehad
dit en sedertdien werk die span hier hard en ywerig om te ontplooi
Dit op skaal nou het ons ongelooflike vordering gemaak en baie mylpale gehad en van
kursus het ons baie onverwagte uitdagings gehad, maar dit is waar ons vinnig misluk
Filosofie het ons in staat gestel om ons grense te stoot
Die druk van die digtheid vir prestasie bied nou alle nuwe uitdagings. Een gebied is kraglewering
Hier moet ons die krag aan ons Compute -matrijs lewer, en dit beïnvloed direk
Ons toplyn -berekeningsprestasie, maar ons moet dit doen met ongekende digtheid wat ons moet ooreenstem met ons
Die toonhoogte met 'n kragdigtheid van byna een amp per millimeter vierkantig
En as gevolg van die uiterste integrasie, moet dit 'n veelvuldige vertikale vlak wees
kragoplossing en omdat daar 'n komplekse heterogene materiaal is, stapel op
Ons moet die materiaaloorgang noukeurig bestuur, veral CTE
Waarom is die koëffisiënt van termiese uitbreiding in hierdie geval 'n fundamentele materiële eienskap
En as dit nie noukeurig bestuur word nie, sou die stapel homself letterlik uitmekaar ruk
Daarom het ons hierdie poging begin deur saam met verkopers te werk om dit te lewer om dit te ontwikkel
kragoplossing, maar ons het besef dat ons hierdie interne moet ontwikkel
Nou om die balansskedule en die risiko van vinnige iterasies op te stel om te ondersteun
Beide ons stelsel Bring en sagteware -ontwikkeling en ook om die optimale ontwerp te vind en
Stapel op wat aan ons finale produksiedoelwitte sou voldoen en uiteindelik kon ons CTE met meer as 50 persent verminder
en voldoen aan ons prestasie met 3x oor ons aanvanklike weergawe
Nou onnodig om te sê om hierdie optimale materiaal op te vind terwyl u maksimeer
Prestasie by digtheid is uiters moeilik
Nou het ons wel onverwagte uitdagings gehad. Hier is 'n voorbeeld waar ons die
grense van integrasie wat gelei het tot komponentfoute
Dit het begin toe ons tot groter en langer werklading opskaal, en dan tussenmateriaal af en toe 'n enkele
Die webwerf op 'n teël sou nou misluk, het hulle as herstelbare mislukkings begin, maar terwyl ons baie gedruk het
Hoër en hoër krag sou permanente mislukkings word
Om hierdie mislukking te verstaan, moet u verstaan waarom en hoe ons ons bou
Kragmodules wat digtheid op elke vlak oplos, is die IS
is die hoeksteen van die bereiking van ons stelselprestasie nou omdat ons x y -vlak gebruik word
hoë bandwydte kommunikasie Alles anders moet vertikaal gestapel word
Dit beteken dat alle ander komponente anders as ons sterf in ons kragmodules moet wees
Dit sluit nou ons klok en ons kragbronne en ook ons stelselbeheerders in
Nou in hierdie geval was die mislukkings te wyte aan die verlies van klokuitsette van ons ossillators
en na 'n uitgebreide ontfout het ons gevind dat die oorsaak daarvan te wyte was aan vibrasies op die module vanaf
Piëzo -elektriese effekte ons nabygeleë kondenseerders
Nou is sangdoppies nie 'n nuwe verskynsel nie en is in werklikheid baie algemeen in kragontwerp
Maar gewoonlik word klokskyfies in 'n baie stil gebied van die bord geplaas en gereeld
nie beïnvloed deur kragstroombane nie, maar omdat ons hierdie vlak van integrasie moes bereik
word nou in 'n baie nabye omgewing geplaas as gevolg van ons skakelfrekwensie en
Toe het die vibrasie -resonansie geskep dat dit outo -vlak vibrasie op ons MEMS veroorsaak het
ossillator wat veroorsaak het dat dit nou kraak, die oplossing vir hierdie probleem is 'n
Meervoudige benadering Ons kan die vibrasie verminder deur sagte terminale pette te gebruik
Ons kan ons MEMS -deel met 'n laer Q -faktor vir die buitenste vlak rigting opdateer
En ons kan ook ons skakelfrekwensiefrekwensie opdateer om die resonansie verder van hierdie af te stoot
sensitiewe bande nou toevoeg tot die digtheid uh by
Die stelselvlak wat ons baie vorder op infrastruktuurvlak
Ons het geweet dat ons elke aspek van die datasentruminfrastruktuur moet ondersoek
Om ons ongekende krag en koeldigtheid te ondersteun
Ons het 'n volledig pasgemaakte CDU ingebring om Dojo se digte verkoeling te ondersteun
vereistes en die ongelooflike deel is dat ons dit kan doen teen 'n fraksie van die koste teenoor die aankoop van die rak en
verander dit en aangesien ons dojo -kabinet genoeg krag en verkoeling integreer om by 'n
hele ry standaard IT -rakke Ons moet ons kabinet noukeurig ontwerp en
infrastruktuur saam en ons het al verskeie iterasies van hierdie kabinet deurgemaak om te optimaliseer
Dit en vroeër in hierdie jaar het ons begin om ons krag en verkoeling te toets
infrastruktuur en ons kon dit oor twee megawatt druk voordat ons ons substasie laat val en 'n oproep van die
stad ja nou verlede jaar het ons net 'n
'n paar komponente van ons stelsel Die pasgemaakte D1 Die en die opleidingsteëls
Ons het die uitgangspod gespot as ons einddoel deur die oorblywende dele van ons stelsel wat nodig is om te bou
Uit hierdie uitgangspod is die stelselbak 'n belangrike deel van
As ons ons visie van 'n enkele versneller besef, kan ons naatloos naatloos wees
Verbind teëls nie net binne die kabinet nie, maar ook tussen kaste
Ons kan hierdie teëls met 'n baie nou spasiëring oor die hele versneller verbind
En dit is hoe ons ons eenvormige kommunikasie bereik, dit is 'n gelamineerde busbalk wat dit toelaat
ons om baie hoë krag meganiese en termiese ondersteuning te integreer in 'n uiters digte integrasie
Dit is 75 millimeter hoog en ondersteun ses teëls op 135 kilogram
Dit is die ekwivalent van drie tot vier volledig gelaaide hoëprestasie -rakke
Vervolgens moet ons data na die opleidingsteëls voer. Dit is waar ons die Dojo -koppelvlakverwerker ontwikkel het
Dit bied ons stelsel 'n hoë bandwydte -dram om ons opleidingsdata op te stel
En dit bied volledige geheue bandwydte aan ons opleidingsteëls met behulp van TTP ons gebruik
protokol wat ons kan gebruik om oor ons hele versneller te kommunikeer, dit het ook 'n hoë snelheid Ethernet
Help ons om hierdie pasgemaakte protokol oor standaard Ethernet uit te brei en ons bied inheemse hardeware -ondersteuning
Hiervoor met min tot geen sagteware -oorhoofse koste en laastens kan ons daaraan koppel
Deur 'n standaard Gen 4 PCIe -koppelvlak
Nou pas ons 20 van hierdie kaarte per skinkbord en dit gee ons 640 gigabyte hoog
Bandwydte -dram en dit bied ons verdeelde geheuelaag vir ons opleidingsteëls
Hierdie kaarte is 'n hoë bandwydte -inname -pad deur PCIe en Ethernet
Dit bied ook 'n hoë tempox z-verbondenheidspad wat kortpad oor ons groot dojo moontlik maak
Versneller nou integreer ons die gasheer
Direk onder ons stelselbakkie bied hierdie gashere ons inname -verwerking en koppel aan ons koppelvlak