Depois de ser hypado por mais de dois anos, Tesla finalmente revelou seu supercomputador chamado “Dojo” durante o dia de IA da empresa em 19 de agosto, que apresentou muitas das novas tecnologias da empresa, como o projeto humanóide.
O CEO Elon Musk tinha muito o que fazer devido à sua alegação de que o Dojo teria a capacidade de mais de um exaFLOP, ou um quintilhão de operações de ponto flutuante por segundo.
A Tesla já possui uma enorme quantidade de dados de vídeo de seus mais de 1 milhão de veículos, e esses dados são usados para treinar suas redes neurais.
Quando a empresa começou a treinar suas redes de visão computacional com as opções de hardware atuais, foi recebida com decepção e a crença de que seria melhor fazê-lo internamente.
O chip Dojo D1 usa tecnologia de 7 nanômetros enquanto oferece largura de banda e desempenho de computação inovadores.
O chip D1 é o segundo chip projetado pela própria Tesla, e seguiu o chip FSD que está presente no hardware do computador FSD 3 em Veículos tesla.
Especificações do chip D1
O chip D1 também contém 362 TeraFLOPs de poder de processamento, e a empresa afirma que possui uma computação em nível de GPU e flexibilidade em nível de CPU, com IO de switch de rede.
De acordo com Ganesh Venkataramanan, diretor sênior da Tesla de Piloto automático hardware e líder do projeto Dojo, “Isso foi inteiramente projetado pela equipe da Tesla internamente. Desde a arquitetura até o pacote. Este chip é como um computador no nível da GPU com flexibilidade no nível da CPU e duas vezes a largura de banda de E/S no nível do chip de rede.”
Os chips são capazes de se conectar uns aos outros sem qualquer cola, o que levou a Tesla a conectar 500,000 nós. A interface, energia e gerenciamento térmico são adicionados, o que resulta em um bloco de treinamento de nove pFLOPs com 36 TB por segundo de largura de banda. Tudo isso está em um formato de comida menos de um cúbico.
Em vez de cortar o wafer em pedaços, Tesla decidiu deixar 25 SoCs no wafer e usar silício de alta qualidade. Isso permite que os chips se comuniquem entre si sem perder velocidade, além de manter a qualidade da placa-mãe.
O Dojo exigia apenas 120 wafers totalmente funcionais, o que é impressionante, já que a Intel precisava fazer mais de 130,000 wafers de 300 mm em 2014. O custo do Dojo também deve ser substancialmente menor, pois usa wafers pequenos seccionados de cinco por cinco.
Outra característica impressionante do Dojo é que ele não possui nenhuma Ram fora do SoC. Em vez disso, a empresa optou por usar um cache, que é uma camada mais rápida de memória de acesso aleatório.
Construindo um verdadeiro supercomputador Dojo
Para Tesla construir o primeiro supercomputador Dojo real, ele deve formar um cluster de computação com os blocos de treinamento. Segundo a empresa, ele pode combinar 2 x 3 ladrilhos em uma bandeja e duas bandejas em um gabinete de computador, o que resultaria em mais de 100 pFLOPs por gabinete.
Por causa da enorme largura de banda, Tesla diz que pode conectar tudo isso para criar o HexaPod, que quebrará a barreira do ExaFlop de computadores em um sistema de 10 gabinetes. Este tem sido um dos principais obstáculos no desenvolvimento de supercomputadores poderosos.
Como o Dojo mudará a tecnologia?
O Dojo da Tesla tem o potencial de realmente impactar o cenário de tecnologia do futuro, especialmente devido à demanda exponencialmente crescente por velocidade e capacidade de treinamento de redes neurais. Se tudo correr como planejado, o Dojo alcançaria o melhor desempenho de treinamento de IA e permitiria rede neural modelos ao mesmo tempo que são eficientes em termos de energia e custos.
Com a introdução do chip Dojo M1, o mundo da tecnologia provavelmente está caminhando para um mercado de supercomputadores extremamente competitivo. Os supercomputadores têm o potencial de resolver muitos dos maiores problemas da sociedade e podem nos transformar em super-humanos. Esses tipos de chips de computação podem resolver problemas globais de privacidade e identidade, levar a avanços incríveis em saúde e pesquisa médica, criar logística sustentável da cadeia de suprimentos e muito mais.
Supercomputadores como o Dojo também podem ter enormes consequências econômicas, com o primeiro grupo ou nação a alcançar uma infraestrutura de supercomputação eficiente levando a vantagem. Eles levarão a maneiras novas e precisas de prever o futuro e analisar as condições atuais, e o poder da computação começará a afetar todos os setores.
Palavras finais
Enquanto o sistema ainda está sendo montado, Musk afirma que estará operacional no próximo ano.
Se este for o caso, o Dojo se tornaria o computador de treinamento de IA mais rápido já desenvolvido, mantendo a eficiência de energia e um formato pequeno em comparação com a maioria dos outros supercomputadores.
It provavelmente será usado pela Tesla para treinar seus redes neurais para a tecnologia de direção autônoma, mas a empresa também planeja disponibilizá-la para outros desenvolvedores.
Aqui está um link para o white paper do Dojo.
Dojo é um passo importante para alcançar este mundo de supercomputação, e é apenas um dos muitos que ainda estão por vir.
Embora a tecnologia provavelmente seja usada nos próprios veículos autônomos da Tesla a princípio, ninguém deve se surpreender se ela eventualmente chegar a vários setores diferentes, públicos e privados.
À medida que continuamos a progredir em um mundo orientado por dados, o uso no mundo real desses supercomputadores está se aproximando rapidamente.
Deixe um comentário