目录[隐藏][展示]
经过两年多的炒作, 特斯拉 终于在 19 月 XNUMX 日公司的 AI 日期间推出了名为“Dojo”的超级计算机,展示了公司的许多新技术,如 人形项目.
首席执行官埃隆马斯克有很多事情要做,因为他声称 Dojo 将拥有超过 exaFLOP 或每秒 XNUMX quintillion 浮点运算的容量。
特斯拉已经拥有超过 1 万辆汽车的海量视频数据,这些数据用于训练其神经网络。
当公司开始使用当前的硬件选项训练其计算机视觉网络时,它感到失望,并认为公司最好在内部进行。
Dojo D1 芯片采用 7 纳米技术,同时提供突破性的带宽和计算性能。
D1芯片是特斯拉自己设计的第二款芯片,它是在FSD计算机硬件3中出现的FSD芯片之后。 特斯拉汽车.
D1 芯片规格
D1 芯片还包含 362 TeraFLOPs 的处理能力,该公司声称它具有 GPU 级别的计算和 CPU 级别的灵活性,以及网络交换机 IO。
特斯拉高级总监 Ganesh Venkataramanan 表示, 自动驾驶仪 Dojo 项目的硬件和负责人,“这完全是由特斯拉团队内部设计的。 从架构一直到封装。 这个芯片就像一台 GPU 级别的计算机,具有 CPU 级别的灵活性和两倍的网络芯片级别 IO 带宽。”
这些芯片能够在没有任何胶水的情况下相互连接,这导致特斯拉连接了 500,000 个节点。 添加了接口、电源和热管理,从而产生了 36 个 pFLOP 训练块,带宽为每秒 XNUMXTB。 所有这些都采用小于一立方的食物形式。
特斯拉没有将晶圆切割成碎片,而是决定在晶圆上留下 25 个 SoC,并使用高质量的硅。 这使芯片能够在不损失任何速度的情况下相互通信,并保持主板的质量。
Dojo 只需要 120 个全功能晶圆,考虑到英特尔在 130,000 年需要制造超过 300 个 2014mm 晶圆,这令人印象深刻。Dojo 的成本也应该大大降低,因为它使用 XNUMX×XNUMX 切片的小晶圆。
Dojo 另一个令人印象深刻的特性是它在 SoC 之外没有任何 Ram。 相反,该公司选择使用缓存,这是一种更快的随机存取存储器层。
构建真正的 Dojo 超级计算机
为了让特斯拉构建第一台真正的 Dojo 超级计算机,它必须与训练块组成一个计算集群。 据该公司称,它可以在一个托盘中组合 2 x 3 块瓷砖,在一个计算机机柜中组合两个托盘,这将导致每个机柜超过 100 pFLOP。
由于带宽巨大,特斯拉表示它可以将所有这些连接在一起以创建 HexaPod,这将打破 10 机柜系统中计算机的 ExaFlop 的障碍。 这一直是开发强大的超级计算机的主要障碍之一。
Dojo 将如何改变技术?
特斯拉的 Dojo 有可能真正影响未来的技术场景,尤其是考虑到对神经网络训练的速度和容量的需求呈指数增长。 如果一切按计划进行,Dojo 将实现最佳的 AI 训练性能并实现极其复杂的 神经网络 模型,同时具有功率和成本效益。
随着 Dojo M1 芯片的推出,科技界很可能正朝着竞争异常激烈的超级计算机市场迈进。 超级计算机具有解决许多社会最大问题的潜力,它们可以把我们变成超人。 这些类型的计算芯片可以解决全球隐私和身份问题,导致医疗保健和医学研究取得令人难以置信的进步,创建可持续的供应链物流等等。
像 Dojo 这样的超级计算机也可以产生巨大的经济影响,第一个实现高效超级计算基础设施的群体或国家会占据优势。 它们将带来新的、准确的预测未来和分析当前状况的方法,计算能力将开始影响每个行业。
总结
虽然该系统仍在组装中,但马斯克声称它将在明年投入使用。
如果是这样的话,与大多数其他超级计算机相比,Dojo 将成为有史以来最快的 AI 训练计算机,同时保持功率效率和小格式。
It 特斯拉可能会使用它来训练其 神经网络 用于自动驾驶技术,但该公司还计划将其提供给其他开发人员。
Dojo 是实现这个超级计算世界的重要一步,它只是众多类似的尚未到来的其中之一。
虽然该技术最初可能会用于特斯拉自己的自动驾驶汽车,但如果它最终进入各个不同的领域,无论是公共部门还是私营部门,都不应该感到惊讶。
随着我们继续进一步进入数据驱动的世界,这种超级计算机的实际使用正在迅速接近。
发表评论