Inhaltsverzeichnis[Ausblenden][Zeigen]
Nachdem er über zwei Jahre lang gehyped wurde, Tesla stellte schließlich seinen Supercomputer namens „Dojo“ während des KI-Tages des Unternehmens am 19. August vor, auf dem viele der neuen Technologien des Unternehmens wie der vorgestellt wurden Humanoides Projekt.
CEO Elon Musk musste angesichts seiner Behauptung, dass Dojo die Kapazität von über einem ExaFLOP oder einer Trillion Gleitkommaoperationen pro Sekunde haben würde, eine Menge erfüllen.
Tesla besitzt bereits eine riesige Menge an Videodaten von seinen mehr als 1 Million Fahrzeugen, und diese Daten werden verwendet, um seine neuronalen Netze zu trainieren.
Als das Unternehmen begann, seine Computer-Vision-Netze mit aktuellen Hardwareoptionen zu trainieren, stieß es auf Enttäuschung und den Glauben, dass das Unternehmen besser dran wäre, dies intern zu tun.
Der Dojo D1-Chip verwendet 7-Nanometer-Technologie und bietet gleichzeitig eine bahnbrechende Bandbreite und Rechenleistung.
Der D1-Chip ist der zweite von Tesla selbst entwickelte Chip und folgte dem FSD-Chip, der in der FSD-Computerhardware 3 Zoll vorhanden ist Tesla-Fahrzeuge.
D1-Chip-Spezifikationen
Der D1-Chip enthält auch 362 TeraFLOPs Rechenleistung, und das Unternehmen behauptet, dass er eine Rechenleistung auf GPU-Ebene und Flexibilität auf CPU-Ebene mit Netzwerk-Switch-IO hat.
Laut Ganesh Venkataramanan, Senior Director von Tesla Autopilot Hardware und Leiter des Dojo-Projekts: „Dies wurde vollständig vom Tesla-Team intern entwickelt. Von der Architektur bis zum Package. Dieser Chip ist wie ein Computer auf GPU-Ebene mit einer Flexibilität auf CPU-Ebene und der doppelten E/A-Bandbreite auf Netzwerk-Chip-Ebene.“
Die Chips können ohne Klebstoff miteinander verbunden werden, was dazu führte, dass Tesla 500,000 Knoten verbunden hat. Die Schnittstellen-, Energie- und Wärmeverwaltung werden hinzugefügt, was zu einer Trainingskachel mit neun pFLOPs und einer Bandbreite von 36 TB pro Sekunde führt. All dies ist in einem weniger als einem kubischen Lebensmittelformat.
Anstatt den Wafer in Stücke zu schneiden, entschied sich Tesla dafür, 25 SoCs auf dem Wafer zu belassen und hochwertiges Silizium zu verwenden. Dadurch können die Chips ohne Geschwindigkeitsverlust miteinander kommunizieren und die Qualität des Motherboards erhalten.
Dojo benötigte nur 120 voll funktionsfähige Wafer, was beeindruckend ist, wenn man bedenkt, dass Intel im Jahr 130,000 über 300 2014-mm-Wafer herstellen musste. Die Kosten von Dojo sollten auch wesentlich niedriger sein, da es kleine Wafer mit fünf mal fünf Abschnitten verwendet.
Ein weiteres beeindruckendes Merkmal von Dojo ist, dass es außerhalb des SoC keinen Ram hat. Stattdessen entschied sich das Unternehmen für die Verwendung eines Caches, der eine schnellere Ebene des Direktzugriffsspeichers darstellt.
Aufbau eines echten Dojo-Supercomputers
Damit Tesla den ersten echten Dojo-Supercomputer bauen kann, muss er mit den Trainingskacheln einen Rechencluster bilden. Nach Angaben des Unternehmens können 2 x 3 Kacheln in einem Tablett und zwei Tabletts in einem Computerschrank kombiniert werden, was zu über 100 pFLOPs pro Schrank führen würde.
Aufgrund der enormen Bandbreite sagt Tesla, dass es all diese miteinander verbinden kann, um den HexaPod zu schaffen, der die Barriere des ExaFlop von Computern in einem 10-Schrank-System durchbrechen wird. Dies war eine der größten Hürden bei der Entwicklung leistungsfähiger Supercomputer.
Wie wird Dojo die Technologie verändern?
Teslas Dojo hat das Potenzial, das zukünftige Technologieszenario wirklich zu beeinflussen, insbesondere angesichts der exponentiell steigenden Nachfrage nach Geschwindigkeit und Kapazität für das Training neuronaler Netze. Wenn alles nach Plan läuft, würde Dojo die beste KI-Trainingsleistung erzielen und äußerst komplex ermöglichen neuronales Netz Modelle, die gleichzeitig leistungs- und kosteneffizient sind.
Mit der Einführung des Dojo M1-Chips steuert die Tech-Welt wahrscheinlich auf einen extrem wettbewerbsintensiven Supercomputer-Markt zu. Supercomputer haben das Potenzial, viele der größten Probleme der Gesellschaft zu lösen, und sie können uns zu Übermenschen machen. Diese Arten von Computerchips können globale Datenschutz- und Identitätsprobleme lösen, zu unglaublichen Fortschritten im Gesundheitswesen und in der medizinischen Forschung führen, eine nachhaltige Lieferkettenlogistik schaffen und vieles mehr.
Supercomputer wie Dojo können auch enorme wirtschaftliche Folgen haben, wobei die erste Gruppe oder Nation, die eine effiziente Supercomputing-Infrastruktur erreicht, davon profitiert. Sie werden zu neuen und genauen Möglichkeiten führen, die Zukunft vorherzusagen und aktuelle Bedingungen zu analysieren, und die Rechenleistung wird beginnen, jede Branche zu beeinflussen.
Zusammenfassung
Während das System noch zusammengestellt wird, behauptet Musk, dass es nächstes Jahr in Betrieb gehen wird.
Wenn dies der Fall ist, würde Dojo der schnellste KI-Trainingscomputer werden, der jemals entwickelt wurde, während die Energieeffizienz und das kleine Format im Vergleich zu den meisten anderen Supercomputern erhalten bleiben.
It wird wahrscheinlich von Tesla verwendet, um seine zu trainieren Neuronale Netze für selbstfahrende Technologie, aber das Unternehmen plant, sie auch anderen Entwicklern zur Verfügung zu stellen.
Hier ist ein Link zum Whitepaper von Dojo.
Dojo ist ein wichtiger Schritt auf dem Weg zu dieser Welt des Supercomputings, und es ist nur einer von vielen, die noch kommen werden.
Während die Technologie zunächst wahrscheinlich in Teslas eigenen selbstfahrenden Fahrzeugen zum Einsatz kommen wird, sollte sich niemand wundern, wenn sie schließlich ihren Weg in verschiedene Bereiche findet, sowohl im öffentlichen als auch im privaten Bereich.
Während wir immer weiter in eine datengesteuerte Welt vordringen, nähert sich der reale Einsatz solcher Supercomputer schnell.
Hinterlassen Sie uns einen Kommentar