ARM hat seine mobilen Prozessortechnologien der nächsten Generation vorgestellt; die Einführung von Verbrauchergeräten wird für Ende des Jahres erwartet. Das Unternehmen überarbeitet sein Branding, aktualisiert die Architektur und legt einen größeren Schwerpunkt auf KI- und Raytracing-Funktionen.

ARM benennt seine CPU-Reihe um und ersetzt die Cortex-X- und A-Kerne durch eine neue C1-Serie (Ultra-, Performance-, Pro- und Nano-Kerne). Auch die Mali-GPUs werden umbenannt, wobei die Immortalis-Reihe den Marken G1-Ultra, Premium und Pro Platz macht.

Alle neuen C1-Kerne basieren auf der ARMv9.3-Architektur, wodurch die mehrstufige Cortex-X-Reihe entfällt. Die C1-Ultra- und Performance-Kerne sind die Nachfolger des Cortex-X925, der C1-Pro ersetzt den Cortex-A725 und der C1-Nano ist eine Überarbeitung des Cortex-A520. Der C1-Performance ist eine 35 % kleinere Variante des C1-Ultra und zielt auf Chipsätze der oberen Mittelklasse mit leichten Leistungseinbußen ab.

Der C1-Ultra weist einen IPC-Gewinn von 12 % gegenüber dem Cortex-X925 auf, mit einer Gesamtleistungssteigerung von etwa 25 %, wenn man einen 3-nm-Prozess und eine höhere Taktrate von 4,1 GHz (im Vergleich zu den 3,6 GHz des Cortex-X925) berücksichtigt. Es bietet außerdem die gleiche Leistung wie sein Vorgänger und verbraucht 28 % weniger Strom. Dies wird durch ein größeres Out-of-Order-Fenster (Verarbeitung von etwa 2.000 Befehlen im Flug gegenüber etwa 1.500 beim X925) und eine 33-prozentige Steigerung der L1-Befehls-Cache-Bandbreite erreicht.

Der C1-Pro konzentriert sich auf Front-End-Verbesserungen mit einem größeren Branch Predictor und Branch Target Buffer (BTB), einer höheren L1-Datenbandbreite und einer geringeren L2 TLB-Latenz, was zu Energieeinsparungen beiträgt. ARM behauptet, dass der C1-Pro die gleiche Leistung wie der Cortex-A725 bietet, mit einer Leistungsreduzierung von 26 % oder 11 % mehr Leistung bei gleicher Leistung. Der C1-Nano bietet gegenüber dem Cortex-A520 eine Steigerung der Energieeffizienz um 26 %, mit bescheidenen Leistungssteigerungen von 5–8 %, da er für Hintergrundaufgaben gedacht ist.

Eine wichtige Ergänzung zu den neuen CPUs ist SME2, ​​die neueste Erweiterung von ARM zur Beschleunigung von Machine-Learning-Workloads. SME2, ​​das auf dem ursprünglichen SME mit Multi-Vektor-Anweisungen, Gewichtskomprimierung und binären Netzwerken aufbaut, befindet sich als gemeinsam genutzte Ausführungseinheit außerhalb des Kerns. Jeder Kern der C1-Serie kann SME2-Anweisungen dekodieren und das Gerät kann heruntergefahren werden, wenn es nicht verwendet wird. ARM behauptet eine 4,7-fache Latenzreduzierung bei der Spracherkennung, eine 4,7-mal schnellere Token-Kodierung und einen durchschnittlichen 3,7-fachen Leistungssprung bei einer Auswahl anderer Workloads im Vergleich zum gleichen C1-Pro-CPU-Kern ohne SME2.

Die neue Mali G1-Ultra GPU bietet 20 % bessere Leistung für Spiele und maschinelle Lerninferenz, 9 % weniger Energie pro Frame und bis zu 2x schnelleres Raytracing im Vergleich zum letztjährigen Immortalis G925. Das 2x schnellere Raytracing wird durch Hardwareunterstützung für BVH-Traversal und einen Single-Ray-Algorithmus erreicht. Die RTU (Ray Tracing Unit) kann bei Nichtgebrauch mit Strom versorgt werden. Die G1-GPU ist je nach Anzahl der Kerne in verschiedenen Markenvarianten erhältlich: 10+ Kerne mit Raytracing sind ein G1-Ultra, 6–9 Kerne sind ein G1-Premium und 1–5 Kerne sind ein G1-Pro.

Die Lumex-Plattform von ARM zielt darauf ab, die Markteinführungszeit mit vollständigen Plattformlösungen zu verkürzen, einschließlich Designs, die für die Chip-Integration bereit sind, und einer engeren Zusammenarbeit mit Gießereien wie TSMC. Die interne Lumex Reference FPGA-Plattform des Unternehmens deutet auf eine mobile Konfiguration der Spitzenklasse hin: zwei 4,1 GHz C1-Ultra-Kerne gepaart mit sechs 3,5 GHz C1-Pro-Kernen, zwei SME2-Einheiten, ein 16 MB L3-Cache, ein 14-Kern-Mali-G1 Ultra und 16 MB Cache auf Systemebene, alles auf 3 nm. Für nahezu Flaggschiff-Chipsätze empfiehlt ARM den Austausch des C1-Ultra gegen den C1-Premium. Mittelklasse-Chipsätze könnten über einen einzelnen Ultra- oder Premium-Kern gepaart mit drei Pro-Kernen und vier Nano-Kernen verfügen.

Das Unternehmen geht davon aus, dass der MediaTek Dimensity 9500 das erste Flaggschiff-SoC sein wird, das mit den neuen C1-CPU-Kernen und der G1-Ultra-GPU von ARM ausgestattet ist, mit der Chance, dass der Google Tensor G6 im nächsten Jahr auch die neue C1-Serie übernehmen wird.