NVIDIA GTC 2026: Von der Gaming-Firma zur Billion-Dollar-Wette
Vor zehn Jahren war NVIDIA eine Firma, die Grafikkarten für Gamer baute. Diese Woche stand Jensen Huang in San Jose auf der Bühne und verkündete eine Zahl, die alles verändert: Eine Billion Dollar an Bestellungen für die nächsten zwei Chip-Generationen. Noch vor einem Jahr lag die Prognose bei der Hälfte.
Was auf der GTC 2026 passiert ist, geht weit über eine Produktpräsentation hinaus. Es ist die Blaupause für eine neue Ära der Infrastruktur.
Sieben Chips, fünf Racks, ein Supercomputer
Das Herzstück der Ankündigung heisst Vera Rubin. Nicht ein einzelner Chip, sondern ein komplettes System aus sieben neuen Prozessoren und fünf Rack-Konfigurationen. Zusammen bilden sie einen Pod-Scale-Supercomputer mit 60 Exaflops Rechenleistung und 1,2 Billiarden Transistoren.
Ein einzelnes NVL72-Rack enthält 72 Rubin-GPUs und 36 Vera-CPUs. Es wiegt knapp zwei Tonnen und besteht aus 1,3 Millionen Einzelteilen. Die Leistungsdaten im Vergleich zur Vorgänger-Generation Blackwell sind beeindruckend.
10x Leistung, 1/10 der Kosten
Die Zahlen sprechen für sich. Vera Rubin liefert zehnmal mehr Inference-Throughput pro Watt bei einem Zehntel der Token-Kosten gegenüber Blackwell. Für das Training reicht ein Viertel der GPUs. Im Vergleich zur H200-Generation bedeutet das sogar 50-fache Effizienz pro Watt.
Für Unternehmen heisst das konkret: Was heute 10’000 Franken an Rechenkosten verursacht, könnte morgen 1’000 Franken kosten. Das verändert die Wirtschaftlichkeit von KI-Projekten fundamental.
Die Groq-Übernahme zahlt sich aus
Eine der überraschendsten Ankündigungen betrifft den Groq 3 LPU. NVIDIA hatte den Chip-Startup Groq Ende 2025 für 20 Milliarden Dollar übernommen. Jetzt zeigt sich, warum.
Der Groq 3 LPX-Rack mit 256 Language Processing Units liefert 35-mal mehr Tokens pro Megawatt als Blackwell. Die Architektur basiert auf reinem SRAM statt auf herkömmlichem Speicher. Das macht sie ideal für lange Kontexte mit einer Million Tokens und mehr.
Für Anwendungen wie autonome KI-Agenten, die rund um die Uhr arbeiten, ist das ein Durchbruch. Jeder Token kostet weniger Energie, und das bei massiv höherem Durchsatz.
Physical AI: Wenn Roboter laufen lernen
Der emotionale Höhepunkt der Keynote war ein unerwarteter Gast: Olaf, der Schneemann aus Disneys “Frozen”. Kein Animatronic, sondern ein frei laufender Roboter, der selbstständig balanciert, spricht und auf seine Umgebung reagiert.
Das Bemerkenswerte daran: Disney trainierte 100’000 virtuelle Olaf-Modelle in nur zwei Tagen auf einer einzigen RTX 4090. Die Simulation nutzt NVIDIAs Newton Physics Engine, entwickelt in Zusammenarbeit mit Google DeepMind. Am 29. März 2026 soll der echte Olaf im “World of Frozen” in Disneyland Paris debütieren.
Was nach Spielerei klingt, zeigt die Zukunft der Robotik. Wenn ein 15 Kilogramm schwerer Schneemann auf einem fahrenden Boot balancieren kann, dann kann dieselbe Technologie auch in Lagerhäusern, Fabriken und Spitälern arbeiten.
Was das für Schweizer Unternehmen bedeutet
Die GTC 2026 zeigt drei Entwicklungen, die direkt relevant sind.
Erstens: Die Kosten für KI-Inference sinken dramatisch. Projekte, die heute unwirtschaftlich erscheinen, werden in zwölf Monaten realisierbar. Schweizer KMU sollten ihre abgelehnten Use Cases von 2025 noch einmal prüfen.
Zweitens: KI-Agenten werden zur Standardtechnologie. NVIDIAs neue Plattform NemoClaw macht autonome Agenten erstmals sicher und lokal betreibbar. Das löst eines der grössten Bedenken im Schweizer Markt: Datenschutz.
Drittens: Physical AI ist keine Zukunftsmusik mehr. Roboter, die mit simulierten Daten trainiert werden, erreichen die Produktionsreife. Das betrifft Logistik, Fertigung und Gesundheitswesen gleichermassen.
Die Billion-Dollar-Frage
Jensen Huang selbst fasste es so zusammen: Vera Rubin sei ein “generational leap”. Sieben Chips, fünf Racks, ein Supercomputer. Die Bestellungen von einer Billion Dollar bis 2027 zeigen, dass die grössten Unternehmen der Welt diese Einschätzung teilen. Sam Altman, Dario Amodei und die CTOs von Mistral und Meta haben bereits unterschrieben.
Ob NVIDIA diese Wette gewinnt, wird die nächsten Jahre zeigen. Dass die KI-Infrastruktur gerade einen Quantensprung macht, ist bereits Tatsache.
Wollen Sie verstehen, wie Ihr Unternehmen von diesen Entwicklungen profitieren kann? In unserem kostenlosen KI-Espresso Workshop zeigen wir in 60 Minuten, wo die grössten Hebel liegen. Oder sprechen Sie direkt mit uns über einen Fractional AI Officer, der diese Technologien für Sie einordnet und umsetzt.