Een autonome, AI-enabled server met nul geplande downtime

Nieuwe innovaties in de hele stack, van silicium tot applicaties, bieden unieke toegevoegde waarde en verbeterde bedrijfscontinuïteit. IBM voert een upgrade uit van zijn Unix-servers naar de Power11-generatie.

Op het eerste gezicht zijn er weinig veranderingen ten opzichte van de Power10-servers die ze vervangen: het formaat, het aantal processors en de hoeveelheid RAM zijn hetzelfde. De opties en functies zijn echter talrijker.

Het aantal bruikbare cores per processor is bijvoorbeeld gestegen naar 30 (20 of 24 bij de vorige modellen). Deze nieuwe machines kunnen ook worden uitgerust met Spyre versnellingskaarten voor AI-inferentie. Dit zijn de kaarten die IBM al aanbiedt op zijn nieuwste generatie mainframes, de z17.

De mainframe-erfenis is duidelijk. IBM maakt gebruik van zijn historische expertise en kan bogen op een uitzonderlijke beschikbaarheid van 99,9999%, oftewel minder dan 32 seconden downtime per jaar.

Reserve cores

Met servers op basis van Power11-processors kunnen klanten rekenen op nul geplande downtime voor systeemonderhoud dankzij nieuwe technologieën zoals autonome patching en geautomatiseerde workloadverplaatsing met Live Partition Mobility. Daarnaast neemt IBM reserve core-technologie (die al wordt toegepast op mainframes) op in de Power11’s, waardoor servers zelfs kunnen blijven werken als er een CPU core uitvalt, dankzij ‘stand-by’ cores die automatisch worden geactiveerd.

Een Power Cyber Vault-apparaat, gecertificeerd als compliant met de NIST-vereisten, belooft malware in minder dan een minuut te detecteren en blokkeren. Bovendien wordt het zelfdiagnosesysteem nu ondersteund door AI, waardoor onderhoud proactiever wordt en de uitvaltijd dienovereenkomstig wordt verminderd.

Spyre aan het eind van het jaar

Het zal geen verrassing zijn dat IBM’s marketing de nadruk legt op het vermogen van zijn nieuwe machines om AI workloads aan te sturen. Hier ligt de nadruk op inferentie in plaats van leren. De Power11 processors hebben dezelfde MMA-eenheid voor het versnellen van matrixberekeningen als de Power10. Het is geen volwaardige NPU, maar het komt in de buurt. In de praktijk bevat elke Power11 core 4 MMA units. IBM geeft geen TOPS prestatiemetingen voor deze MMA’s. Maar het benadrukt wel dat TOPS slechts een deel van het verhaal zijn, en dat AI-verwerking vooral profiteert van de indrukwekkende geheugenbandbreedte van de Power11: 1200 GB/sec!

De Spyre-accelerator zal pas eind dit jaar als optie beschikbaar zijn. Deze chip bevat 32-core mainframes die zijn ontworpen om zeer snel matrix- en vectorfuncties in 4, 8 of 16 bits uit te voeren. Deze functies zijn nodig om responselementen uit een LLM te halen, volgens de numerieke waarden van tokens die de gebruiker ingeeft. Het vermogen wordt geschat op 300 TOPS, ongeveer drie keer beter dan de chips die NPU’s en GPU’s combineren op werkstations die speciaal zijn ontworpen voor AI.