Generative KI-Inferenzoperationen mit Cisco UCS / 5. Generation und 4. Generation Intel Xeon Prozessoren
Data Center Content Library Intel® Xeon® Scalable Processors Intel® Xeon® Scalable Processors Intel® Xeon® Scalable Processors Intel® QuickAssist Technology (Intel® QAT)
812502
2023-12-29
Public
A preview is not available for this record, please engage by choosing from the available options ‘download’ or ‘view’ to engage with the material
Beschreibung
Cisco UCS mit Prozessoren der 5. Generation Intel® Xeon® und Cisco Nexus ist eine skalierbare Grundlage für die Bereitstellung von generativer KI in großem Maßstab. Diese Architektur bietet:
- Optimale Leistung: Cisco UCS mit Intel Xeon skalierbaren Prozessoren, spezialisierten KI-Beschleunigern und optimierten Software-Frameworks verbessert die Inferenzleistung und Skalierbarkeit erheblich.
- Ausgewogene Architektur: Cisco UCS zeichnet sich sowohl durch Deep-Learning- als auch durch Nicht-Deep-Learning-Computing aus, was für die gesamte Inferenzpipeline von entscheidender Bedeutung ist. Dieser ausgewogene Ansatz führt zu einer besseren Gesamtleistung und Ressourcennutzung.
- Skalierbarkeit nach Bedarf: Cisco UCS skaliert nahtlos mit Ihren Anforderungen an generative KI-Inferenzen. Mit Cisco Intersight können Sie Server hinzufügen oder entfernen, Speicherkapazitäten anpassen und Ressourcen automatisch konfigurieren, wenn sich Ihre Modelle weiterentwickeln und Workloads wachsen.
Sie haben die Möglichkeit, Inferenzierung im Rechenzentrum oder am Edge auszuführen, wobei entweder ein modularer oder ein Rack-Formfaktor verwendet wird.
Gebrauchsanweisungen
Verwandte Assets
Titel und Beschreibung
Format
Sprache
Aktivität
Cisco UCS M7 and Pure Storage FlashArray: FlashStack VSI with VMware vSphere 8.0 — Design Guide
Cisco 7th generation of UCS C-Series and UCS X-Series Servers, powered using 4th Gen Intel Xeon Scalable processors., and Pure Storage FlashArray FlashStack on VMware vSphere 8 solution.
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 Powered by Intel — Design Guide
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 powered by Intel design guide
FlashStack Cisco UCS X-Series and Pure Storage FlashArray//X R3 for VMware Horizon 8 — Design Guide
FlashStack Virtual Desktop Infrastructure for VMware Horizon 8 VMware vSphere 8.0 U1 and 4th Gen Intel® Xeon® Scalable processors Design Guide
Cisco UCS with 5th Gen and 4th Gen Intel Xeon Processors for Generative AI
Cisco UCS, powered by 5th Gen Intel® Xeon® processors, delivers a compelling solution for maximizing Generative AI performance.
Generative AI Inferencing with Cisco UCS X-Series M7 Blade Servers / 5th Gen Intel Xeon Processors
Cisco UCS® with Intel® Xeon® Scalable processors and Cisco Nexus® offers a compelling and scalable foundation for deploying generative AI at scale.
GenAI Inferencing Powered by Cisco UCS X-Series / 5th Gen Intel Xeon Processors on Red Hat OpenShift AI — Cisco Validated Design
Cisco, Red Hat, and Intel provide a proven AI infrastructure to enable VMware-based Red Hat® OpenShift® AI.
Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors — White Paper
This white paper contains a reference architecture that illustrates the benefits of Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors for bare-metal and hybrid cloud deployments.