|

Überwachung Ihrer NVIDIA GRID-fähigen Citrix XenApp-Bereitstellung

Es gibt nur wenige Unternehmen, die ich wirklich bewundere. Die meisten Technologieunternehmen fangen mit einer wirklich coolen Idee an und neigen dann dazu, ihren Fokus auf Innovation zu verlieren, wenn sie größer werden. Nicht so NVIDIA - Abgesehen davon, dass ich NVIDIA als Hersteller der meisten Grafikkarten kenne, die ich im Laufe der Jahre in meine PCs eingebaut habe, wusste ich nicht viel mehr über das Unternehmen, bis ich an der letztjährigen GTC-Konferenz teilnahm und dort sprach. Was für ein phänomenal nerdiges Publikum! Viele der Teilnehmer (und Mitarbeiter) haben einen Doktortitel und machen wirklich coole Sachen mit parallelen Berechnungen mit GPUs, die weit über Grafik hinausgehen. Die Anwendungen in der Wissenschaft sind endlos und lassen mich an die Zeit Mitte der 90er Jahre zurückdenken, als ich eine DEC VAX mit einer Mischung aus FORTRAN 77 und FORTRAN 90 programmierte, um im Rahmen eines Physikprojekts nichtlineare Differentialgleichungen zu lösen. Hey, Energiebänder in der Festkörperphysik sind nicht einfach zu lösen!

Ich schweife ab - die Einführung der Shield-Cloud-Gaming-Konsole war ein cooler Meilenstein. Das NVIDIA-Team machte sich daran, ein sehr schwieriges Problem zu lösen und es auf die kritischste Benutzergruppe auszurichten. Das Problem kann als Remote-3D-Grafik beschrieben werden, und die Nutzergruppe, auf die die Shield abzielt, sind die Hardcore-Gamer, die ihren wassergekühlten 5.000-Dollar-Gaming-PC mit ins Bett nehmen und weiterspielen möchten, während ihr Lebensgefährte ein wenig körperliche Nähe sucht. Wer würde nicht gerne weiter im Kryat herumwandern, ohne seine Freundin oder seinen Freund verlassen zu müssen? Jede Verzögerung oder Verringerung der so wichtigen Bilder pro Sekunde würde dazu führen, dass die Jungs oder Mädels das Gerät wegwerfen, ihre Decke nehmen und sich mit Red Bull zurück an ihren Schreibtisch begeben. Es musste also einfach funktionieren, und NVIDIA hat versucht, dieses Problem zu lösen, nicht weil es einfach war, sondern weil es schwierig war.

Diese Technologie scheint der Vorläufer der professionellen Remote-Grafik zu sein und baut auf NVIDIAs Erfolg mit der Quadro-Produktlinie auf. Die neue Technologie heißt GRID und ermöglicht es Kunden, GPU-Karten zu Servern im Rechenzentrum hinzuzufügen und dann eine vollständige oder teilweise GPU an eine virtualisierte Arbeitslast weiterzuleiten, die auf dem Server über einen Hypervisor läuft.

Die Ergebnisse sind schlichtweg spektakulär und ermöglichen es Unternehmen, die wichtigsten Vorteile der Anwendungs- und Desktop-Virtualisierung einer sehr anspruchsvollen Benutzergruppe - den Ingenieuren - zugänglich zu machen. Sowohl VMware als auch Citrix unterstützen jetzt virtuelle GPUs. Ich beschreibe hier einen Anwendungsfall mit Citrix XenApp, der aber auch für VMware-Implementierungen und sogar physische Desktops gilt.

Ein Anwendungsfall der virtuellen GPU mit Citrix XenApp

Im Laufe der Jahre haben Unternehmen Citrix XenApp und seine Vorgänger eingesetzt, um Anwendungen zentral auszuführen und den Benutzern den Fernzugriff darauf zu ermöglichen. Dies hatte zwei Hauptvorteile: Die IT-Abteilung konnte diese Anwendungen zentral verwalten und aktualisieren, ohne sich Gedanken über die Fähigkeiten oder den physischen Standort der Anwender Endpunkte machen zu müssen, und zweitens die Backend-Daten im Rechenzentrum zentralisieren, ohne dass dieses wichtige geistige Eigentum auf Hunderten oder gar Tausenden von Laptops und PCs herumfliegen musste. Dieser Ansatz funktionierte sehr gut für Anwendungen, die auf einem Server-Betriebssystem liefen, keine Benutzerverwaltungsrechte erforderten und nicht auf GPUs angewiesen waren, da Server damals nicht wirklich über solche verfügten.

Dann versuchte die Branche, das Problem der Remote-Entwickler und Software-Ingenieure zu lösen, die ihre integrierten Entwicklungsumgebungen und andere kleine Tools für ihre Arbeit benötigen. Dies führte zur Entwicklung von VDI, die es nun ermöglichte, eine ganze Desktop-Instanz des Windows-Betriebssystems (im Gegensatz zu einem Server-Betriebssystem) aus der Ferne zugänglich zu machen. Dies war ein weiterer wichtiger Meilenstein, der auch einen Trend in der Branche auslöste, ganze Desktops für umfassendere Zwecke zu remoten. Aber immer noch musste der gesamte 3D-Grafikaspekt von Anwendungen von der CPU erledigt werden, ohne den Vorteil, dass GPUs zur Verfügung standen.

NVIDIA hat dies mit der Einführung der GRID-Produktlinie behoben, und Anbieter wie Citrix und VMware haben in ihren Hypervisoren Unterstützung für die GPU-Virtualisierung eingeführt. Jetzt können Unternehmen das geistige Eigentum hinter den wichtigsten technischen Anwendungen zentralisieren und sicher sein, dass ihre sehr anspruchsvollen und sehr teuren Anwender ein gutes Benutzererlebnis haben. Sagte ich komfortabel? Nun, die meisten IT-Abteilungen wollen wissen, wie es um die Benutzerfreundlichkeit bestellt ist, und hier kommt Lakeside SysTrack ins Spiel.

Vor etwa einem Jahr begannen wir mit der Auslieferung der NVIDIA-GPU-Unterstützung in unserem preisgekrönten Produkt SysTrack . Seitdem arbeiten wir mit Kunden und Partnern zusammen, um zwei wichtige Dinge zu erreichen:

Erstens kann man die vorhandenen physischen Workstations betrachten und den GPU-Verbrauch messen, um eine Entscheidung über die spezifische virtuelle GPU zu treffen, die ein Benutzer benötigen könnte, und zweitens (und noch wichtiger) den Kunden die Möglichkeit geben, den Ressourcenverbrauch auf ihren GRID-fähigen Servern und virtuellen Desktops direkt zu überwachen, um ein großartiges Benutzererlebnis zu gewährleisten.

Übrigens ist es mir eine Ehre, auf der diesjährigen GTC-Konferenz über diese beiden Themen sprechen zu dürfen, aber ich möchte Ihnen schon einmal einen kleinen Einblick in die Technologie geben.

In diesem speziellen Beispiel hat ein Unternehmen eine Citrix XenApp-Farm auf mehreren physischen Servern aufgebaut. Auf jedem physischen Server läuft Citrix XenServer und eine einzelne GRID K2-Karte, die zwei separate GPUs auf derselben Karte enthält. Auf jedem physischen Server laufen zwei virtuelle Citrix XenApp-Server, von denen jeder über die GPU-Pass-Through-Konfiguration Zugriff auf eine vollständige GPU hat.

Diese spezielle Umgebung wurde auf der Grundlage von - nun ja, sagen wir - Intuition, Erfahrung, Bauchgefühl und einigen bekannten Best Practices konzipiert, dimensioniert und aufgebaut. Mit anderen Worten: Das Unternehmen verfügte nur über wenige Ausgangsdaten, um vorherzusagen, wie diese Server genutzt werden würden und ob die zugewiesenen Ressourcen ausreichen würden, um die Anforderungen von Anwender zu erfüllen. Dies ist nicht ungewöhnlich, da die Tools zur Bewertung der Benutzeranforderungen nicht annähernd so bekannt sind oder verwendet werden und Unternehmen häufig Umgebungen überdimensionieren, um auf Nummer sicher zu gehen. Letztendlich beschwerte sich niemand, was wohl das erste Erfolgskriterium für jede IT-Organisation ist, aber auch in der IT kannte niemand die Fakten über die Benutzererfahrung. An dieser Stelle wurde SysTrack eingeführt. Die Umgebung läuft mit der neuesten Version 7.1, und wir haben der Organisation ein ganz spezielles Dashboard zur Verfügung gestellt, das alle wichtigen Kennzahlen in einem einzigen Fenster zeigt. Werfen wir einen Blick darauf:

Zunächst wähle ich ein Datum oder einen Zeitraum von Interesse. In diesem Beispiel sind es einfach die letzten sieben Tage. Es wird eine Liste aller XenApp-Server angezeigt, und für jeden Server werden die Höchstwerte angegeben: maximale CPU-Auslastung, maximaler Arbeitsspeicher, maximale GPU-Auslastung, maximaler GPU-Speicher, maximale Anzahl GPU-aktivierter Anwendungen, maximale Festplattenzeit, maximale Länge der Festplattenwarteschlange, maximale IOPS, maximale Anzahl der XenApp-Sitzungen insgesamt und maximale Anzahl aktiver Sitzungen.

Eine Sache, die aus den Daten sofort ersichtlich wird, ist, dass ich zwei Server habe, bei denen die CPU auf 100 % hochschnellte, aber die Speichernutzung nie über 30 % hinausging. Das bedeutet, dass ich mehr Arbeitsspeicher hatte, als ich brauchte (besser so als zu wenig!), und ich sehe auch, dass keine GPU über 84 % stieg und die GPU-Speicherauslastung nie über 50 % lag. Das bedeutet im Grunde, dass die K2-GPU der Arbeitslast gewachsen ist und genügend Speicher für die laufenden Anwendungen hat. Ich sehe, dass die Festplattenzeiten und die Länge der Festplattenwarteschlangen ansteigen, was darauf hinweisen könnte, dass ich einen schnelleren oder leistungsfähigeren Speicher hätte verwenden können. Die Spitzenauslastung betrug 15 Anwender auf dem allerersten Server in der Liste.

Auch hier handelt es sich nur um die Höchstwerte. Werfen wir nun einen Blick auf die Daten im Zeitverlauf für diesen speziellen Server:

Es wird deutlich, dass die GPU-Auslastung sehr "sprunghaft" ist - so sehr, dass es wenig Sinn macht, über den durchschnittlichen GPU-Verbrauch zu berichten, da die Durchschnittswerte immer relativ niedrig sein werden. Im Gegensatz zu einem Beispiel im Zusammenhang mit PC-Spielen, wo die GPU-Auslastung konstant hoch ist, sind technische Anwendungen für die GPU relativ einfach, bis ein Benutzer ein 3D-Modell dreht oder eine komplexe Berechnung startet.

Auch in diesem Fall sehen wir keine Spitzen, die bis zu 100 % GPU-Auslastung gehen, was zu der Schlussfolgerung führt, dass die K2 GRID GPU, die an diesen XenApp-Server weitergegeben wird, für den Anwendungsfall ausreichend ist.

Interessant ist auch ein Blick auf die Anzahl der Anwendungen, die die GPU beanspruchen:

Zu den weiteren Leistungsindikatoren gehören das Speichersubsystem und wir können uns % Festplattenzeit, Länge der Festplattenwarteschlange und IOPS ansehen:

Die Zähler für die Speicherleistung zeigen nur einen IOPS-Spitzenwert an, der sich auf die Leseaktivität bezieht. Ein Blick auf den SysTrack Black Box Data Recorder verrät mehr:

Wir haben uns auf den Zeitpunkt der Lese-IOPS-Spitze konzentriert (07 FEB um 06:00A) und sehen, dass ein bestimmter Systemprozess eine hohe Anzahl von IOPS verbraucht. Dies korreliert gut mit einer hohen Anzahl von Seitenlesungen pro Sekunde und stimmt insgesamt mit den Beobachtungen überein. In diesem speziellen Fall ist es gut, dass dieser Systemprozess zu einer Zeit läuft, in der die Benutzerdichte des Servers sehr niedrig ist - eine großartige Bestätigung für gute IT-Praktiken.

Zusammenfassend zeigt dieses Beispiel eine richtig dimensionierte, gut verwaltete Citrix XenApp mit NVIDIA GRID-fähiger HDX 3D PRO-Umgebung. Das Toolset SysTrack ist die bevorzugte Verwaltungs- und Überwachungsplattform für viele XenApp- und XenDesktop-Umgebungen. Die von den vorhandenen physischen Desktops und Workstations gesammelten Daten können von SysTrack genutzt werden, um XenApp- und XenDesktop-Farmen richtig zu dimensionieren und zu planen, um den Übergang zu erleichtern und die zukünftige Umgebung richtig zu dimensionieren. Referenzen:


Ich hoffe, Sie auf der diesjährigen GTC im März zu sehen!
Florian

Teilen zu:

Abonnieren Sie den Lakeside Newsletter

Erhalten Sie Plattformtipps, Versions-Updates, Neuigkeiten und mehr

Verwandte Beiträge