De woorden Citrix en performance worden vaak in een zin gebruikt, Citrix zorgt voor een goede gebruikerservaring en daar is snelle performance uiteraard een voorwaarde voor. In deze blog leg ik uit hoe je als IT- of VDI-specialist de BIOS-instellingen van de Intel-hardware zodanig kiest zodat je anno 2022 de beste performance behaalt. Alvast een tipje van de sluier: uit onze benchmark resultaten blijkt dat je met de juiste instelling maximaal gebruik maakt van de Intel Turbo Boost functionaliteit en dat kan de performance met wel 12% verbeteren.

Bij het configureren van een Citrix Virtuele Desktop omgeving gaat doorgaans veel aandacht uit naar de softwarematige inrichting. Om hierbij de performance te verbeteren maken we vaak gebruik van optimalisatiescripts. Deze scripts schakelen onnodige services in Windows uit of verwijderen deze zelfs compleet.
Het is algemeen bekend dat we de gebruikerservaring en performance aanzienlijk kunnen verbeteren door gebruik te maken van hardware acceleratie. Door de virtualisatietechniek kunnen we de videokaart opdelen en elke gebruiker hier een gedeelte van geven. Dit zorgt voor een betere gebruikerservaring voor alleen al bij het gebruik van de Internet browser of Office applicaties.

Wat is Intel Turbo Boost?

De laatste jaren is ook de ontwikkeling van de processoren hard gegaan. Denk hierbij niet alleen aan de hoeveelheid cores of aan hogere kloksnelheden, ook de technische werking van processoren heeft Intel continu verbeterd met de Turbo Boost functionaliteit. De Turbo Boost functie maakt het mogelijk om de cores van processoren op een hogere kloksnelheid te kunnen laten werken, dan de basis snelheidsfrequentie.

Voor de performance van Citrix Virtuele Desktop-omgevingen kan de Intel Turbo Boost techniek net even die extra performance geven aan de gebruikers. Door het juist configureren van Intel Turbo Boost zorgen we ervoor dat virtuele desktops of servers beter overweg kunnen met hoge belastingen van zowel grafische als processor intensieve applicaties. De fysieke hardware instellingen worden geconfigureerd in de BIOS, in de BIOS is het mogelijk om gebruik te maken van vooraf gedefinieerde systeemprofielen. Deze systeemprofielen bevatten een verzameling van een aantal instellingen die gezamenlijk worden toegepast. De instellingen hebben betrekking op performance en het energieverbruik van de serverhardware.

Vanuit een vroegere best practice wordt er nog vaak gekozen voor het systeemprofiel genaamd ‘Performance’. Deze configuratie bevat echter een aantal instellingen waarbij de Turbo Boost functionaliteit niet optimaal gebruikt wordt. Mijn inziens is dit systeemprofiel anno 2022 achterhaald, want het zorgt ervoor dat we niet de volledige capaciteiten van deze nieuwere processoren kunnen gebruiken.  Om de performance te meten en het verschil inzichtelijk te maken voor een Citrix VDI-omgeving, hebben we een benchmark gedaan met twee systeemprofielen: op het meest gekozen en al eerder genoemde systeemprofiel ‘Performance’ en op systeemprofiel ‘Custom OS Control’.

Benchmark Performance vs. Custom OS Control

Door middel van benchmark software kunnen we performance omzetten in daadwerkelijke resultaten. In deze benchmark hebben we gebruik gemaakt van dezelfde server hardware waarbij we alleen de BIOS-configuratie hebben aangepast. Om te beginnen de technische gegevens van deze benchmark. De benchmark software hebben we geïnstalleerd binnen een Windows 10 Virtuele Machine, deze machine is door middel van Citrix Virtual Desktop te benaderen. De virtuele Windows 10 machine is meerdere malen uitgebreid met extra virtuele cores en een zwaardere virtuele grafische kaart van NVIDIA. Alle configuraties zijn apart opgenomen in de benchmarkresultaten.

De fysieke hardware bevat de volgende specificaties en configuratie.

 

Dell PowerEdge R740
Processor Intel Xeon Gold 6242R

Basis kloksnelheid: 3.10 Ghz

Turbo Boost kloksnelheid: 4.1 Ghz

Grafische kaart

Profiel T4-1B

 

Profiel T4-2B

NVIDIA Tesla T4

Framebuffer 1024 MB

1/16 gedeelte van GPU

Framebuffer 2048 MB

1/8 gedeelte van GPU

Hypervisor Citrix Hypervisor 8.2

Governor mode: Performance

Om resultaten goed te kunnen vergelijken is er gebruik gemaakt van twee benchmark applicaties. De tool Cinebench heeft vooral de focus op de processor, terwijl de applicatie Superposition voor de performance van de grafische acceleratie is ingezet. Voor beide benchmark applicaties is van toepassing: hoe hoger de score, des te beter de performance.

In onderstaande tabel zijn de benchmark resultaten weergegeven van het systeemprofiel ‘Performance’. Dit is dus het traditionele systeemprofiel wat wij doorgaans nog veel gebruikt zien worden.

VDI specs (vCPU,MEM,vGPU) Benchmark tool Cinebench CPU multi / single core Benchmark tool Superposition GPU (Low) Benchmark tool Superposition GPU (Medium) Benchmark tool Superposition GPU (High)
2vCPU 16GB 1627/ 907
4vCPU 16GB 3137 / 868
2vCPU 16GB T4-1B 1771 / 918 5848 1359 1135
3vCPU 16GB T4-1B 2702 / 951 5870 1877 1540
4vCPU 16GB T4-1B 3586 / 960 5877 1763 1572
4vCPU 16GB T4-2B 3468/ 945 5983 5987 5462

Tabel 1 Benchmark C-States uitgeschakeld

In volgende tabel zijn de benchmark zijn de resultaten weergegeven van het systeemprofiel ‘Custom OS Control’. In het ‘Custom OS Control’ profiel is het de hypervisor die het gedrag van de processor kan bepalen. Dit is het systeemprofiel dat wij anno 2022 zouden adviseren. Dat wordt duidelijk uit de performanceverschillen van de benchmark:

VDI specs (vCPU,MEM,vGPU) Benchmark tool Cinebench CPU

Multi / single core

Benchmark tool Superposition GPU (Low) Benchmark tool Superposition GPU (Medium) Benchmark tool Superposition GPU (High)
2vCPU 16GB 1806 / 958
4vCPU 16GB 3411 / 995
2vCPU 16GB T4-1B 1831 / 960 5967 1437 1262
3vCPU 16GB T4-1B 2747 / 953 5893 1908 1630
4vCPU 16GB T4-1B 3718 / 980 5945 1886 1695
4vCPU 16GB T4-2B 3669 / 949 6014 6005 5637

Tabel 2 Benchmark C-States ingeschakeld

Resultaten benchmark

Wat als eerste opvalt is dat het toevoegen van grafische hardware acceleratie een positieve invloed heeft op de performance van de processor, gemiddeld geeft dit een verbetering van 8%. De resultaten van de benchmark waarbij de hypervisor het gedrag van de processor bepaalt, systeemprofiel ‘Custom OS Control’, laten duidelijk zien dat de Intel Turbo Boost zorgt voor een betere totale gebruikerservaring, want zowel de processor benchmark als de grafische benchmark halen hierbij hogere scores.

Zoals verwacht is er ook een duidelijk verschil tussen beide grafische profielen die we gekozen hebben in de benchmark. Opvallend is dat door een verdubbeling van de technische specificaties er een verdrievoudiging ontstaat in de grafische performance.

C-States en P-States: wat is het verschil?

Nog even een korte toelichting op de begrippen C-States en P-States en hoe zij samenhangen met de systeemprofielen. De C-State geeft de power state aan van de processor: hoe hoger de C-State, des te verder de processor in zijn slaapmodus gaat. De P-State geeft de performance state weer van de processor: hoe hoger de P-State, des te lager de processor frequenties. P0 is de hoogste frequentie en wordt gezien als de P-State voor Turbo Boost.

Door instellen van het ‘Performance’ systeemprofiel worden de processor C-States en P-States uitgeschakeld. Echter is de optimale werking van de Intel Turbo Boost functionaliteit hiervan afhankelijk. Zowel Citrix als VMware geven aan dat het best practice is om het systeemprofiel aan te passen naar ‘Custom OS control’ en zodoende C-States in te schakelen. Uit deze benchmark komt duidelijk naar voren dat ‘Custom OS Control’ en inschakeling van C-States inderdaad een betere performance geeft in een VDI-omgeving. Let op: de systeemprofielbenaming kan afwijken per hardwarevendor, maar de werking is per vendor gelijk.

De werking van Turbo Boost is naast het server systeemprofiel afhankelijk van de processortemperatuur. Het is van belang om te zorgen voor een goede koeling van de processoren. In de BIOS kan er vaak aanvullend gekozen worden voor ‘Maximale Cooling’, dit is zeker te adviseren wanneer het systeemprofiel staat ingesteld op ‘Custom OS Control’.

Advies

De performance binnen een Citrix Virtual Desktop wordt beïnvloed door diverse factoren. De impact op de performance van bijvoorbeeld een nieuwere Windows versie of een verandering in Antivirus oplossing wordt vaak onderschat. Door gebruik te maken van benchmark tools kunnen we impact achterhalen en inzichtelijk maken.
Met het inschakelen van de C-States, door het systeemprofiel in te stellen op ‘Custom OS Control’ zorgen we ervoor dat de Turbo Boost functionaliteit optimaal gebruikt kan worden. De meeste kantoorapplicaties kunnen goed overweg met de Turbo Boost functionaliteit, maar er kunnen specifieke applicaties zijn die beter performen als de processor niet schakelt tussen C-States. Daarom moet de configuratie altijd getest worden voordat deze in productie genomen wordt.

Conclusie

Maak je gebruik van VDI, dan benut je de kracht van de Intel Turbo Boost processoren maximaal wanneer je het systeemprofiel instelt op ‘Custom OS Control’ zodat C-States staan ingeschakeld en dat komt de eindgebruikerservaring enorm ten goede. De benchmark die ik heb gedaan, laat zien dat er daarmee performanceverbetering tot 12% kan worden behaald. Is er behoefte aan nog hogere performance of zijn er eindgebruikers met zware (grafische) applicaties, dan is het toevoegen van extra grafische performance (vGPU) een absolute must.

Wilt u naar aanleiding van deze blog en benchmark meer informatie over de inhoud, een benchmark doen op uw eigen VDI-omgeving of een advies, neem dan contact op met uw PQR-accountmanager of met ondergetekende op dennis.bruines@pqr.nl.

Geplaatst door

Dennis Bruines

Dennis Bruines is Senior Workspace Consultant bij PQR. Door zijn ervaring met producten van Citrix en Microsoft is hij in staat om zowel werkplek-oplossingen uit te denken, als deze technisch toe te passen. Bovendien heeft hij als Certified Ethical Hacker veel focus op veiligheid van de werkplek.