Pro šetření elektrické energie je někdy dobré její spotřebu zvýšit

Při stavbě jednoho jednoduššího ale důležitého serveru jsme se rozhodli, že postavíme stroj, který bude úsporný i když malinko dražší. Z počátku na něm jel malý vnitropodnikový systém a vše fungovalo jak má. Pak se systém ale rozrostl a přišel požadavek silného logování provozu všech routerů a jim podobných. Toto si vyžádalo neznatelně zvýšený diskový provoz. V průměru 500MB za den. Z bezpečnostních důvodů jsme přikoupili druhý disk a připojili ho do RAID1 (zrcadlení).

Co se ale stalo. Zvedla se zátěž procesoru. Pevný disk nestíhal posílat data dostatečně rychle. A celý systém se tím stal značně pomalý a komplikovalo to provoz celé firmy. Již jsme zvažovali koupi nového serveru. Celé se mi to ale nezdálo. 500MB za den není moc na to aby to daný stroj nezvládal. Začal jsem podrobně studovat datasheet-y a za nedlouho jsem věděl kde je zakopaný pes.

RAID jel na dvou discích od Western Digital z řady GP (green power). Jsou to excelentní disky s velmi malou spotřebou a člověk by řekl, že i když mají jen o 3MB/s nižší rychlost zápisu než jeho „černý“ bratříček, že to je v pohodě. Bohužel i přes propracovaný a inteligentní systém regulace otáček a posouvání hlaviček má horší latenci (kterou raději neuvádějí).

Koupili jsme tedy nové disky s větší spotřebou. Prvním byl WD Caviar Black a druhý Seagate Barracuda 7200.12. Oba sice mají dvojnásobnou spotřebu než „zelené“ disky od WD, ale zátěž celého stroje klesla na původní hodnotu. Díky těmto diskům jsme sice zvýšili spotřebu energie disků (o cca 16W), ale ušetřili jsme energii co by spotřeboval CPU a řadiče. Nehledě na to, že koupí nového stroje bychom navýšili spotřebu minimálně o 200W.

Z prvního grafu můžete vidět zatížení procesoru před a po WD GP. První a druhá špička je synchronizace disků v RAID poli. Další je již jen testování disků v rámci zahořování. Od půlky března je již normální provoz.

CPU ussage

Druhý graf je mnohem důležitější. Můžeme zde vidět jak moc je server zaměstnán úkoly. Jedná se o průměrný počet čekajících procesů na zpracování. Minimum čekajících procesů bylo 2, ale celkem běžně bylo vidět i 30. To je v aplikacích závislých na výpočtech a komunikaci s databází dost velký problém. Aktuální stav je 0,02 až 0,16. Neboli server s přehledem stíhá vše co má.

CPU load