|
Written by Jiří Dražil
|
|
Pátek 29. května 2009, 16:15 |
Častým dotazem při volbě diskového pole bývá požadavek výkonnostního srovnání. Bohužel se tím ale odvrací pozornost od otázky "jaké jsou požadované parametry celého projektu" na srovnávání marketinkových údajů. Výkonové parametry diskové pole ovlivňuje řada faktorů a koneckonců ani samotné výkonnostní parametry nemusejí mít přímou vazbu na výkon aplikací. Jak to tedy je?
Výkon? A za jakých podmínek?
- Z principu RAID
dochází k rozložení dat přes všechny zúčastněné disky Raidovské
skupiny. Tedy první faktor říká, že výkon úzce bude souviset právě s
počtem disků RaidSetů.
- Nemusí za každou cenu platit čím víc
disků v RaidSetu, tím lépe. S malým počtem disků je úzkým hrdlem právě
tento malý počet, s velkým počtem disků stoupá výpočetní režie
controllerů
- A pak tu máme různé typy RAID s různými vlastnostmi a různou výpočetní režií.
Strip size? Block Size? Segmentace cache?
- Aby
toho nebylo málo, každý adresní prostor na discích je rozdělen do bloků
a se segmentací pracuje i FileSystem v rámci OS. Je dobré už i při implementaci
diskového pole tohle velmi dobře zvážit. Zjednodušeně řečeno -
nastavením těchto parametrů předurčíme zda bude daný prostor
optimalizován pro aplikace databázové povahy či na opačném konci
spektra aplikace streamové povahy.
- Krom segmentace na úrovni disku pracuje diskové pole i se segmentací vyrovnávací paměti - cache.
Protože je to u většiny vendorů diskových polí pevně daná
hodnota, příliš se o této vlastnosti nemluví. A přitom právě segmentace
cache v kontextu aplikace vypovídá o tom, jak efektivně je cache
využívána! Ideální je, pokud segmentace cache je definovatelná.
Pro vysvětlení: Principiálně každé diskové pole pole pracuje se segmentací interní
cache. Optimální velikost nastavení segmentace se liší podle využití
daného volumu pro dané účely.Možnost definovat sagmentaci znamená zajištění QoS (Quality of Service) kritických aplikací.
Bude-li např. segment cache definován na 64 kB, bude toto volume mít
optimální výkonové parametry pro soubory, streamy apod. Bude-li na
takto segmentované cache provozována Oracle, která pracuje se 4kB
segmenty, potom skutečné využití velikosti cache bude 6,2%!!.
Definice segmentace pro dané LUNy dle jejich využití tento problém účinně řeší.

Využití cache partitioningu pro ladění výkonu diskových systémů.
MB/s nebo IOPS?
- Z hlediska jednoho datového streamu jsou schopné SATA i SAS (FC)
diskové pole pracovat s relativně podobnými přenosovými rychlostmi.
Zcela opačná situace nastává u náhodného provozu, kde oblasti z
rychlých disků SAS a FC naprosto zásadním způsobem překonávají SATA
oblasti.
- Je ale také dobré se zamyslet co je to provoz s povahou streamů.
V dnešním prostředích už takřka nenajdete systémy, které by generovaly
vůči RaidSetu na diskovém poli jednoduchý stream - a koneckonců více
byť jednoduchých datových proudů vůči diskovému poli představuje ve
finále náhodný provoz.
- A je tu fenomén virtualizace, kde v případě VMware je hypervisor
výkonově optimalizován a dokáže skutečně vytížit možnosti diskových
polí.
Shrnuto: fenomén MB/s začíná pozbývat na významu a každé současné
diskové pole má při single stream provozu schopnost přenášet řádově
stovky MB/s. Tím podstatným parametrem začíná být počet Input Output
operací za sekundu - IOPs, které je schopno diskové pole obsloužit. A
úzce to souvisí s tím, jaká ve finále bude výkonnost komplexního
prostředí.
Objektivní měření.
Určitou představu o tom, jak si jednotlivá disková pole "stojí" si lze udělat na základě nezávislé analýzy SPC.
Podmínky testů diskových polí dle specifikace SPC-1 naleznete zde.
Uvedené měření nemusí zcela korespondovat s měřeními jednotlivých
výrobců, vše záleží na definici testů a každý výrobce si podmínky testů
volí tak, aby ukázaly jeho produkt v dobrém světle. Nicméně podstatné
je, že všechny uvedené systémy prošly srovnávacím testem za stejných podmínek definovaných SPC-1 a nikoliv absolutní hodnota, ale relativní srovnání jednotlivých systémů je hmatatelným argumentem.
Poznámky:
- žlutá hodnota: výkon měřený dle SPC-1 v IOPS
- zelená hodnota: praktičtější ukazatel, do výsledků jsou započítány jen IO obsloužené diskovým polem pod 5ms.
Společnost 3S.cz je partnerem společnosti Hitachi Data Systems. Diskové pole Hitachi AMS2100, AMS2300, AMS2500 patří ve svých třídách k technologické i výkonnostní špičce. To
úzce souvisí s tím, že tato řada je relativně mladá a byla uvedena na
trh na přelomu roku 2008/2009 a díky tomu se jedná o produkty, ve
kterých jsou implementovány nejmodernější technologie.
Za zmínku stojí skutečnost systémy USP fy HITACHI. Krom toho - že co
by Enterprise diskové systémy - mají nesrovnatelně vyšší výkonostní
parametry, dokázaly také 100% IO operací obsloužit pod hranicí 5ms.
Je zvykem srovnávat cenu uložených dat v kontextu ceny za Gigabyte.
Nicméně s fenoménem virtualizace začíná nabývat na významu i vyjádření
ceny za výkon! V poněkud zjednodušeném pojetí tato jednotka vyjadřuje (a čím komplexnější prostředí tím s větším významem), jaké investice se musejí vynaložit na obsloužení požadovaného objemu business požadavků. |