Document sans nom
LUX
Solutions-magazine


Accueil  >  Dossiers  >  Storage




Tijd voor deduplicatie!

Rédigé par De redactie le Jeudi 26 Juin 2008
Lu 494 fois

Het vermogen om een gegevensstroom 20 tot 30 keer te verkleinen wordt erg nuttig om de opslagtijd te verkorten.



Tijd voor deduplicatie!
De Virtualisation Engine TS7530, de nieuwe virtual tape library van IBM die officieel op 8 juni op de markt werd gebracht, biedt de voordelen van deduplicatie niet. Volgens Big Blue is het daarvoor nog te vroeg. Ondanks de onmiskenbare voordelen is de technologie naar verluidt nog niet stabiel en performant genoeg. Om het gewicht van de opgeslagen gegevens te beperken, geeft IBM de voorkeur aan hardwarecompressie met een ratio van 2:1, tegen de 20:1 die doorgaans met deduplicatie wordt behaald. De toekomst zal uitwijzen of de voorzichtigheid van Big Blue terecht was …

In tegenstelling tot IBM’s aanpak was NetApp de eerste constructeur die deduplicatie rechtstreeks integreerde in een opslageenheid in plaats van op een toepassingsgerichte server. Hiermee wordt de technologie ook voor het eerst gebruikt op een primaire opslageenheid in plaats van in een back-upproces.

Achter de term deduplicatie schuilt een technologie waarvan het principe vrij eenvoudig te begrijpen is, aangezien ze erin bestaat reeksen van gegevens in factoren op te splitsen om de opslagruimte op de schijfeenheden fors te verkleinen. In zekere zin is deduplicatie een nieuwe uitbreiding van de welbekende compressietechnologieën uit de IT-wereld (zoals zip, bzip2, gzip), die echter op een veel dynamischer manier kan werken dan traditionele archive-ringssoftware.

Of men het nu combineert met een VTL (Virtual Tape Library) of ervoor opteert na een eerste ervaring met back-up op schijf doet er weinig toe. Vaak zijn de beweegredenen dezelfde: het hoofd bieden aan een stijging van de hoeveelheid data die moet worden beschermd, die dikwijls 30% per jaar bedraagt. Zo zal de benodigde schijfruimte voor eenzelfde behoefte lager zijn. De voordelen van deze methode zijn tweeërlei. Op het vlak van de kosten worden de aanschaf- of updatekosten van de opslagcapaciteit meer gespreid. Op het vlak van beheer kan een groter aantal gegevens per eenheid worden opgeslagen of kunnen ze gedurende een langere periode online worden bewaard.

Dat levert meteen bijkomende besparingen op: lager stroomverbruik, minder plaatsinname in vierkante meter en gebruik van eenvoudiger koelinfrastructuren. Uiteindelijk genieten de organisaties van lagere kosten voor opslagbeheer en een vermindering van de totale eigendomskost.

Volgens de analisten zal deduplicatie snel opgang maken. De consolidatie van de sector bewijst dat. Op enkele maanden tijd verwierf EMC Avamar, legde Hitachi Data Systems beslag op Archivas, ging Adic -dat op zijn beurt door Quantum werd overgenomen-aan de haal met Rocksoft, integreerde Symantec de technologieën van Datacenter Technologies dat in handen kwam van Veritas en haalde IBM ten slotte Diligent in huis. FalconStor ontwikkelde dan weer zijn eigen SIR-technologie, net als NetApp met ASIS, dat voortaan in alle opslagapparatuur ingebouwd zit

Met name voor NetApp was het meteen raak, met meer dan 3.500 geïnstalleerde systemen en een totale opslagruimte van ruim 100 PB (petabyte). Vandaag is NetApp de enige leverancier van oplossingen die deduplicatie in verschillende omgevingen -back-up, archivering, wettelijke opslag, primaire gegevens- aanbiedt.

Hoewel met deze technologie kan worden bespaard, houdt ze echter ook nadelen in: terwijl de capaciteit van een harde schijf precies gekend is, geldt dat niet voor de reductiegraad ervan. Die is immers onderhevig aan het type gegevens en aan de back-upregels. Voor kantoordocumenten ligt de aanvankelijke reductiegraad hoog; ze ligt lager in het geval van een database met een beperkter redundantieniveau. Verder hangt de nodige tijd af van de mate waarin de gegevens dagelijks worden gewijzigd;

Volgens NetApp hangt alles dus af van de gegevensset en van de kwaliteit van de dubbele ingaven die ze bevat. Het is allemaal vrij vaag. Desondanks zijn de besparingen niet verwaarloosbaar. De producent van ASIS haalt het voorbeeld aan van een internationale groep in de gas- en petroleumsector die een besparing van 35% boekte voor de opslag van zijn personeelsregisters. Een ander voorbeeld is de fabrikant van test- en meetapparatuur die 98% bespaarde op de dagelijkse back-up van zijn databases …

Deduplicatie is een technologie in wording. Vandaag wordt ze gebruikt voor back-up -anders gezegd om de schijfruimte te optimaliseren. Maar FalconStor heeft aangetoond dat de technologie even goed in noodplannen kan worden geïntegreerd zonder dat er fysieke media aan te pas komen. Om back-ups van de hoofdsite te verwijderen zonder tapes te hoeven gebruiken, kunnen gegevens van beperkte grootte gemakkelijker van het ene punt naar het andere worden doorgestuurd via netwerkverbindingen.




Ontvangt onze nieuwsbrieven
 


Hot Spot

 Partenaires