(1/2) Datamanagement: de ontwikkeling en noodzaak ervan

Paul Hilgers

Deel 1 – Datamanagement

Hierbij het eerste blog uit een serie van twee over datamanagement. In het eerste deel gaan we in op de ontwikkeling in data en zetten we de kaders voor de noodzaak van datamanagement. In het tweede deel gaan we in op wet- en regelgeving en de GDPR.

Inleiding

Wat we willen overbrengen op anderen en de manier waarop heeft zich gedurende vele honderden jaren ontwikkeld. In de prehistorie werden tekeningen gemaakt op rotswanden. Later ontstond spijkerschrift om belangrijke zaken vast te leggen. Door de komst van boeken werd informatie steeds toegankelijker gemaakt. Toen monniken nog boeken schreven was één boek nog een monnikenwerk. Door de boekdrukkunst werd ook voor het gewone volk informatie toegankelijker. De grootste bibliotheek ter wereld staat in Londen. Hier zijn 14 miljoen unieke boeken beschikbaar die dateren vanaf de 9e eeuw.

Met de opkomst van automatisering zijn we nu in een fase beland dat we steeds meer bronnen van data en informatie hebben. Hierdoor ontstaat er een steeds groter wordende brei aan informatie waar we iets mee moeten. Voorbeelden hiervan zijn gezondheidstrackers (Garmin, Tomtom, Jawbone, Fitbit), tools voor locatiebepaling (Foursquare, Garmin),  en sociale media (Facebook, Twitter, Google Plus). Het uiteindelijke doel moet zijn om alle data die binnen organisatie aanwezig is in de hand te houden of in ieder geval kunnen beheersen. Hier komt datamanagement om de hoek kijken. 

Datamanagement is het geheel aan activiteiten gericht op het zorgvuldig, logisch, bedrijfsmatig en verantwoord organiseren van data.

Digitale data heeft zich de afgelopen jaren ontwikkeld. We onderscheiden hierin vier platformen:

  • Stand-alone computing waarbij we door gebruikmaking van mainframes efficiënter zijn gaan werken en digitale data centraal zijn gaan opslaan.
  • Distributed computing droeg bij aan delen van informatie, samenwerking en verhoogde productiviteit door de opkomst van netwerken. Data werd echter steeds meer decentraal opgeslagen op werkpleken en laptops.
  • Cloudcomputing draagt bij aan verdere groei in data door internet, apps en sociale media. Data wordt steeds globaler opgeslagen en benaderd, net als het ontstaan van hybride bedrijfsmodellen, waarbij delen in de cloud of onprem staan.
  • Het meest recente platform is ambiënt computing. Steeds meer sensoren in ons dagelijks leven zorgen voor meer data. IoT is in opkomst en zorgt voor een dynamisch landschap aan componenten die data genereren.

Uiteindelijk wordt steeds meer data gegenereerd. Hier moeten we wat mee, maar niet alle data is relevant voor bedrijfsvoering. Het gaat om de informatie die we op basis van data kunnen genereren. Data is in feite een verzameling gegevens welke binnen een organisatie aanwezig zijn. Van informatie spreken we wanneer data door mensen geïnterpreteerd kan worden. Informatie heeft meer waarde voor een organisatie dan data.

Trends

Wanneer we als PQR kijken naar trends binnen IT voor de komende jaren, zien we een aantal ontwikkelingen op het gebied van datacenters, werkplek en hybride cloud. Datamanagement is in alle gevallen relevant en noodzakelijk.

Binnen datacenters worden automatiseren van de automatisering en software definied (netwerk, storage) steeds belangrijker. Bij automatiseren van de automatisering kijken we vanuit het oogpunt van data vooral naar standaardisatie van de workflows en beperken van keuzeopties waar het gaat om afspraken die in SLA’s worden vastgelegd. Software definied onderscheid zich door veel nieuwe platformen die allemaal vragen om goede onderlinge integratie. Scale-out om datagroei te faciliteren voor de snelle ontwikkeling in het applicatielandschap.

Ten aanzien van werkplekken is het van belang om altijd toegang tot informatie te kunnen garanderen. Men wil altijd en overal op een veilige manier toegang tot data en systemen. Vanuit het oogpunt van datamanagement is het daarbij relevant om te kijken wie toegang krijgt tot data en willen we weten waar de data staat opgeslagen. Bescherming tegen malware en virussen is van belang, maar ook encryptie van data en een betere manier van delen om samen te werken.

De hybride cloud maakt het des te meer van belang te weten waar data staat en of dit voldoet aan wet en regelgegeving. Het eenvoudig kunnen verplaatsen van data tussen lokale omgevingen en clouds is belangrijk, maar dient veilig te gebeuren. Ook moeten we weer weg kunnen uit een cloudomgeving. Binnen de cloud zijn we vaak afhankelijk van SLA’s van XaaS leveranciers. We moeten in de gaten hebben of retenties wel voldoen en geen conflict ontstaat tussen aanbieder, afnemer en wetgevende instanties.

In al deze deelgebieden is datamanagement dus van belang en relevant. Vooral inzicht in waar data staat, en welke specifieke eisen gesteld worden aan de data zijn van belang voor de bedrijfsvoering of andere stakeholders. Denk daarbij aan RTO/RPO, archivering, SLA’s, wet- en regelgeving. Keuzes voor oplossingen moeten dus mede bepaald worden door de gestelde interne en externe eisen. 

In het volgende deel (deel 2) gaan we verder in op de eisen die gesteld worden. Onderwerpen daarin zijn vooral wet- en regelgeving en specifiek de GDPR.