De waarde van data kwaliteit tooling

Tentive / Blog / Blog / De waarde van data kwaliteit tooling

Laat ik dit blog eerst eens beginnen met de opmerking dat sommige lezers van mijn blogs mij soms vinden klinken als een ‘a broken record’. Indien je je niet herkent in deze opmerking, rijst misschien nu bij jou de vraag: “Hoe dan?” Nou, dat goede data een ‘strategic business asset’ is voor de moderne organisatie en dat datakwaliteit een integraal onderdeel zou moeten zijn van de bedrijfsstrategie. En waarom hamer ik daar dan elke keer weer op, kan je je vervolgens afvragen? Het antwoord hierop is even simpel als verbijsterend. Omdat bij het gros van de organisaties dit besef nog onvoldoende is doorgedrongen. Dus daarom nogmaals:

Kwalitatief goede data = Een ‘strategic businessasset’

Data is dus een waardevol bezit voor organisaties. Met behulp van een doordacht Data Governance raamwerk kan je dit realiseren. Maar stel niet uit tot morgen wat je vandaag nog kunt doen. De aard en het volume van de data waarover organisaties beschikken, verandert met een ongelooflijke snelheid. Dit betekent dat de potentiële kosten van het niet implementeren van een Data Governance raamwerk steeds hoger worden.

In mijn blogWaarom heeft jouw organisatie Data Governance nodig? draag ik nodige redenen aan waarom het voor organisaties uitermate raadzaam is om serieus werk te maken van Data Governance.

In kort komt het neer op het volgende. Door de toenemende wet- en regelgeving is het voor organisaties belangrijker dan ooit om Data Governance toe te passen. Hang daarom niet achterover te wachten op de dingen die gaan komen, maar speel alvast proactief in op toekomstige datavraagstukken die voortkomen uit dit alsmaar veranderende landschap. Daarnaast komen organisaties die werkzaam zijn in minder gereguleerde sectoren steeds meer tot het besef dat concurrentievoordelen te behalen zijn wanneer de eigen data goed wordt gemanaged én begrepen. Organisaties die daarbij een holistische benadering voor Data Governance hanteren, zullen in mijn optiek daarvan het meest profiteren. Maar let wel: initiatieven voor Data Governance moeten worden geleid door de Business en een gestructureerde methodologie gebruiken om succesvol, kosteneffectief en vooral relevant te zijn.

Dit brengt mij tot het volgende. Een goed Data Governance raamwerk kan eigenlijk niet bestaan zonder technologische ondersteuning. De huidige generatie tooling kunnen dit op de volgende manier doen:

Data profiling tooling

Uit onderzoek blijkt dat slechts 3% van de data voldoet aan de kwaliteitsstandaarden van organisaties (Nagle, 2017). Dit impliceert dat slecht beheerde data organisaties miljoenen euro’s aan verspilde tijd, geld en onbenut potentieel kosten. Data profiling tooling bepalen de kwaliteit en de legitimiteit van jouw data. Met behulp van analytische algoritmen worden datasetkarakteristieken tot in het kleinste detail onderzocht. Veelvoorkomende fouten in databases worden daarbij geëlimineerd. (Denk hierbij aan ontbrekende waarden, waarden die niet zouden moeten worden opgenomen, waarden met ongewoon hoge of lage frequentie en waarden die niet de verwachte patronen volgen.) Data profiling tooling helpen organisaties met het ordenen en het beter begrijpen van (de onderlinge relaties van) de eigen data. Dit stelt organisaties in staat om essentiële informatie te ontdekken uit de data waarover zij al beschikken. En weten over welke data je beschikt en de betekenis daarvan is natuurlijk elementair voor Data Governance. Immers, hoe kan je op een goede manier data beheersen als je op voorhand niet eens weet over welke gegevens je beschikt?

Data glossaries en metadata tooling

Een belangrijk onderdeel van Data Governance is vast te stellen wat de data is en de betekenis ervan. Het omvat ook het definiëren van ‘business rules’ en datakwaliteitsregels die uiteindelijk bepalen wat de data goed genoeg maakt voor de eindgebruiker. Het opstellen van een ‘data glossary’ kan hierbij uitkomst bieden. In een data glossary worden de kenmerken van bedrijfskritische data-elementen in de verschillende systemen beschreven. Deze beschrijving is van belang om ervoor te zorgen dat iedereen weet hoe deze data-elementen zijn gedefinieerd, waar ze zijn opgeslagen, en wat de kwaliteit ervan is. (Bij het uitvoeren van projecten zal vaak worden teruggrepen naar de data glossary om te zien hoe data-elementen geraakt worden door bepaalde veranderingen (Feltkamp, 2018)). Een data glossary kan worden aangevuld met referentiedata, zoeklijsten en de mapping tussen referentiedata die in verschillende systemen wordt bewaard. Sommige tooling hebben een workflow voor het aansturen van werkstromen. Dit vereenvoudigt het proces voor Data-eigenaren en Data Stewards om data definities en referentiedata waarden te beoordelen en goed te keuren.

Datakwaliteit monitoring en rapportage tooling

Dit zijn waarschijnlijk de tooling waarmee eindgebruikers het meest vertrouwd zijn. Zoals de benaming als doet vermoeden, richten deze tooling zich op het beheersen en monitoren van datakwaliteit. Ze houden toezicht op de datakwaliteitsniveaus die zijn gedefinieerd door middel van de ‘business rules’. De tooling genereren rapportages waaruit eventuele datakwaliteitsproblemen kunnen blijken. Data-eigenaren en Data Stewards kunnen vervolgens in actie komen om deze gesignaleerde problemen te onderzoeken en op te lossen.

Tot slot, bij goede Data Governance gaat vooral over het toewijzen van de juiste mensen aan de juiste rollen en het opzetten van goede processen. Deze processen kunnen daarbij worden ondersteund door gebruikmaking van de juiste technologie. Ik wil benadrukken dat tooling alleen niet het antwoord is op data gerelateerde vraagstukken. Dit neemt niet weg dat je met succes tooling kunt gebruiken om sommige van je processen te ondersteunen en te operationaliseren. Als je bijvoorbeeld grotere hoeveelheden data wilt gebruiken, dan heb je alle hulp nodig die je kunt krijgen. Toch?


Tentive Solutions biedt organisaties ondersteuning bij het oplossen van hun Data Governance en Data Management vraagstukken. Meer weten? Neem gerust contact op met onze Data Management Team.


Jacco Oudeman


Geraadpleegde bronnen:
Feltkamp, D. (2018), “Data is een onderwerpvoor in de boardroom”,
Nagle, T., Redman, T.C. en D. Sammon, 2017, “Only 3% of companies’ data meets basic quality standards”, Harvard Business Review, September 11