Data is een waardevolle bezit voor bedrijven en wordt niet altijd ten volle benut. Sterker nog, misbruik van data, meestal onbedoeld, kan leiden tot inefficiëntie en slechte besluitvorming met gemiste kansen en lagere winsten als gevolg. cimt steunt organizaties bij hun digitale transformaties. Een van de aspecten in dit process is het toepassen van data governance. DAMA-DMBOK definiëert dit als volgt: ‘Het uitoefenen van autoriteit, controle en gedeelde besluitvorming (planning, monitoring en handhaving) over het beheer van datamiddelen.’ Data governance definieert de mensen, processen, het kader en de organisatie die nodig zijn om ervoor te zorgen dat de informatiemiddelen van een organisatie (data en metadata) veilig, formeel, correct, proactief en efficiënt worden beheerd in de hele onderneming om het vertrouwen, de privacy, de veiligheid, de betekenis en de nauwkeurigheid ervan te waarborgen (EW Solutions).
De inefficiëntie en slechte besluitvorming zijn onder meer te wijten aan het feit dat bedrijven om diverse redenen worstelen met hun data:
– Data Chaos
– Onbetrouwbare data
– Verschillende branche- of gebiedsvoorschriften
Een tool die helpt deze problemen op te lossen en/of te voorkomen door middel van de praktijken en processen van data governance is Talend Data Catalog, onderdeel van Talend Data Fabric. Talend Data Catalog creëert een enkele bron van vertrouwde data voor iedereen in het bedrijf, waardoor alle bovengenoemde data uitdagingen worden opgelost.
- data chaos
De groei van een bedrijf gaat gepaard met een toename van het genereren en verbruiken van data, of die nu afkomstig zijn van interne tools of van externe bronnen (marketing, website, enz.). Dit leidt automatisch tot meer complexiteit in het datamodel; workflows passen zich aan, er ontstaan nieuwe structuren, privacyrichtlijnen veranderen (ook afhankelijk van geolokalisatie), waardoor schaalbaarheid moeilijker te realiseren is. Dit staat bekend als data chaos; wanneer een bedrijf het overzicht verliest over gegevens die zich elke dag blijven opstapelen in een ongestructureerd formaat, wat op zijn beurt leidt tot een verlies van inkomsten en kansen.
Volgens Forbes exploderen de datavolumes, er is in de afgelopen twee jaar meer data gecreëerd dan in de gehele voorgaande geschiedenis van de mensheid (Forbes, 2015), maar ook minder dan 0,5% van alle data wordt ooit geanalyseerd en gebruikt. Het potentieel met gestructureerde en georganiseerde data is grenzeloos en dat is waar Data Catalog om de hoek komt kijken om data chaos in het bedrijf op te lossen en te voorkomen in de toekomst.
Data Catalog helpt u één groot beeld te krijgen van hoe uw datamodel eruit ziet door de lineage-functie; data worden gekoppeld en blijven gestructureerd, zelfs wanneer u opschaalt. Het overzicht geeft ook inzicht in welke data niet gestructureerd is, of niet gekoppeld is aan de rest van de bedrijfsstructuur om managers op de hoogte te houden van problemen binnen het bedrijfsmodel.
Als voorbeeld toont de onderstaande figuur de semantische lineage van gegevens inclusief persoonlijk identificeerbare informatie (PII).
- onbetrouwbare data
Bovendien verhoogt de gelijktijdige ontwikkeling van complexe datamodellen door meerdere ontwikkelaars het risico op onbetrouwbare resultaten of het verloren gaan van gegevens die eerder in de datamodellen aanwezig waren. In sommige gevallen, als er een fout is gemaakt en de dataonbetrouwbaar is, wilt u misschien de klok terugdraaien en eerdere versies van data vergelijken om te helpen de fout te herstellen en tegelijkertijd de verstoring voor alle teamleden tot een minimum te beperken.
Data Catalog gebruikt de repository om een versiegeschiedenis bij te houden voor elk geoogst of geüpload datamodel, zodat u elke wijziging kunt bijhouden. Dit maakt het mogelijk om de vorige datamodellen gemakkelijk te openen en te vergelijken met het defecte model en vermindert de tijd die nodig is om de oorzaak van een probleem te achterhalen. Version Controlling System (VCS) maakt het mogelijk om wijzigingen terug te draaien en oudere versies van datamodellen te herstellen.
- Verschillende branche- of gebiedsvoorschriften
Data Catalog biedt ook één punt van controle voor alle data, wat de risico’s van onnauwkeurigheid en toegankelijkheidsproblemen vermindert doordat iedereen op één bron van de waarheid kan vertrouwen als het gaat om de manier waarop gegevens moeten voldoen aan bedrijfsprocessen en wettelijke zaken (denk aan privacy, beveiliging, enz.). Dit is met name relevant voor bedrijven die aan verschillende voorschriften moeten voldoen als ze in meerdere landen of sectoren actief zijn.
Kortom, Talend Data Catalog stelt organisaties in staat om data governance te bereiken door ervoor te zorgen dat gegevens bruikbaar, toegankelijk, beschermd en vertrouwd zijn. Effectieve data governance leidt tot beter data overzicht en inzicht wat weer leidt tot betere besluitvorming.