Varför Data Vault?
Med Data Vault som designprincip för datalagret kommer ett antal viktiga fördelar.
Förändring
Med det traditionella sättet att bygga datalager är du tvungen att lägga mycket tid i början av projekt på en detaljerad kravstudie. Detta då tillägg av datakällor eller fel/uppdateringar av affärsreglerna får spridningseffekter i informationsmodellen. Något som ökar komplexiteten och kräver att hela kedjan alltid behöver laddas om vilket i sin tur driver tid.
Med Data Vault kommer du runt denna problematik och kan leverera affärsnytta snabbare. En Data Vault informationsmodell är designad för att kunna förändras. Lägg till nya importer och exporter och uppdatera affärsregler utan att skapade påföljande problem i resten av informationsmodellen.
Spårbarhet
En nyckelprincip för Data Vault är att all data är relevant – även om den är fel. All data läses in oförvanskat d.v.s. data uppdateras aldrig och inget tas heller bort (om t.ex. inte GDPR kräver det). Detta förenklar och gör att importen av data, även vid stora datamängder, går snabbt.
Designprincipen för Data Vault är att alltid kunna återskapa alla data. Du blir med andra ord aldrig av med historisk information och tappar aldrig detaljeringsgraden i data. Du får dessutom full spårbarhet över vad som hänt med data genom hela kedjan från inläsning ut till presentationslagret.
Automatisering
En Data Vault design är alltid standardiserad vilket gör den enklare att automatisera jämfört med ett traditionellt uppbyggt datalager. Genom att använda enkla och repeterbara mönster(patterns) kan data transformeras till strukturer som både lagrar data oförvanskat men också möjliggör att processen automatiseras avseende skapandet av SQL-objekt och ETL-komponenter. Vi har t.ex. en kund som har 400 fil-importer vilka alla kategoriserats ned till 2 grundtyper av data vilket läses in automatiserat.
Det finns idag flera automatiseringsverktyg för datalager som t.ex. WhereScape, Timextender och Bimlflex.
Ett bättre datalager
+ data
- Bättre hantering av brister i datakvalitet
- Stärkt spårbarhet och versionshantering
- Möjlighet till realtidsdata
- Stödjer stora datamängder och realtidsdata
+ verksamhet
- Kan anpassa informationsmodellen enklare när kraven förändras
- Kan skapa nya informationsflöden utan att existerande påverkas
- Kan ta fram nya rapporter och analyser snabbare
Vår rekommendation
Nedan bild visar vår övergripande design-rekommendation för ett Data Vault Datalager. Steg markerade i orange färg kan med fördel automatiseras.
Klicka på bilden för att förstora den!