Data vault

DATA VAULT

Top of Minds jobbar aktivt med att utveckla Data vault och sprida Data vault i de nordiska länderna. Top of Minds har flera medlemmar i Data vault standard styrelsen. Top of Minds samarbetar med Genesee Acadamy med utbildningar och certifieringar av Data vault modellerade.

Vad är Data vault?

Data vault är en datamodelleringsmetodik för att bygga en modern data plattform. 

I varje modern dataplattform finns det en stor integrerad datalager som lagrar organisationens information. Det tillvägagångssätt som används för att utforma och modellera denna databas har direkt inverkan på plattformens prestanda, hållbarhet samt anpassningsförmåga. Data vault-modellering tillåter oss att bygga en plattform  som har betydligt bättre prestanda, är mer hållbart, fullständigt kontrollerbart, agilt och mer anpassningsbar till förändringar över tiden. Bill Inmon, Datalagrets fader, säger ”Data vault är det optimala valet för modellering av EDW i DW 2.0 ramverket.

Kort sagt behandlar Data vault ett datalagers tre kärnfrågor:

  • förmåga att stödja spårbarhet och revisioner i enlighet med organisationens och myndigheters krav.
  • förmåga att lätt anpassas till nya affärsmodeller, nya datakällor och nya regler.
  • förmåga att stödja integrerad företagsinformation och undvika att skapa informationssilos.

Varför en modern data platform, och varför Data vault?
Utan en Lake, EDW, ananlysplattform eller annan modern dataplattform som central lagringspunkt mellan källor och marter för rapportering kommer din BI-lösning snabbt bli ohanterbar och oöverskådlig. Att ladda marter direkt från källsystemen fungerar för de första marterna, men vartefter fler marter tillkommer som laddar från samma källsystem blir det snart omöjligt att upprätthålla datakvalitet i marter och rapportdata kommer inte vara jämförbart då varje mart laddas på helt fristående sätt beroende på vem som utvecklat just den laddningen.

Att bygga ett stort integrerat data lagar har tidigare varit svårt att motivera då tidsåtgång och time-to-market blivit mycket lång. Med Data vault som modelleringsmetodik kan din moderna data plattorm byggas ut över tid vartefter fler källor och marter tillkommer, utan att behöva modellera om existerande delar. Behovet av en ”allt på en gång”-lösning försvinner med Data vault och gör att time-to-market blir avsevärt kortare, då tidsåtgången för att bygga ditn data platform fördelas på varje marts tidsestimat – du behöver enbart bygga de delar du behöver just nu.

Hur ser Data Vault ut?
Data vault består av tre primära enhetstyper: Hubbar, Länkar och Satelliter. Hubbar är kärnverksamhetens affärsnycklar, Länkar är relationerna och kopplingen mellan alla affärsnycklar och Satelliterna är all beskrivande information. Hubbar och länkar bildar tillsammans benstommen av modellen medan satelliterna lägger till alla de beskrivande uppgifterna (kontexten). En av de stora fördelarna med att använda Data vault är att all information, relevant detaljinformation och all historisk (time slice) data lagras i olika strukturer (satelliter) som gör dem enkla att bygga, ladda, underhålla och förstå. Data vault gör att du effektivt kan ladda all data.

Hur fungerar Data vault?
Eftersom man i Data vault hanterar affärsnycklarna (Hubbar) separat från alla relationer (Länkar) samt att både Hubb och Länk är fria från beskrivande information (detta lagras i Satelliter), så utgör Data vault en arkitektur som är mycket tålig, anpassningsbar, skalbar och väl lämpad för hög prestanda. När nya källor läggs till datalagret eller om format av befintliga källor ändras så absorberar Data vault dessa förändringar enkelt genom att lägga till nya länkar och nya beskrivande satelliter utan förändringar av befintliga strukturer. Detta lindrar det tunga omstruktureringsarbete som krävs i datalager byggda enligt Första generationens paradigm.

Läs mer om Data vault på Wikipedia.

Vill du gå Data Vault-kurs hos oss?