Data vault

Top of Minds jobbar aktivt med att utveckla Data vault och sprida Data vault i de nordiska länderna. Top of Minds har flera medlemmar i Data vault standard styrelsen. Top of Minds samarbetar med Genesee Acadamy med utbildningar och certifieringar av Data vault modellerade.

Vad är Data vault?

Data vault är en datamodelleringsmetodik för att bygga andra generationens Enterprise Data Warehouse (EDW) -lösningar

I varje EDW finns det en stor integrerad databas som lagrar organisationens information. Det tillvägagångssätt som används för att utforma och modellera denna databas har direkt inverkan på EDW’ets prestanda, hållbarhet samt anpassningsförmåga. Data vault-modellering tillåter oss att bygga ett EDW’s som har betydligt bättre prestanda, är mer hållbart, är fullständigt kontrollerbart, agilt och mer anpassningsbar till förändringar över tiden. Bill Inmon, Datalagrets fader, säger ”Data vault är det optimala valet för modellering av EDW i DW 2.0 ramverket.

Kort sagt behandlar Data vault ett datalagers tre kärnfrågor:

  • förmåga att stödja spårbarhet och revisioner i enlighet med organisationens och myndigheters krav.
  • förmåga att lätt anpassas till nya affärsmodeller, nya datakällor och nya regler.
  • förmåga att stödja integrerad företagsinformation och undvika att skapa informationssilos.


 
Varför ett EDW, och varför Data vault?
Utan ett EDW som central lagringspunkt mellan källor och marter för rapportering kommer din BI-lösning snabbt bli ohanterbar och oöverskådlig. Att ladda marter direkt från källsystemen fungerar för de första marterna, men vartefter fler marter tillkommer som laddar från samma källsystem blir det snart omöjligt att upprätthålla datakvalitet i marter och rapportdata kommer inte vara jämförbart då varje mart laddas på helt fristående sätt beroende på vem som utvecklat just den laddningen.

Att bygga ett EDW har tidigare varit svårt att motivera då tidsåtgång och time-to-market blivit mycket lång. Med Data vault som modelleringsmetodik kan ditt EDW byggas ut över tid vartefter fler källor och marter tillkommer, utan att behöva modellera om existerande delar. Behovet av en ”allt på en gång”-lösning försvinner med Data vault och gör att time-to-market blir avsevärt kortare, då tidsåtgången för att bygga ditt EDW fördelas på varje marts tidsestimat – du behöver enbart bygga de delar du behöver just nu.

 

 
Hur ser Data Vault ut?
Data vault består av tre primära enhetstyper: Hubbar, Länkar och Satelliter. Hubbar är kärnverksamhetens affärsnycklar, Länkar är relationerna och kopplingen mellan alla affärsnycklar och Satelliterna är all beskrivande information. Hubbar och länkar bildar tillsammans benstommen av modellen medan satelliterna lägger till alla de beskrivande uppgifterna (kontexten). En av de stora fördelarna med att använda Data vault är att all information, relevant detaljinformation och all historisk (time slice) data lagras i olika strukturer (satelliter) som gör dem enkla att bygga, ladda, underhålla och förstå. Data vault gör att du effektivt kan ladda all data.

Hur fungerar Data vault?
Eftersom man i Data vault hanterar affärsnycklarna (Hubbar) separat från alla relationer (Länkar) samt att både Hubb och Länk är fria från beskrivande information (detta lagras i Satelliter), så utgör Data vault en arkitektur som är mycket tålig, anpassningsbar, skalbar och väl lämpad för hög prestanda. När nya källor läggs till EDW’et eller om format av befintliga källor ändras så absorberar Data vault dessa förändringar enkelt genom att lägga till nya länkar och nya beskrivande satelliter utan förändringar av befintliga strukturer. Detta lindrar det tunga omstruktureringsarbete som krävs i datalager byggda enligt Första generationens paradigm.

Läs mer om Data vault på Wikipedia.

Gå Data vault kurs hos oss


Lär dig Data vault modellering och certifiera dig. Se vårt kursschema eller anmäl dig direkt här.