364
UTFORSKA vad vi kan och gör
UTFORSKA vad vi kan och gör

Stäng

Kompetensområden

Kontakta mig

Vill du veta mer och ta reda på hur vi kan hjälpa just dig? Lämna dina kontaktuppgifter

Valdation:
* Förnamn:
* Efternamn:
Företag:
Tel:
* Email:
Land:
* Meddelande:
Successfully sent!
Could not send the mail, try again later!
KAFFE ELLER TÉ? Vi kan väl ses över en kopp.

Blogg september 25, 2015

Fatta rätt beslut om historik för att arbeta effektivt med framtida beslutsfattande

När man sätter upp en beslutsstödsmiljö och börjar titta på sin information kommer man förr eller senare in på området historik. Historikhantering är ett komplext kapitel som behöver gås igenom noga. Vilka är behoven och vad betyder de olika val man gör? ”Historik” är som ord betraktat i det här sammanhanget mycket vagt och kan innebära olika saker för olika personer.

Betänk att man med historik kan mena antal historiska transaktioner som ska sparas och vara tillgängliga via lösningen. Det är ett viktigt beslut hur gammal information som ska vara åtkomlig, så det är högst relevant att ägna detta en stunds funderande.

En annan sorts historik som också gäller fakta kan vara sådan som är tillgänglig som en ”snapshot”, d v s vilken information fanns i källorna för varje given dag. Den typen av information gör det möjligt att följa trender över tid och analysera förändringar. Även här behöver ett antal överväganden göras. Ska man verkligen spara all data om och om igen varje dag? Eller vill man följa trenden per, säg rullande tolv? Och för att ytterligare krångla till det, kanske räcker det med att spara en ”snapshot” av valt nuläge för slutet på varje år, månad, vecka och innevarande dag?

När det gäller historik för beskrivande information, dimensioner, brukar man i dimensionsmodelleringssammanhang kalla detta för olika Slowly Changing Dimension (SCD) typer. Här måste man vara ytterst noggrann och för varje attribut i dimensionen gå igenom och välja SCD-typ. Det finns ett antal olika SCD-typer och de vanligaste är:

SCD 1

SCD 1 är den enklaste typen och skriver över vad som lagras och visas i attributet om källan har ändrats. Informationen reflekterar alltså källan helt och hållet.

Exempel: Adress-fältet hanteras med SCD 1 och skrivs över när informationen ändras i källan.

SCD 2

SCD 2 är möjligt när man använder surrogatnycklar (vilket alltid är fallet i en riktig dimensionsmodell). Den gamla informationen gäller fram till en specifik dag och den nya informationen gäller från dagen därefter tills ny information kommer från källan. All fakta, alla transaktioner kopplas till den information som gällde transaktionsdagen.

Exempel: Fältet som anger Antal anställda hanteras med SCD 2 och all historik sparas så man kan följa förändringarna över tid.

Utöver de här båda finns flera andra typer och varianter, i olika kombinationer. Vid första ögonkastet kan det vara lockande att tänka att man vill följa historik på dimensioner på alla attribut. Men det är kanske inte alls det man tänkt sig. Historikhanteringen kan snabbt bli komplex. Ofta är det bra att tänka ”keep it simple” samt utgå från vad en normal ändring av ett attribut innebär för att bestämma vilken typ av historikhantering som ska implementeras.

Reflektera över vad som händer om man har SCD 2 på fältet för Antal anställda men det är fel i källan. En rättning i det läget genererar en ny rad med den rättade informationen, men den gamla felaktiga blir kvar för all fakta fram till och med rättningsdatumet. I det läget vill man hellre använda SCD 1 för att korrigera det ursprungliga värdet. Datakvalitet blir alltså en viktig faktor när man väljer typ av historikhantering för sina dimensionsattribut.

Så summa summarum finns mycket att tänka på när det gäller historik!

Veronika Astervall, Business Area Manager, Enfo Pointer

Läs Veronikas andra blogginlägg »