UTFORSKA vad vi kan och gör
UTFORSKA vad vi kan och gör

Stäng

Tjänster

Kontakta oss

KAFFE ELLER TÉ? Vi kan väl ses över en kopp.
Vad är egentligen bra datakvalité och hur uppnår man det

Blogg mars 27, 2019

Vad är egentligen bra datakvalité och hur uppnår man det?

Vi kan enbart fatta datadrivna beslut om den data vi använder faktiskt är korrekt. Om vi inte har hög datakvalité är data i princip värdelös och kan rent ut av vara skadligt för din verksamhet. Många företag underskattar kostnaden för felaktig och inkonsekvent data och tänker inte alltid på vad konsekvenserna blir om denna data sedan används. Ett annat vanligt scenario är att företag sitter på stora lager av information och det verkar nästan omöjligt att få en överblick och hitta de felaktigheter som sedan måste fixas. Detta resulterar i att enbart en bråkdel av den data som finns faktiskt används. Tänk hur mycket värdefull och affärkritisk information man kan gå miste om då.

Hur uppstår problem i datakvalitén?

En anledning till att det uppstår problem med datakvalitén är helt enkelt att anställda matar in inkorrekt data, eller att de matar in korrekt data men på ett felaktigt sätt. Utöver dessa mänskliga faktorer kan kvalitetsproblem uppstå vid migrering av data eller vid systemintegrationer. Det är lätt att anta att din data enkelt kan överföras till ett annat system och lika enkelt kan konfigureras till det andra systemets parametrar. Men så enkelt är det sällan. Ibland är organisationen heller inte medveten om de problem som finns i källsystemets data. Till exempel dubbletter, information som saknas, felstavningar och rent felaktiga uppgifter. Detta kan då leda till att kritiska fel uppstår vid migrering såväl som vid integrationer. Rena systemfel och inmatningsfel ska korrigeras uppström i källsystemet och det är källsystemets uppgift att säkerställa att dess data är korrekt. Dock ”äger” källsystemen inte datakvalitétsproblemen som sträcker sig över flera system, utan det gör BI-projektet.

Vanliga exempel är att flera olika system har information om verksamhetens kunder utan någon universal identifierare eller att olika system håller reda på olika produkter som man erbjuder kunderna. I bästa fall finns det en integrationsmotor som håller ihop den här informationen, men annars är det BI-teamet som är ansvariga för upprättandet av konforma dimensioner som är enhetliga över hela verksamheten - oavsett källsystem. Enligt samma devis kan olika delar av verksamheten ha goda skäl till att extrahera data med olika villkor och mäta en och samma affärsprocess ur flera olika perspektiv. Det resulterar dock ofta i snarlika men inte identiska resultat vilket i sin tur leder till diskussioner om vems uppgifter som är rätt och om man överhuvudtaget kan lita på BI-lösningen. Dessa avdelningar har sällan till uppgift att etablera enhetliga definitioner för attribut och mätvärden utan även den frågan är något som BI-teamet äger även om de givetvis behöver verksamhetens engagemang och delaktighet för att etablera en lösning på problemet.

Datakvalité är nyckeln till framgång!

Kvalitetsdata är bra data. Denna data går att nyttja, analysera och använda som beslutsunderlag. Men vad kännetecknar egentligen bra datakvalité? Nedan följer ett antal parametrar som kan användas vid bedömningen.

1. FULLSTÄNDIGHET
Finns den nödvändiga informationen i fälten?

2. KONFORMITET
Följer data uppsatta regler?

3. ENHETLIGHET
Är data representerat på samma vis i verksamheten?

4. UPPREPNINGAR
Är data representerat en gång och bara en gång?

5. INTEGRITET
Är relationer mellan data definierade och konsekventa?

6. TRÄFFSÄKERHET
Är din data korrekt?

Det fina med dessa dimensioner är att de är mätbara. Det krävs förvisso en del arbete med att sätta upp ett ramverk för att mäta datakvalité, men med ett långsiktigt perspektiv kan du räkna hem den investeringen – var så säker. Med ett ramverk för att övervaka BI-lösningens datakvalité går det även att diskutera datakvalitetens utveckling över tid och därigenom dra slutsatser kring huruvida den förbättras eller inte. Transparens i det här ämnet kan även hjälpa till att skapa uppmärksamhet och engagemang kring datakvalité. Något som annars allt för lätt kan avfärdas som abstrakt och ”någon annans problem”

Hur bra datakvalité måste en BI-lösning ha?

Här kommer ett klassisk ”det beror på-svar”. Det beror på hur kritisk lösningen är och givetvis på syftet. Är det en lösning som syftar till att visualisera övergripande trender eller hitta avvikelser i en datamängd så är datakvalitétskravet lägre än om det är en lösning kopplad till verksamhetens officiella rapportering till exempel. Helt oavsett datakvalité så har en BI-lösning bara ett värde då den utgör ett beslutsunderlag som verksamheten faktiskt vågar och kan agera på! Mot bakgrund av det så måste en lösning alltid ha hög datakvalité.

Läs vår guide som jämför Power Bi och Qlik Sense