UTFORSKA vad vi kan och gör
UTFORSKA vad vi kan och gör

Stäng

Kompetensområden

Kontakta oss

KAFFE ELLER TÉ? Vi kan väl ses över en kopp.
Where is your data?

Blogg november 05, 2018

Vet du tillräckligt om din data?

Gartner förutspår i sin nya rapport 1) att större delen av den dataanalys som utförs år 2020 fortfarande kommer att kräva en koppling till spridda datakällor, vilket leder till att de ledande företagen måste fördubbla sina satsningar på hantering av metadata före det. Detta aktuella problem är emellertid långt ifrån nytt.

För modern informationshantering är blotta existensen av data inte tillräcklig. Data ska också kunna hittas och finnas tillgänglig precis när det behövs. EU:s allmänna dataskyddsförordning GDPR har ytterligare skärpt kravet på att företag ska vara på det klara med vilka data de har och även var de finns mer exakt. En kraftfull övergång till molnbaserade system understryker detta behov ytterligare.
Gartner förutspår i sin nya rapport 1) att större delen av den dataanalys som utförs år 2020 fortfarande kommer att kräva en koppling till spridda datakällor, vilket leder till att de ledande företagen måste fördubbla sina satsningar på hantering av metadata före det. Detta aktuella problem är emellertid långt ifrån nytt.

Under informationshanteringens historia har flera lösningar med olika infallsvinklar och namn utvecklats: Data Model Business Metadata, Metadata Repository, Data Inventory, Data Dictionary, Data Directory eller Data Catalog. Även Data Virtualization och API management-teknikerna försöker delvis lösa problemet gällande hittbarhet, tillgänglighet och hanterbarhet, var och en med lite olika fokus. Jag använder engelska termer här, eftersom den svenskspråkiga terminologin inte är etablerad.

Datakataloger har också utvecklas mycket inom öppna data. Där består grunden för dataerbjudandet av flera aktörer inom offentlig förvaltning. Jag anser att de till och med ligger delvis före företagen när det gäller tekniker för att dela data. Ett bra exempel på detta är till exempel Helsinki Infoshare på HRI.fi, som presenterar öppna data i huvudstadsregionen.

Vilka funktioner kan vi vänta oss av moderna datakataloger avsedda för företagsbruk och vad klarar moderna produkter av? Typiska funktioner är till exempel:

1. Insamling av metadata från olika datakällor. Datakatalogprodukter innehåller mer eller mindre automatiserade gränssnitt som kan användas för att direkt läsa metadata från olika system och skapa nya metadata genom att granska datainnehåll, dvs. genom profilering av data. Profilering kan användas för att identifiera bl.a. värdeområden eller värdegrupper, beroendeförhållanden mellan datamängder och kvalitetsegenskaper för data.

2. Hantering av innehållsbeskrivningar. I datakataloger administreras och hanteras innehållsbeskrivningar för data. Innehållsbeskrivningarna är väsentliga för att bl.a. genomföra sökfunktioner.

3. Kommentarer, utvärdering och godkännande. Uppgifter kan kommenteras och diskuteras. Beskrivningar av datainnehåll kan förbättras med s.k. crowdsourcing-teknik, dvs. beskrivningarna byggs upp och förädlas som ett resultat av flera olika aktörers insatser. Ofta kan de slutgiltiga ändringarna av data innefatta en godkännandeprocess.

4. Spårbarhet för dataflöden. När data flyttas mellan system är det alltid viktigt att kunna utreda dataflödet och de förändringar som inträffat längs vägen. Varifrån data kommer och vad som har gjorts åt dem. Spårbarheten är ytterst väsentlig för att bedöma betydelsen, tillförlitligheten och lämpligheten för det avsedda ändamålet.

5. Beskrivningar av åtkomstgränssnitt. I datakatalogen administreras hänvisningar till hur data kan kommas åt.

6. Sökfunktioner och hittbara data. Datakataloger hjälper att hitta data genom att tillhandahålla bl.a. olika grupperingar, sökfunktioner och menystrukturer via ett användargränssnitt.

7. Visning av data. Förutom innehållsbeskrivningar och metadata kan datakatalogen inkludera en funktion som ger direkt åtkomst till data eller ett sampel.

8. Dataskydd. När hittbarheten och tillgången till data förbättras gäller det att se till att behörigheterna och dataskyddet är i ordning för att obehöriga aktörer ska hindras åtkomst till dem. Även blotta existensen av data kan vara konfidentiell, och följaktligen kan det finnas ett behov av att begränsa åtkomsten till metadata och innehållsbeskrivningar.

Företagens datakataloger är här för att stanna. Hos oss på Enfo är datamodellering en väsentlig del av alla utvecklingsprojekt som gäller informationshantering. I samband med detta produceras värdefullt innehåll i datakatalogen, oavsett om en sådan redan finns eller kommer att skapas i framtiden.

Baserat på vår erfarenhet kräver väl genomförd informationshantering ett övergripande tillvägagångssätt som endast kan uppnås genom ett långsiktigt arbete tillsammans med kunden. En fungerande helhet bygger på en hållbar informationsarkitektur, där varje komponent i arkitekturen genomför sin bestämda roll som en del av helheten. Datakatalogens roll i denna helhet stödjer väl strategisk informationsledning och betjänar direkt bl.a. dataintegration samt hanteringen av masterdata och dataägarskap.

1) Gartner Magic Quadrant for Metadata Management Solutions, publicerat 9.8.2018

Mika Naatula

 

Mika Naatula
Senior Vice President Business Solutions, Information Management, Enfo