Hoppa till huvudinnehåll

Datakvalitet i praktiken

Datakvalitet är ingen ja/nej-fråga. Det beror på sammanhang, syfte och förändras över tid. Den viktigaste frågan är inte "är datan korrekt?" utan "är denna data tillräckligt bra för detta beslut, just nu, till denna kostnad?"

Sammanfattning

Datakvalitet har i sig aldrig hindrat oss från att leverera mätbara affärsförbättringar. Vi arbetar med den data ni har, modellerar osäkerhet och lägger till mänsklig kontroll där det spelar roll.

Så hanterar vi ofullkomlig data

  • Vi bygger modeller som klarar osäkerhet och använder mänsklig granskning där det behövs.
  • Att veta att datakvaliteten är låg inom vissa områden är i sig värdefull information — vi kan bygga in den kunskapen i modellerna.
  • Organisationer överskattar ofta problemet med "dålig data". Framsteg är möjligt medan kvaliteten förbättras parallellt.

Viktigaste insikten: Vänta inte på perfekt data. Börja leverera värde, hantera kvaliteten medvetet och förbättra steg för steg.

Kvalitetsattribut för digitala representationer

Datakvalitet har många dimensioner:

AttributVad det betyderVarför det spelar roll
TillförlitlighetGer upprepade mätningar under liknande förhållanden liknande resultat?Utan detta blir trender instabila.
ValiditetMäter datan verkligen det som behövs för beslutet?Fel signaler → fel beslut.
AktualitetHur färsk är datan och hur ofta uppdateras den?Gammal data kan vara felaktig för vissa användningsfall och ge en felaktig bild av verkligheten.
Fullständighet & täckningVad ingår, vad saknas?Luckor kan snedvrida resultat och man förlorar spårbarhet.
KonsistensFinns det motsägelser mellan källor eller över tid?Inkonsekvenser undergräver förtroendet.
Noggrannhet & precisionBias: hur långt från det sanna värdet i genomsnitt. Precision: hur mycket upprepade värden varierar.Avgör hur nära "sanningen" din modell fungerar.
UpplösningTillräckligt många mätpunkter för att fånga dynamiken i variabeln?Låg upplösning döljer toppar och fluktuationer.
Härkomst & ursprungVar kom datan från och hur transformerades den?Behövs för förtroende, revisioner och felsökning.
TolkningsbarhetÄr betydelse, enheter och kontext tydliga?Förhindrar feltolkning och missbruk.

Ingen datamängd är stark på alla områden. Det viktiga är att veta var den är stark och var den är svag.

När kvaliteten inte räcker - agera stegvis

  • Begränsa eller omformulera beslutet/frågan.
  • Lägg till enkla kontroller vid inmatning och bearbetning.
  • Skapa återkoppling till de som producerar datan.
  • Sätt in mänsklig kontroll där det har störst påverkan.
  • Komplettera eller dubbelkolla med externa källor.
  • Följ enkla förbättringsmått och höj kraven över tid.

När "perfekt" är fienden

Exempel: Patientinläggningar på ett sjukhus.

Tänk dig att du tittar på patientinläggningar på ett sjukhus. Datan kan vara ofullständig (inte alla kliniker rapporterar korrekt), och upplösningen kan vara låg (bara dagliga summor, inte timvisa). Samtidigt kan datan vara ganska tillförlitlig (de siffror som finns är konsekventa) och aktuell (uppdateras varje dag).

Även om den inte är perfekt kan denna kombination vara användbar. Dagliga summor räcker för att se om efterfrågan på sjukhusvård ökar eller minskar över veckor och månader. Du kanske inte har detaljerna för att planera bemanning timme för timme, men du kan ändå fatta välgrundade beslut om att utöka kapaciteten eller flytta resurser mellan avdelningar.

Samtidigt säger denna typ av data inget om topplast. Om du bara ser dagliga summor kan du inte avgöra om de flesta patienter kommer på morgonen, under natten eller alla på en gång efter en lokal händelse. Att använda sådan data för att schemalägga skift eller hantera akutberedskap skulle vara riskabelt.

Viktigaste insikten: Ofullkomlig data kan ändå stödja välgrundade beslut. Bara använd den inte för saker den inte kan svara på.

Sammanfattning

Datakvalitet är sällan perfekt, och det behöver den inte vara. Se det som olika egenskaper att balansera. Målet är inte att jaga perfektion utan att fatta beslut med öppna ögon — använda den data ni har, medan ni kontinuerligt förbättrar den.