Datakvalitet

Utforskande visualisering av vårdens utbud

En bild kan säga både mer och mindre än tusen ord. Insikten en förklarande bild kan ge är säkert ofta mycket lättare att komma ihåg än ett långt sjok med text. En stor fördel med bilder är om de kan vara lite mer självförklarande, eller på något mer effektivt vis sätta något i ett sammanhang som vore svårt med text då text är svårare att utforska, eller gruppera sina intryck på egen hand. Här kommer lite bilder som illustrerar svenskt vårdutbud enligt en datakälla jag inspekterat.

Avbilda något för att förklara det rent visuellt

Att människor sedan väldigt länge jobbat med bilder för att beskriva något upptäckte jag för tio år sedan när jag köpte Edward Tuftes bok Beautiful Evidence. Jag hade fastnat för att Tufte stuckit ut hakan och lyckats bevisa att åskådare av en Powerpoint-presentation — på tok för ofta — blev dummare på grund av presentationen än de varit om de missat det hela. Där kände jag igen mig. Inte sällan hade jag suttit och förtvivlat försökt förstå presentationer där antingen jag var korkad eller presentatören inte kunde något om presentationsteknik. Ibland berodde det säkert på mig, men här var någon som hade forskat på _hur_ man borde presentera något så att det nådde fram.

Leonardo da Vinci illustration Vitruvian Man
Da Vinci illustrerade människan genom den Vitruvianske mannen.

Boken är underbar, och Tufte har ett gäng andra böcker som säkert kan vara av intresse. Inte heller saknas det filmade föreläsningar för dig som är nyfiken.

Det visar sig att den typen av grafisk visualisering, ibland kallad informationsgrafik, som vi idag tänker oss den har rötter i hur den tidiga vetenskapen försökte illustrera abstrakta koncept. En känd sådan du säkert sett är Leonardo da Vincis visualisering av människokroppens dimensioner, den så kallade vitruvianske mannen. Denna illustration gjordes i slutet på 1400-talet och visar på att en människas längd är ungefärligen densamma som sträckan mellan fingertopparna.

Andra tidiga visualiseringar många av oss säkert sett, eller moderna varianter av dem, är allt som har med astronomi att göra. Den medeltida astronomen Galileo Galilei var tidigt ute med att visa på relationen mellan himlakroppar och att relatera högst synliga händelser på himlen med hur det hela hängde samman.

Visualiseringar försöker besvara frågor

Som Galileo Galilei fick erfara är det inte helt riskfritt att ha gott om bevis för något. Den katolska kyrkan uppskattade inte alltid hans fynd om sakernas tillstånd. Att utöver i skrift också med bild kunna visa det hela även för de som inte orkade eller kunde läsa hjälpte nog inte hans sak. Placerar man solen i mitten och planeterna i banor runt solen framgår det med all tydlighet vad det handlar om, i alla fall om visualiseringen är välgjord.

Att visualisera något är helt enkelt inte så neutralt som man kanske kan tro. Det man visar tolkas av mottagarna utifrån deras kulturella sammanhang, och kultur är som vi vet mångfacetterad även inom ett land. Men det finns också ett bias hos den som väljer vad som ska visualiseras. Visualiseringen är aldrig mer sann än den datakälla man utgått från. Med andra ord behöver betraktaren uppvisa någon form av källkritik utöver nyfikenheten att lära sig något nytt, och avsändaren behöver klargöra hur det hela sammanställts.

Hur ser svenskt vårdutbud ut?

Jag kan förstås inte så här lite snabbt sammanställa något som motsvarar det giganter som Da Vinci och Galilei hade som sina livsverk. Men jag tänkte i alla fall visa på en metod för utforskande där man söker en förklarande bild som ligger dold inom en öppen datakälla, en datakälla som med text beskriver svensk sjukvård. Innan man kommer fram till något som liknar en sanning behöver man skaffa sig en bild av den data man samlat in. Visualisering är nämligen inte bara ett enkelt sätt att visa något för andra, det är klockrent när man utforskar något. Visualisering hjälper oss att bedöma innehållet i en datakälla, om den är trovärdig, vilka brister som kanske finns och om det trots eventuella brister finns något användbart där för det man är ute efter.

Länken till datakällan jag använt hittar du i slutet av inlägget. Det handlar om offentliga data från HSA-katalogen, något jag hämtat från det som förr hette Mina Vårdkontakter. Där finns såväl diverse mottagningar och det serviceutbud som har med vården att göra. Exempelvis sjukhus, men också annan form av service som finns inom dessa lokaler.

”HSA är en elektronisk katalog som innehåller kvalitetssäkrade uppgifter om personer, funktioner och enheter i Sveriges kommuner, landsting och privata vårdgivare.”
Inera

Man kan anta att på stora sjukhus finns fler mottagningar än på små sjukhus, så det påverkar förstås, samt att jag förstått det som att vissa vårdverksamheter valt att inte vara med i denna publikt tillgängliga lista. Så nedan visualiseringar är inget att fatta avgörande beslut på, däremot ger de en bild av något som annars är en jättelång lista med diverse fakta om vårdmottagningar, närmare bestämt drygt sextusen.

Människor är bra på att se mönster. De flesta av oss är desto sämre på att ögna igenom kilometervis med fakta och känna oss klokare efteråt. Detta är alltså en geografisk och visuell inspektion av en datakälla.

Var bedrivs vård?

Datakvalitet
Troligen finns det brister kring datakällans kvalitet när det gäller geoposition.

Med tanke på att det finns 6006 platser som ofta säkert matats in manuellt är det inte undra på att några felaktigheter smugit sig in. Att visualisera är ett bra sätt att utforska en datakälla, här exempelvis genom att skaffa sig en uppfattning om hur bra datakvaliteten är. Hur rimligt är det att svensk sjukvård erbjuds i havet utanför Västsahara?

Inom geodata märker man ofta att kartor centreras till, eller visar att något finns, en bit ut i havet väster om centralafrika. Det beror på att om man anger en plats geografiska koordinater som ”0” i både latitud och longitud är det den punkten som anges.

Vem bedriver vården? Staten, landsting, privat?

Vem bedriver svensk vård?
Det är en mix av ett flertal olika aktörer som bedriver svensk vård.

Här får man också anledning att på nytt fundera över vad som finns i datakällan. Det är lite märkligt att ”kommun” finns med som alternativ då det nästan aldrig visas. Bara det att man inte kan se de 290 kommunernas utbredning i orange gör att man inte ska dra några långtgående slutsatser kring kommunalt vårdutbud från just denna datakälla. Sen att det är massor med blå platser kan vara en ledtråd till hur man filtrerar bort bland annat kiosker och frisörer på sjukhusområden?

Vad är det för typ av verksamhet?

Akut verksamhet
Följande platser har positioner som erbjuder någon form av verksamhet som enligt dess kod är akut. Det betyder inte att det är en akutmottagning, det kan också vara en primärvårdsjour.

Det märks tydligt att man benämner sin verksamhet på olika sätt i Sverige. Det finns något som kallas verksamhetskod inom HSA. Avgränsar jag till Västra Götalandsregionens område och plockar fram allt som innehåller ordet ”akut” får jag fram ovanstående bild. Det är allt från akutmottagningar, till akutverksamheter på sjukhusområden till primärvårdens mottagningar för akut smärta eller jourmottagningar.

Vissa av dessa koder verkar inte användas inom andra landsting, eller att de har en annan variant av namn. Det är förstås svårt att uppnå standardisering över landstingsgränserna när man har en decentraliserad administration av dessa uppgifter.

Finns det mönster bland avvikelserna?

Utforska avvikelserna
Vad hittar man bland det som saknar verksamhetskod?

Genom att filtrera bort allt som har en verksamhetskod kan man kolla vad allt det där okända består av. Det finns en hel del att inspektera, så jag avgränsade mig till Göteborg. Det visar sig att beroendevården, bedömningar om man ska återfå körkort, ambulansverksamhet, utbildning och en hel del annat gömde sig här. Beroende på vad man är ute efter blir man på detta sätt medveten om eventuella manuella insatser som krävs för att förbättra datakällans kategorisering inför att man ska visa upp det i något viktigt sammanhang. Eller möjligen om man har större nytta av att filtrera bort dessa uppgifter.

Att visa genomsnitt

Genomsnittliga positionen för en vårdmottagning
Den genomsnittliga platsen för svenskt vårdutbud är mellan Örebro och Norrköping.

Att använda genomsnitt är inte alltid så meningsfullt som man kan tro. Men när man utforskar något kan det ändå vara intressant. Problemet med att visa genomsnitt är bland annat att det inte alltid är baserat på representativ data. När det gäller den svenska geografin kanske ovanstående bild behöver kompletteras med medelpunkten för befolkningstätheten för att man ska ha något vettigt att jämföra med, men det förutsätter att det finns en koppling mellan vårdmottagningarna, deras placering och var folk bor någonstans. Som du märker har vi en kedja av antaganden som kanske inte stämmer.

Slutsatsen är att det finns utrymme till förbättring av denna datakällas kvalitet. Det kan visa sig vara svårt att basera sina beslut ens på mindre datamängder som dessa innan man vet vilka brister de har. Då ska vi inte tala om utmaningen att veta omfattningen av bristerna i datakällorna i det så hypade begreppet big data.

Ladda ner data bakom denna visualisering

Nedan prylar kan kräva en del teknisk kompetens, men är säkert överkomligt för många.

Annonser

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s