RDF grundguide del 3: SPARQL förfrågningar av kunskapsgrafer och dataset med semantisk innebörd

Resource Description Framework (RDF) är en öppen standard från W3C för att beskriva koncept och resurser digitalt med semantisk innebörd. SPARQL standarden är en syntax och protokoll för att göra förfrågningar och manipulering av dataset i RDF format. Standarden är omfattande och innehåller allt från sök, uppdatering, exportering, underhåll av dataset och kan jämföras med SQL standarden för relationsdatabaser. Skillnaden att SPARQL tillämpas på grafer och dataset med tripletter mönster – subjekt, predikat, objekt och möjliggör semantisk innebörd. Guiden utgår ifrån kunskapsgrafen från föregående artikel.

Fortsätt läsa ”RDF grundguide del 3: SPARQL förfrågningar av kunskapsgrafer och dataset med semantisk innebörd”

RDF grundguide del 2: Skapa ontologier och kunskapsgrafer med RDF-Schema

Resource Description Framework (RDF) är en öppen standard från W3C för att beskriva koncept och resurser digitalt med semantisk innebörd. Data som beskrivs med RDF format kan utbytas och vidarenyttjas med bibehållen begreppsförståelse för koncept mellan verksamheter, branscher och länder. Detta är den andra artikeln i en serie som går igenom grunderna för beskriva digitala resurser med semantisk innebörd. Modellen i artikeln länkar samman definitioner av resurser från Wikidata (Wikipedia) för att relatera till likvärdiga koncept för att skapa kontext. Föregående artikel beskriver hur klasser och attribut definieras med RDF-Schema (RDFS).

Fortsätt läsa ”RDF grundguide del 2: Skapa ontologier och kunskapsgrafer med RDF-Schema”

RDF grundguide del 1: Definition av klasser och attribut med RDF-Schema

Resource Description Framework (RDF) är en öppen standard av W3C för att beskriva digitala resurser med semantisk innebörd. Data som beskrivs med RDF format kan utbytas och vidarenyttjas med bibehållen begreppsförståelse för resurser mellan verksamheter, branscher och länder. Detta är den första artikel i en serie av guider för att komma igång med att beskriva data med semantisk betydelse. Den första artikeln beskriver hur koncept med tillhörande attribut definieras med RDF-Schema.

Fortsätt läsa ”RDF grundguide del 1: Definition av klasser och attribut med RDF-Schema”

Delaktighet och styrning för hållbar digital utveckling

Dagens vattenfall betonade kravställning och upphandling leder till långa ledtider och höga kostnader för alla inblandade. Upphandling av komplexa IT-system blir beroende av krav som kan var svåra att formulera eller procedurer som är komplicerade att följa. Region Stockholm fick avbryta upphandling av nytt vårdsystem för 2.2 miljarder eftersom kraven var tvetydigt formulerade. I Västra Götaland fick upphandlingen av vårdsystem göras om eftersom endast ett bolag lyckats fylla i all formalia korrekt. Det behövs ett paradigmskifte av styrning och upphandlingspraxis för att öppna upp för delaktighet i digitala värdenätverk och värdekedjor för att möjliggöra hållbar digital utveckling inom offentlig sektor. Detta eftersom ingen IT-leverantör eller offentlig verksamhet ensamt kan hålla jämna steg med den digitala utvecklingen.

Fortsätt läsa ”Delaktighet och styrning för hållbar digital utveckling”

Lägesbild länkad data och semantisk webb

Resourcedescription framework (RDF) är ett tekniskt ramverk för enhetligt datautbyte och förståelse av begrepp som publiceras på webben. Detta brukade benämnas semantisk webb, vilket aldrig blev en verklighet. Nu nästa 20 år efter lanseringen verkar intresset öka kring teknologin för att ta itu med problematik det digitaliserade samhället står inför.

Fortsätt läsa ”Lägesbild länkad data och semantisk webb”

Interoperabilitet för digital resurser och infrastruktur – Digitalt värdeskapande del 1

Nyligen avslutad studie undersökte tågoperatörers perspektiv av vad som genererar mervärde och utgör hinder inom partnerskapet med Trafikverket för data och informationsutbyte. Den första mekanismen för digitalt värdeskapande av tre, belyser interoperabilitet för digitala resurser och infrastruktur.

Fortsätt läsa ”Interoperabilitet för digital resurser och infrastruktur – Digitalt värdeskapande del 1”

Resultat och diskussion

innehållsförteckning

Globala teman – sammanfattning

I denna del presenteras globala teman och övergripande värdeskapande mekanismer som identifierats i undersökningen. Detaljer och citat kopplade till varje globalt tema finns på respektive resultatsida.

Interoperabilitet

Temat återspeglar behovet av IT-infrastruktur som gör det möjligt att dela, kombinera och vidareutnyttja digitala resurser på ett standardiserat tillvägagångssätt. Interoperabilitet innefattar en flexibel IT-infrastruktur som gör det möjligt att sömlöst utbyta och kombinera digitala resurser mellan samarbetspartner utan anpassning. I undersökningen beskriver avtalskunderna en brist på interoperabilitet i form av att IT-infrastrukturen och IT-stödet som används inom samarbetet är fragmenterad. Detta påverkar informationsutbyte i allt från hantering av trafikavvikelser till strategisk planering och resurstilldelning av järnvägsinfrastruktur.

Exempelvis kan många av IT-stöden som används inom partnerskapet inte utbyta och återanvända grundläggande data och information med varandra utan anpassning. Detta medför att samarbetspartnerna måste manuellt kopiera, ringa eller skicka e-post för att skaffa sig informationsunderlaget som behövs för att hantera tidskritiska situationer såsom trafikavvikelser.

En av orsakerna bakom bristen på interoperabilitet beskrivs vara för stort fokus på upphandling av stora IT-lösningar som bidragit till att fragmentera IT-infrastrukturen och IT-stödet. Detta är ett återkommande tema som påverkar olika delar av samarbetet där avtalskunderna upplever att interna verksamhetsområden på Trafikverket utvecklar och driver olika förändringsprojekt utan att se till helheten och behovet av en mer flexibel och interoperabel digital infrastruktur. För att motverka ökad fragmentering och skapande av informationssilor som oftast sker vid införande av stora IT-lösningar.

Avtalskunderna ser det som betydelsefullt att tillgängliggöra grunddata i större uträckning än i dagsläget i kombination med tillämpning av goda designprinciper för att skapa interoperabilitet. För att uppnå digitaliseringens potential behövs digitala resurser tillgängliggöras i större utsträckning som i sin tur kan återanvändas för att skapa värdefulla tjänster. Exempelvis efterfrågas tillgång på historisk och aktuell tågförsenings- och underhållsstatus, flaskhalsar, hastighet, tillfälliga hastighetsbegränsningar et cetera. Detta för att bättre predicera trafikflödet och kunna använda data i digitala tjänster för att ge resenärer bättre förutsättningar att välja det bästa resealternativet för tillfället.

För att göra svåröverskådliga processer, begrepp och informationsstrukturer mer tillgängliga efterfrågas standardisering och tillgängliggörande av begreppsmodeller. Avtalskunderna beskriver att de får lägga tid på att tolka begrepp och härleda fragment av information för att sätta dem i kontext i verksamheten eftersom det inte finns några enhetliga begreppsmodeller tillgängliga.

Öppen källkod och standarder bidrar till skapandet av interoperabilitet och flexibel IT-infrastruktur. Detta bland annat genom att mjukvarukomponenter designas för att användas för olika ändamål och bygger på öppna standarder. Vidare möjliggör det större delaktighet av aktörer inom och utanför transportbranschen eftersom etablerade standarder och mjukvarukomponenter återanvänds. Exempelvis beskriver de avtalskunder som byggt upp mycket av IT-infrastrukturen på öppen källkod och standarder att det medfört enklare och snabbare integrering mot nya underleverantörer, samt gjort det enklare att tillgängliggöra öppna data.

Läs om interoperabilitet och begreppsmodeller för återanvändning av digitala resurser och hur öppen källkod och standarder bidrar till lösningar på gemensamma utmaningar och digitalisering av samhället.

Bilden visar vilka organiserande och grundläggande teman som ingår i det globala temat.

Interoperabilitet

Kongruenta strukturer

Kongruenta strukturer syftar på hur väl verksamheten är organiserad för att samarbeta och skapa mervärde i samarbete med andra aktörer. Hur verksamheten är organiserad och strukturerad redogörs bland annat i strategidokument, organisationsindelning, direktiv, processkartor et cetera. För att underlätta värdeskapandet behöver samarbetande verksamheter ha överensstämmande strukturer för att snabbt och effektivt kunna genomföra beslutsprocesser, förändringsprojekt, absorbera och överföra kunskap för att vara konkurrenskraftiga.

En betydelsefull struktur som identifierats i studien är behovet av systematisk och transparent informationshantering för att fatta beslut inom partnerskapet. När det inte finns överensstämmande strukturer för informationshantering skapar det hinder och försvårar samarbetet. Exempelvis beskriver avtalskunderna otillräckliga strukturer för utbyte av information och lägesbilder vid trafikavvikelser. Problemet som tas upp är bland annat att generella informationskanaler såsom e-post, chatt och telefon används i stor utsträckning, vilket resulterar i att information blir ostrukturerad och svår att återanvända för olika ändamål.

Avsaknaden av systematiserad hantering bidrar till informationsöverflöd vilket försvårar koordination av trafikavvikelser eftersom all informationen sprids till alla aktörer oavsett om det är relevant för deras situation eller inte. För att komma till rätta med problemet efterfrågas bland annat bättre strukturer för arbeta med scenario- och behovsbaserat informationsutbyte. Systematiseringen av informationshantering innefattar även tillvaratagandet av återkoppling och feedback från avtalskunder för operativa och strategiska frågor. Detta ses som betydelsefullt för att arbeta med kontinuerligt kvalitetshöjande åtgärder och prioritera frågeställningar som är viktiga inom samarbetet.

En annan struktur som identifierats är mötesforum för att hantera intressefrågor och koordinera samarbetet. Inom samarbetet finns olika mötesforum för att hantera såväl praktiska som strategiska frågor. För vissa av forumen finns det ett bristande intresse att delta, bland annat på grund av att frågorna som hanteras är för generella och deltagarna upplever att deras intressefrågor inte prioriteras i tillräckligt stor utsträckning. För att öka intresset behövs till exempel tydligare målsättning och avgränsning av frågor som forumen hanterar. Dessutom behöver ansvariga för forumen säkerställa att de personer som deltar har rätt förkunskaper för att säkerställa mötenas produktivitet.

Behov att anpassa verksamheten eller den del av verksamheten som samarbetar med vissa typer av aktörer avspeglar sig i att några avtalskunder skapat specifika strukturer för att samarbeta med tjänsteutvecklare och tredjepartsaktörer på armlängds avstånd. För att underlätta kommunikationen med denna aktörsgrupp har de skapat specifika kontaktytor för att hantera samarbetet. Exempel på strukturer som används är digitala portaler för att tillhandahålla dokumentation, vanliga frågor och svar, systemgränssnitt, möteskalendrar, användarforum med mera. Exempelvis tillhandahåller några av avtalskunderna strukturer för att uppmuntra till utveckling av tredjepartstjänster genom att tillhandahålla portaler och arrangera återkommande möten för tjänsteutvecklare. Avtalskunder som skapat dessa strukturer har också en uttalad strategi att samarbeta med tredjepartsaktörer och tillhandahålla data och information för att marknaden skall bidra till att utveckla tjänster inom branschområdet.

Bilden visar vilka organiserade och grundläggande teman som ingår i det globala temat.

Kongruenta strukturer

Synergiskapande förmågor

Detta tema belyser behovet av god insikt i samarbetspartners verksamheter för att förena gemensamma mål och nyttja varandras resurser på ett sätt som ger upphov till synergier. Parten som leder och koordinerar samarbete behöver bland annat besitta förmåga att förutse kommande behov inom samarbetet. För detta krävs kontinuerlig uppdatering av parternas behov och målbild, och beskrivs av avtalskunder som fingertoppskänsla.

Denna fingertoppskänsla sägs variera mellan olika enheter och projekt på Trafikverket. Exempelvis refererar avtalskunderna till ett stort förändringsprojekt inom kapacitetsplanering, som enligt den ursprungliga kravspecifikationen skulle leda till att viktiga processer och integrationer skulle sluta fungera. Tack vare avtalskundernas krav på delaktighet i projektet skapades en fördjupad insikt av varandras behov och målbilder, vilket i sin tur möjliggjorde ömsesidiga mervärden genom att interna och gränsöverskridande processer kunde skärskådas och harmoniseras mellan parterna.

En grundläggande del av att skapa synergi är förmågan att skapa en överensstämmande problem- och målbild för att minimera tvetydigheter kring målsättningar. Detta är viktigt internt i verksamheten och mellan samarbetspartner. Brist på denna förmåga kan skapa osäkerhet otydlighet kring målbilden och vem som har mandat att fatta beslut i frågan. Exempelvis beskriver en avtalskund att de fått stötta projektorganisation inför ledningen när det funnits interna motsättningar på Trafikverket om målbilden för ett förändringsprojekt.

Synergier uppstår också när verksamheten besitter förmåga att förena ny teknologi med verksamhetsmål. Detta genom att utnyttja de egenskaper teknologin erbjuder och utnyttja dom för att uppnå verksamhetsmål. Synergieffekter kan också skapas inom samarbete om parterna kan dra fördelar av teknologin och integrera den i verksamheten. Detta förutsätter att parterna har kunskap om teknologin och förmåga att implementera den i sin egen verksamhet. Avtalskunder ser det som betydelsefullt att utnyttja de egenskaper som ny teknologi erbjuder och tillämpa nya tankemönster för att hålla jämna steg med den digitala utvecklingen.

För att inhämta kunskap om nya teknologier uttrycker avtalskunder behovet av förmågan att samarbeta med tjänsteutvecklare och tredjepartsaktörer utanför partnerskapet. Detta kan ge upphov till mervärden eftersom tredjepartsaktörer tillför värdefulla tjänster och kundfokus till branschen. Samarbetet med dessa aktörer kräver andra förmågor eftersom dessa aktörer verkar utifrån andra förutsättningar och mycket av interaktion sker mer på armlängds avstånd i förhållande till samarbetet med avtalskunder.

De avtalskunder som upparbetat denna förmåga ser det som strategisk viktigt att själva ha kontroll över utvecklingen av kontaktytan med tredjepartsaktörer för att snabbt kunna anpassa den efter externa behovet. Förmågan att samverka med tredjepartsaktörer har kopplingar till det tidigare globala temat om att tillhandahålla överensstämmande strukturer för att samarbeta med olika typer av aktörer. I fallet med tredjepartsaktörer kan strukturer såsom ett användar-community och hackathons för att underlätta kunskapsöverföring, utbyte av idéer och skapa möjligheter att testa tillfälliga samarbeten.

Bilden visar vilka organiserade och grundläggande teman som ingår i det globala temat.

Diskussion

Det finns få studier som undersökt värdeskapande mekanismer i samarbete mellan företag och myndighet genom att betrakta hur konkurrensfördelar uppstår utifrån ett IT-perspektiv. Förhoppningen är att studien kan bidra till förståelsen om vilka mekanismer som är centrala för att skapa mervärde inom i strategiska samarbeten mellan offentlig och privat sektor från ett IT-perspektiv. Samt öka medvetenheten om faktorer som är viktiga för att lyckas digitalisera branscher där offentliga organisationer och företag behöver samarbeta. Avtalskunder som ingått partnerskap med Trafikverket är beroende av myndighetens resurser, strukturer och förmågor för att erbjuda konkurrenskraftiga tjänster på en avreglerad transportmarknad. Förhållningssättet efterliknar en marknadssituation där aktörer ingår i en värdekedja med andra aktörer och där kringliggande marknadsförhållanden påverkar verksamheternas möjligheter att tillhandahålla konkurrenskraftiga tjänster12.

Värdekedjan används som utgångspunkt för att betrakta hur resurser används och förädlas av samarbetande aktörer med ett övergripande mål att tillhandahålla konkurrenskraftiga tjänster. Avtalskunderna i studien använder tillgängliga resurser inom partnerskapet i kombination med egna för skapa transporttjänster. På samma sätt är tredjepartsaktörer beroende av aktörerna som ingår i värdekedjan för att skapa tjänster med hjälp av resurser som tillgängliggörs på digitala plattformar. I båda fallen är det ett medvetet och strategiskt beslut att använda de resurser som finns tillgängliga och därigenom skapas beroenden mellan aktörerna i form av en värdekedja.

Skillnaden är att avtalskunder samarbetar mer kollaborativt och närmare varandra för att integrera processer och rutiner. Avtalskunder har också ett mer formaliserat samarbete med flera gemensamma målsättningar och behov än vad som är vanligt i samarbetet med tredjepartsaktörer som sker på armlängds avstånd. Även om det finns andra skillnader framhäver studien att båda samarbetsformerna är strategiska där parterna behöver använda varandras resurser och förmågor för att skapa och erbjuda tjänster. Liknande klassificering har gjorts i andra studier som undersökt hur digitala resurser kombineras över organisationsgränserna och ger upphov till mervärde i olika former av strategiska samarbeten3.

Tidigare studie som undersökt tredjepartsaktörers möjligheter att skapa konkurrenskraftiga tjänster visar att de är beroende av beslut som Trafikverket fattar gällande tillhandahållande av öppna data

4

. Tredjepartsaktörers i undersökningen beskriver att det inte är tillräckligt med enbart öppna data, utan de behöver även insikt om kommande förändringar och beslut som påverka deras möjligheter att tillhandahålla tjänster inom transportmarknaden. Liknande beroenden har dokumenterats i studier där aktörer är beroende av förändringar, beslut och resurser som finns tillgängliga inom samarbete för att skapa konkurrenskraftighet5.

Synergiskapande förmågor syftar på möjligheten att tillämpa och dra nytta av nya teknologiska paradigm och tankemönster för att uppnå större synergieffekter med hjälp av informations teknologi. Detta innefattar förmågan att upptäcka hur egenskaper av ny teknologi kan tillämpas i verksamheten och ge upphov till värdefulla digitala resurser genom att nyttja potentialen ny teknologi erbjuder. Enligt studier realiseras synergier och ger upphov till konkurrensfördelar först när IT integreras med övriga resurser och harmoniseras med verksamhets strategiska målsättningar 6.

Förmåga att skapa synergier har paralleller med de förmågor som Wade & Hulland beskriver som gränsöverskridande – spanning capabilities7, som är förmågan att länka samarbetsparternas kravställning med interna mål. Författarna menar också att verksamheten behöver besitta förmåga att uppfatta externa behov från marknaden för att anpassa interna målsättningar och strategier för skapa synergier och konkurrenskraft. Denna förmåga beskrivs Wade & Hulland som externa IT-förmågor – ouside-in capabilities.

Kongruenta strukturer faciliterar kunskapsöverföring och möjliggör informationsutbyte för att koordinera gemensamma projekt. Detta betyder att samarbetspartnerna behöver någorlunda likvärdiga och matchande strukturer för att överföra kunskap och hitta utvecklingsmöjligheter för att vara konkurrenskraftiga. Detta överensstämmer med relationsbevarande struktur8 från tidigare studier som beskriver behovet av kompatibla strukturer som gränsöverskridande IT-stöd, enhetliga rutiner för informationshantering, personer med rätt kunskap och motivation för att partnerskapet skall generera avkastning. Andra studier har visat att närhet av bransch, teknologi och förändringstakt gör det mer troligt att aktörer delar mål, förutsättningar, förmågor och strukturer för att upprätthålla konkurrenskraftighet inom branschområdet9. Behovet av kompatibla strukturer för att samarbete visar sig i studien genom att några avtalskunder har skapat specifika kontaktytor i form av användarportal och API-plattform för att dela digitala resurser med tredjepartsaktörer på armlängds avstånd10.

Interoperabilitet möjliggör sömlöst utbyte och sammanlänkning av digitala resurser över organisationsgränserna. Interoperabilitet i studien syftar på en flexibel IT-infrastruktur som möjliggör integrering mot nya samarbetspartner utan behov av anpassning tack vara nyttjande av bland annat öppen källkod och standarder. Denna mekanism är betydelsefull för att klara av en ökad förändringstakt och möjliggör samarbete med flera aktörer inom och utanför transportbranschen. Betydelsen av flexibel IT-infrastruktur har kartlagts i tidigare studier för skapa värdefulla och konkurrenskraftiga resurser inom strategiska samarbeten11.

Effekterna av fragmenterad och ej anpassningsbar IT-infrastruktur utgör således ett hinder för att konfigurera om och tillhandahålla efterfrågade digitala resurser inom strategiskt samarbete, vilket också innebär att denna brist även påverkar samarbete på armlängds avstånd. Betydelsen av flexibel IT-infrastruktur och öppna standarder har dokumenterats av Tafti med flera (2013) inom olika typer av strategiskt samarbete. Detta har också identifierats i undersökningen av avtalskunderna och visar på betydelsen av interoperabilitet för att skapa värdeskapande strategiska samarbeten.

Tafti med flera (2013) menar att interoperabel och flexibel IT-infrastruktur har bäst möjligheter att bidra till mervärde inom kollaborativt och nära samarbete än på armlängds avstånd. Detta beror på att kollaborativt samarbete ger större utrymme för att utforska nya möjligheter att länka samman processer och digitala resurser med hjälp av flexibel IT-infrastruktur. Flexibel IT-infrastruktur påstås även skapa värde för samarbete på armlängdsavstånd då parterna kan bibehålla en lös koppling till varandra genom att processer och rutiner inte behöver integreras. Öppna standarder bidrar enligt författarna till värdeskapande inom båda samarbetsformerna, men har störst inverkan i början för att länka samman processer och tillgängliggöra digitala resurser. Denna mekanism sägs vara mindre betydande i mer långsiktiga och kollaborativa samarbeten när parterna kommit över det initiala hindret att integrera processer och resurser sinsemellan.

Undersökningen finner stöd i litteraturen att identifierade värdeskapande mekanismer inom partnerskapet för avtalskunder även har inverkan på tredjepartsaktörer och samarbete på armlängds avstånd. Däremot finns det begränsningar om generaliserbarhet för mekanismernas inverkan på olika typer av samarbetsformer. Det går inte att utläsa i underlaget till studien hur en specifik värdeskapande mekanism påverkar kollaborativt och nära samarbete kontra samarbete på armlängds avstånd. För att bättre förstå hur olika värdeskapande mekanismer inverkar på olika typer av strategiskt samarbete behövs ytterligare studier för att undersöka samspelet mellan olika värdemekanismer och samarbetsformer.

Slutsats

Studien presenterar tre övergripande värdeskapande mekanismer som är betydelsefulla i samarbete mellan offentliga och privata aktörer som verkar på en öppen marknad. Detta är viktigt för offentliga organisationer och myndigheter som samarbetar med privata aktörer att skaffa sig insikt om mekanismer som påverkar deras möjligheter att tillhandahålla konkurrenskraftiga tjänster.

Mekanismerna som identifierats i studien antas vara generaliserbara för andra typer av strategiskt samarbete där aktörer ingår i en värdekedja och är beroende av varandras resurser, förmågor och strukturer för att skapa livskraftiga tjänster. Enligt resonemangen i diskussionsdelen inverkar mekanismerna även på värdeskapandet i samarbete med tredjepartsaktörer som sker på armlängds avstånd. Huvudargumentet baseras på att tredjepartsaktörer som samarbetar på armlängds avstånd också klassificeras som en form av strategiskt samarbete och behöver förhålla sig till andra aktörers resurser, förmågor och strukturer som ingår i värdekedjan.

Däremot finns det begränsningar av mekanismernas betydelse för olika typer av strategiska samarbetsformer och deras relevans för aktörer som inte är beroende av en värdekedja för att skapa konkurrenskraftiga tjänster och produkter. Det behövs ytligare undersökningar för att utreda hur mekanismer som presenteras inverkar på verksamheter som kontrollerar hela värdekedjan själva. Eller inte besitter egna och enbart förmedlar andras digitala resurser och data, exempelvis öppna dataportaler, nätverksforum och liknade aktör.

Tack till

Maria Dackevall och Leena Höiijer för hjälp med genomgång och korrektur av tidiga utkast. Stort tack till Johan Sandberg på Umeå universitet för hjälp i uppstartsfasen av projektet. Extra tack till intervjupersoner som tog sig tid att delta i studien. Samt möjligheten att genomföra projektet metod för samverkan och externt värdeskapande öppna data (FOI:6298).

Interoperabilitet och vidareutnyttjande av digitala resurser

Inledning

Öppna data utgör en interaktionsgräns för delning, utbyte och kombination av digitala resurser mellan offentlig sektor, medborgare, företag och idéburna organisationer. För att öppna data skall bli en viktig resurs som kan användas för att skapa samhällsvärde räcker det inte med vilja och målsättning att tillgängliggöra data direkt från interna IT-system. Arbetet måste vägledas av grundläggande designprinciper som möjliggör delning, utbyte och kombinering av data och information utan behov av integration mellan IT-system för enskilda ändamål. En av dessa grundprinciper är att skapande av interoperabilitet för utbyte, vidareutnyttja och kombinera digital resurser.

Interoperability -Relating to systems, especially of computers or telecommunications, that are capable of working together without being specially configured to do so. Källa: The Free Dictionary

Principer om interoperabilitet berör alla aspekter av hantering av data och information för att motverka fragmenterade och vertikala systemlösningar inom en verksamhet. Bristen på interoperabilitet skapar inte bara hinder för att vidareutnyttja digitala resurser internt, det gör det också kostsamt och tidsödande att integrera mot externa resurser. Flera organisationer lever med fragmenterade och vertikala systemlösningar eftersom beslut om anskaffande av IT-system ofta ensidigt fokuserar på lösningar. Därför är det viktigt att offentliga organisationer och myndigheter säkerställer interoperabilitet så att digitala resurser kan vidareutnyttja internt, externt och för olika ändamål och verksamheter.

Genom att förädla, sammanställa och på andra sätt använda information kan olika aktörer skapa nya kommersiella och ideella tjänster och därmed ge förutsättningar för samhället att tillgodogöra sig det värde informationen kan ha när den används för andra ändamål än myndighetens egen verksamhet. – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 22)

Principer som gör det möjligt att vidareutnyttja och kombinera digitala resurser med varandra behöver genomsyra alla systemlösningar i en verksamhet. En central princip för att möjliggöra interoperabilitet är att nyttja öppen källkod. Varför detta är viktigt finns att läsa om på sidan om öppen källkod och standard. För att det ska ske en förändring behövs det en attitydförändring och kunskap om öppen källkods fördelar för de som utformar upphandling och avtal inom offentliga organisationer. Om offentliga medel i större utsträckning investerades i öppen källkod och standarder kan flera organisationer få tillgång till viktig IT-infrastruktur som möjliggör effektivisering genom att digitala resurser kan vidareutnyttjas och kombineras över organisationsgränserna.

Innovationsupphandling och innovationspartnerskap är i sammanhanget viktiga verktyg liksom medveten användning av lösningar av öppen källkod, standarder och testbäddar. – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 25)

Förutom designprinciper behövs det ledarskap inom offentlig sektor med kompetens om vad som krävs för att utveckla IT-infrastruktur och tillgängliggöra digitala resurser som kan vidareutnyttjas för olika ändamål för att införliva digitaliseringens potential.

För de statliga myndigheterna bör behovet av strategisk digital kompetens beaktas vid förordnande av ledamöter i myndighetsstyrelser, nämnder och insynsråd – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 15)

För att göra data ändamålsenlig för fler tillämpningsområden behövs strategier som nyttjas inom hela verksamheten för hur data lagras, hanteras och struktureras. Dessa designprinciper behöver ingå i direktiv som beslutas av ledningen för att visa på betydelsen av att nyttja goda designprinciper och praxis för hantering av data så den kan vidareutnyttjas horisontellt inom offentlig sektor, företag, sociala och idéburna organisationer. Detta innebär att data behöver vara enkel att läsas och tolkas av maskiner, enkel att hitta, lätt att kombinera med annan data genom öppna standarder och format.

Offentlig sektor bör även bli bättre på att återanvända sin egen data, inom och mellan myndigheter, på ett sätt som möjliggör nya tjänster och ökad flexibilitet i kontakten med människor och företag, exempelvis med hjälp av artificiell intelligens. – Regeringens digitaliseringsstrategi (N2017/03643/D, sida 22-23)

Data som strategisk resurs

Som nämndes i inledningen ger öppna data möjligheten att samarbeta över organisationsgränser med andra aktörer för att dela och kombinera digitala resurser. Om öppna data inte hanteras som en strategisk resurs finns det risk att frågan inte prioriteras och arbetet kring att tillhandahålla data styrs av tillfälliga insatser. Om det inte finns nationella målsättningar att tillgängliggöra samhällsviktig data, kan insatser att öppna upp data istället styras av det som är tekniskt enkelt att tillhandahålla eller vara mindre politisk känsligt. Detta kan leda till att den fulla potentialen av digitaliseringen inte infrias och att resurser går förlorade. Därför behövs digitala resurser ses en strategisk viktig resurs oavsett om det skall användas internt eller tillgängliggöras för externa användare. Annars kan detta få stora implikationer, vilket vi såg när Transportstyrelsen outsourcade sin IT-infrastruktur som hanterade samhällsviktig data.

Dataformat och metadata

Beslut om vilka format som skall användas för att tillgängliggöra data behöver insikt och kännedom om vad som är ändamålsenligt för det tilltänkta användningsområdet. Det finns många olika dataformat med olika för och nackdelar, och det finns inget optimalt format som passar för allt. Däremot finns det format som både är maskinläsbara och enkla att läsa för människor som dessutom har utmärkt stöd för metadata, som exempelvis JSON och XML. Båda formaten är öppna och har en hieratisk struktur, det vill säga att data kan kategoriseras i olika nivåer och undergrupper – vilket gör det enkelt för användaren att transformerar mellan formaten beroende på vilket som passar bäst. JSON och XML har stöd för metadataschema vilket möjliggör beskrivning av objekt, datatyper för attribut och validering av möjliga värden. Metadataschema gör livet mycket lättare för utvecklare som vill vidareutnyttja data utan att behöva tolka och gissa vilka datatyper och värden som är rimliga. Länken visar ett exempel på hur ett schema ser ut för ett XML-schema. JSON och XML är anpassningsbara format och utgör grunden för de flesta standarder som används på nätet. Dessutom har de flesta webb och programmeringsmiljöer utmärkt stöd för att hantera och behandla data som tillgängliggörs i JSON och XML.

Metadata är lika viktigt som data om det det skall användas av andra än dig själv eftersom det beskriver för användare vilka egenskaper, struktur och hur det skall tolkas. För att göra en liknelse, föreställ dig att du är intresserad av en bil som står parkerad utanför en bilförsäljare, men som saknar information angående pris, miltal, årtal, bensin/diesel- och annan viktig fakta angående bilens beskaffenhet. Avsaknaden av fakta kring bilens egenskaper kommer antagligen göra att du som spekulant tappar intresse eftersom bilförsäljaren verkar oseriös. En rapport från European Data Portal (2016) visar att endast 26 procent av öppen data i Sverige tillgängliggörs i maskinläsbara format som JSON och XML. Att så mycket data och information tillgängliggörs i format som inte är läsbara av maskiner betyder att mycket tid och resurser går förlorade eftersom användare inte enkelt kan vidareutnyttja, kombinera och länka det men annan data.

Käll: European Data Portal – Sweden Overview (2016)

Att tillgängliggöra data utan metadata kommer begränsa vidareutnyttjande och möjligheten att kombinera det med annan data. Kommaseparerade filer (CVS) är ett öppet maskinläsbart format, men saknar möjligheten att definiera metadata och lämnar över ansvaret att tyda, transformera och validera data till användaren. Detta gör formatet mindre användbart för användare som behöver kombinera många olika datakällor. Bra metadata definitioner erbjuder alla användare stöd oavsett om man är bekanta med datasetet eller inte. Tabellen visar på vanliga dataformat och stöd för metadata definition.

FormatMetadata stödBeskrivning
ZIP (komprimerad fil)IngetInget stöd för metadata.
CSV (kommaseparerad fil)IngetInget stöd för metadata, första raden kan innehålla namn på kolumn
PDFBegränsatMetadata om skapare och datum.
Kalkylark (Excel)BegränsatMetadata om skapare, datum, format och datatyper. För att extrahera metadata behövs specialprogram eller moduler. Metadata är inte en naturlig del och formatet är proprietärt
JPG, PNGFullgottMetadata om skapare, datum, licensregler, geografisk plats, samt kamerainställningar med mera
JSON, XMLFulländatMetadata strukturer för beskrivning av, ägare, datum, tidszoner, komplexa datatyper och validering av tillåtna värden. Formaten innehåller metadataschema för beskrivning av taxonomier som innehåller objekt och hierarkier

Dataresurser på nätet

WC3 är en medlemsorganisation som driver viktiga öppna standardiseringar och ser till att webben fungerar som den gör idag. Grundaren Tim Berners-Lee skapade första versionen av hypertext standarden 1991 (HTTP och HTML), som möjliggjorde sammanlänkning av text, bilder och video på nätet. W3C och Tim Berners-Lee (TED talk) har varit en förespråkar sedan mitten av 2000-talet av ett paradigmskifte från att publicera text – till att publicera data på nätet. Protokollet som gör detta möjligt är uniform resource identifier (URI) och publicerades i sin nuvarande version (RFC 3986) redan 2005. De flesta är mest bekanta med URL (uniform resource locator) delen av standarden för adresser till webbplatser. Genom att nyttja hela URI standarden blir det möjligt att skapa en unik identifierare (URI) och publicera dataresurser på nätet. URI:er kan användas för att publicera data och information om fysiska och abstrakta resurser på nätet som exempelvis skolor, vägar eller regionindelning. Det är upp till den som publicerar data att säkerställa att (URI) identifierarna är både unika och beständiga över tid, vilket möjliggör förtroende mellan tillhandahållare och användare av data resurser på nätet.

En av fördelarna med URI protokollet är att det redan används idag för att publicera innehåll på webben. Protokollets regler för unika identifierare och dess inbyggda stöd för begreppsmodeller möjliggör beskrivning av komplexa samband och egenskaper som möjliggör interoperabilitet och vidareutnyttjande av data och information med bibehållen betydelse mellan organisationer och över nationsgränser. Stycket nedanför beskriver designprinciper för URI:er och grunden för länkad data, begreppsmodeller och den semantiska webben. W3C som tillhandahåller standarderna är en öppen medlemsorganisation för företag och verksamheter som vill delta i standardiseringsarbetet med någon av de för närvarande 95 standarder som ligger under organisationens paraply.

URI design

Med hjälp av unik identifierare (URI) kan data enklare vidareutnyttjas och länkas med annan data på nätet. URI:er kan användas för att publicera data och information om fysiska och abstrakta resurser på nätet som exempelvis skolor, vägar eller regionindelning. För att referera till resurser behöver identifierare och adresser vara beständiga över tid och vara logiskt strukturerade. Länken nedanför är en URI som beskriver länet Kent syd-ost om London, som är länkat till andra resurser som exempelvis regioner, vägar och geografiska egenskaper för att skala geografisk kontext.

http://data.ordnancesurvey.co.uk/doc/7000000000018210

URI:n för länet Kent följer riktlinjer för hur offentliga organisationer bör publicera dataresurser på nätet i Storbritannien (designing URI sets for the UK public sector). Att tillgängliggöra data och information som resurser på nätet kan vara ett omfattande arbete som bör göras iterativt eftersom det troligen kräver tillpassning och av både arbetssätt och IT-stöd. Därför rekommenderar W3C att börja publicerat data som har stort samhällsvärde och som kan vidareutnyttjas inom offentlig sektor. Att strukturera och publicera resurser med beständiga URI:er är en del av rekommendationen för publicering av länkad data som beskrivs i stycket nedanför.

Länkad data

Innan hypertext (HTML & HTTP) lanserades var inte existerande elektroniska dokument länkade med varandra på ett standardiserat sätt, vilket gjorde det svårt att referera till varandras dokument och skapa sammanhang. I dag står vi inför en liknande problematik med mängder av fristående datakällor på nätet som inte nyttjar standardiserade format och protokoll för att göra data mer användbar och tillgänglig. Precis som dokumenten på internet, behövs data länkas med varandra för att enklare kunna hittas och skapa kontext. Länkad data tillsammans med semantiska modeller, möjliggör att data blir överförbar mellan system, organisationer och landsgränser med bibehållen betydelse.

Länkad data nyttjar samma protokoll som används för att adressera webbsidor på nätet. Uniform Resource Identifier (URI) används för att identifiera unika resurser på nätet. Webbplatser använder oftast bara Uniform Resource Locator (URL) av protokollet för att identifiera unika platser. Styrkan med länkad data är att data kan kopplas ihop med annan data över organisationsgränser genom att använda beprövad teknik som redan är tillgänglig. Att publicera data med unik identifierare (URI) kräver lite mer förberedelse gentemot att publicera HTML-sidor, eftersom unika identifierare (URI) behöver vara kopplade till nycklar som används av interna IT-system. Unika identifierare behöver också skapas utifrån en konvention och process som kan förstås av människor och maskiner, som exempelvis Storbritanniens designriktlinjer för URI:er. Detta är viktigt för att göra URI:erna beständig över tid och möjliggöra vidareutnyttjande av digitala resurser som är länkade med varandra. Verktyg som femstjärnig modell för länkad data kan bidra med att visa vilka steg som behöver göras. Modellen är inte ett praktiskt verktyg, utan fungerar som motivation och indikation på nivå av mognad för implementering av länkad data. Det är först vid steg fyra och fem som arbetet med länkad data börjar generera större värden.

Källa: 5 ★ Open Data

Semantisk webb och begreppsmodeller

Skapande av unika identifierare (URI) för digitala resurser är startskottet för att bygga den semantiska webben och webben 3.0. Detta nya paradigm innebär publicering av data och information i standardiserade format som är avsedda att läsas av maskiner istället personer. Länkad data skapar global interoperabilitet mellan system genom att nyttja av format (RDF, JSON-LD) som länkar ihop viktiga resurser på nätet. Och som blir självförklarande för maskiner genom nyttjande av semantiska modeller som består av taxonomier (RDFS, OWL) och regler för att bygga begrepp- kunskapsmodeller. Modeller brukar innehålla språkanpassningar som gör det möjligt att terminologier och begrepp kan flyttas över landsgränser. När komponenterna för den semantiska webben finns på plats kan artificiell intelligens (AI) och självlärande system bidra till att effektivare och automatisera stora delar av transportsystemet. Bilden nedanför visar vilka format, standarder och protokoll som ligger till grunden för den semantiska webben.

Källa: Wikipedia (en)

SPARQL används för att ställa frågor på digitala resurser som är länkat till en eller flera begreppsmodeller vilket möjliggör interoperabilitet mellan system. Om skoldata och information var publicerad som länkad data och semantisk webb, skulle det gå att ställa frågor om all elevers skolresultat inom EU förutsatt att man nyttjar samma begreppsmodell för att beskriva skolresultat. Exempelvis skulle det vara möjligt att ställa frågor om vilka kommuner, regioner och länder som har elever med medel över betygsnivå B. Om skolresultat var länkat till fakta om elevers demografiska bakgrund, skulle det var möjligt att fråga om föräldrarnas medelinkomsten och vilket område de kommer ifrån.

För att enklare hitta och automatiskt indexera publicerad data finns standarder som DCAT-AP, GeoDCAT-AP som bygger på syntax från formatet RDF som används för länkad data och semantiska webben. DCAT-AP kan också använda för data som inte är sammanlänkad (XLS, CVS, PDF), men då går meningen förlorad med att skapa interoperabilitet mellan system och tillgängliggjorda digitala resurser. EU kommissionens finansierar flera stora program (ISA) inom Europa för att skapa interoperabilitet mellan system och automatisera administration.

Semantiska modeller gör det möjligt att definiera data med bibehållen betydelse över organisation och landsgränser, samtidigt som det minimerar möjligheterna till feltolkning. Modeller kan också länkas med varandra för att utgöra en större helhet. Detta är användbart för att definiera terminologier och begrepp för större verksamhetsområden. Flera branscher använder semantiska modeller idag för att beskriva komplexa förhållande och relationer mellan objekt. Exempelvis finns det modeller för medicinskt terminologi som beskriver kliniska behandlingar av sjukdomar, diagnostik och läkemedel som kallas SNOMED CT(Socialstyrelsen). Projektet är ett internationellt samarbete som har ett antal lokala anpassningar för olika språk som alla länkar tillbaka till en övergripande begreppsmodell. Detta medför att behandling och diagnostik av patienter som flyttas över landgränser blir entydig och minimerar risken för felbehandling beroende på tolkningsfel. En del av arbetet med att modellera semantiska modeller utgörs av att kategorisera och definiera relationen mellan begrepp. Bilden nedan representerar ett exempel av en enkel topologi av relationer mellan några däggdjur och egenskaper de besitter.

Källa: Semantic network – Wikipedia

Implementering av länkad data

Att styra över fokus från att publicera webbsidor till att publicera länkad data på webben kommer vara en process som behöver tid, kunskap och förståelse eftersom det troligen behövs förändringar av både verksamhetsprocesser och IT-arkitektur. W3C rekommenderar att man börjar med digitala resurser som har stort samhällsvärde och geografisk positioner som kan länkas samman med exempelvis postkoder, kommun och regions indelningar på nationell nivå. Detta eftersom det potentiella samhällsvärdet det skulle kunna skapa i relation till kostnader för att underhålla och skapa semantiska modeller. W3C ger förslag på hur semantiska modeller kan skapas och utvecklas iterativt genom att tillämpa en livscykelprocesser. Förslag nedanför visar på en iterativ process som består av; 1) specificera 2) modellera 3) generera 4) publicera och 5) exploatera.

Källa: Best Practices for Publishing Linked Data

Sammanfattning

För att myndigheter och offentliga organisationer skall lyckas med den digitala transformeringen och maximera nyttan som teknologin erbjuder behövs en kontinuerlig inhämtning av kunskap och kompetens av ledare och ansvariga. Om inte goda designprinciper och praxis utnyttjas inom offentlig verksamhet kommer det digitala kunskapsgapet att leda till att offentliga medel kommer berika privata företag som vill upprätthålla leverantörsberoende. Det digitala kunskapsgapet exemplifieras i dag av att fåtal privata leverantörer idag äger stora globala digitala plattformar som låser in privatpersoners data för egen vinning.

Datakvalitet

Inledning

Datakvalitet betyder olika saker beroende på syfte och målsättning. För att värdera och uppskatta datakvalitet behövs minst en tilltänkt användargrupp eller tillämpningsområde betraktas vid tillgängliggörande av data. Detta eftersom datakvalitet är kopplat till avsedda användare och vilket dataformat och standarder som används inom olika tillämpningsområden. Datakvalitet är kopplat till kostnader eftersom hög detaljrikedom och noggrannhet oftast kostar mer att tillhandahålla. Oavsett användargrupp eller tillämpningsområde bör all data som tillgängliggörs innehålla metadata som beskriver egenskaper av data, som exempelvis vem som skapat den, när den publicerades, vilka standarder eller enheter som används.

Exempelvis är kalkylblad ett användbart format för finansiell data och PDF dokument passande för offentliga handlingar som skall läsas av människor. Däremot är PDF dokument ett mindre lämpligt format om det skall användas för att publicera mätvärden av exempelvis temperaturobservationer som skall läsas av maskiner.

En kvalitetsaspekt som berör nästan all data oavsett tillämpningsområde är hur aktuell och tidsenlig data är, exempelvis förlorar prognoser om ankommande linjer till en hållplats snabbt sitt värde när avgången inträffat. Länk till principer angående datakvalitet.

Distinktion mellan data och information
Information kan aldrig bli bättre än kvaliteten av den data den härleds ifrån. Enkelt beskrivit är data en enhet fakta som i sig själv inte går att härleda något mening ifrån, däremot kan en mängd data utgöra mening i form av information beroende på hur det tolkas, behandlas och presenteras. En pixel i en bildfil är en  enskild enhet data som inte säger något om vad den representerar. Däremot tillsammans kan de representera en bild om de behandlas och presenteras rätt beroende på om metadata finns tillgängligt i filen vilket beskriver exempelvis färgrymd, bildbehandlingsstandard, datum, totalt antal pixlar med mera. I andra fall är distinktionen inte lika tydlig mellan data och information, exempelvis kan en enskild observation av temperatur tolkas och utgöra viss mening. När data om temperatur kombineras med data om geografisk plats, lufttryck, luftfuktighet med metadata om mätenheter, standarder, tidpunkt, mm. så skapas mening och sammanhang.

Exakthet och Precision

Ett sätt att förhålla sig till datakvalitet är att anpassa behovet av exakthet och precision i förhållande till sitt ändamål. Exakthet är hur väl data återger verkligheten, det vill säga hur väl fakta som finns tillhands kan återskapa den ursprungliga innebörden. Behovet av detaljnivå skall sättas i förhållande till ändamålet. Exempelvis kan en lågupplöst satellitbild vara tillräcklig för att se större byggnader och vägar, men inte tillräckligt detaljerad för att se stigar och mindre vägar. Behovet av detaljnivå behöver också sättas i perspektiv till kostnaden eftersom tillhandahållandet av data med hög detaljnivå är oftast förenligt med större kostnader. Förutom val av detaljnivån är det viktigt att välja maskinläsbart format som är lämpade för maskinell behandling och tolkning, mer om innebörden av maskinläsbart format går att läsa i länken nedanför.

… dataformat som är lämpade för resurssnål databehandling med möjligheter att definiera objekt, attribut och hierarkier så att maskiner kan tolka innehåll och kontext utan manuell handpåläggning. – Artikel om maskinläsbart format (15/03/2017)

Exakthet påverkas av faktafel och om data är inkomplett – det vill säga att poster av data saknas eftersom detta skapar brus och att data kvaliteten försämras. Även transformering av data till andra mätenheter kan påverka exaktheten eftersom detaljnivå kan gå förlorad. Generellt sett är det bättre att data tillhålls komplett och i ursprungliga mätenheter så att användare själv kan transformera och sammanställa efter behov.

Precision är hur väl data kan reproducera liknande resultat och betydelse oberoende av vem som tolkar den. Det vill säga att data med hög precision har hög korrelation för det som avses att mätas eller representeras. Dataformat som erbjuder hög precision är oftast hieratisk strukturerade, som exempelvis XML och JSON. Däremot garanterar inte dataformat precision, utan det förlitar sig på noggrannheten i de processer som mäta och samlar data.

Sammanställningar i form av rapporter och prognoser som inte innehåller underliga detaljer erbjuder låg eller ingen precision, då det inte tillåter andra att härleda resultatet. Exempelvis kan en medeltemperatur över en viss period verka rimlig, men med tillgång till underliggande temperaturobservationer kan användaren se standardavvikelsen och själv avgöra om mätningarna verka rimliga. Bilden nedanför föreställer sambandet mellan exakthet, precision, validitet och kommer från standarden ISO-5725-1. Standard förklarar generellt innebörden av av exakthet,  precision och validitet med gruppering av träffar på en tavla. Validitet är graden av sanning, det vill säga att data mäter det som är avsett att mätas. Exempelvis kan mätningar som avser att mäta utomhustemperaturen påverkas om mätningarna görs nära en byggnad eller bredvid annan värmekälla vilket påverka validiteten.

Låg exakthet, låg precision, och acceptabel validitet.

Hög exakthet, hög precision, och låg validitet

Principer angående datakvalitet

  • Ta reda på vilken detaljnivå av data de tilltänkta användarna är i behov av och motivera kostnaden med att tillhandahålla och underhålla data med ett tydligt syfte och målsättning som är kopplat till verksamhetsmål
    • Prioritera att tillhandahålla några få efterfrågad datakällor med hög kvalitet (exakthet, precision och med hög sanningshalt) istället för många med lägre kvalitet
    • Undvik att använda proprietära format som exempelvis EXCEL, PDF och Shapefile. Använd istället öppna format som inte kontrolleras av enskilda organisationer som exempelvis XML, JSON och GeoJson.
  • Inrätta rutiner och processer för att säkerställa att datakvaliteten upprätthålls löpande och varnar om enheter av data saknas eller att mätvärden överstiger tillåtna gränsvärden
  • Säkerställ att metadata är så komplett och beskrivande som möjligt, data som representerar komplexa objekt, validering och relationer mellan objekt behöver hierarkiska dataformat som XML och JSON, vilket erbjuder länkning till scheman som förklarande objekt, attribut och relationer
    • Inkomplett och felaktig metadata medför att förtroende och användningsområdet för data  minskar
  • Grunddata har flera applikationsområden kontra färdiga sammanställningar, prognoser och rapporter. Förklara istället hur användaren själv kan göra egna sammanställningar
    • Grunddata ger användaren möjlighet att använda egna algoritmer och uträkningar
    • Behåll ursprungliga enheter om mätenheter för grunddata, om transformeras till andra mätenheter görs behöver detta förklaras