Lägesbild länkad data och semantisk webb

Resourcedescription framework (RDF) är ett tekniskt ramverk för enhetligt datautbyte och förståelse av begrepp som publiceras på webben. Detta brukade benämnas semantisk webb, vilket aldrig blev en verklighet. Nu nästa 20 år efter lanseringen verkar intresset öka kring teknologin för att ta itu med problematik det digitaliserade samhället står inför.

Ramverket lanserades 2001 och bygger vidare på teknik och standard som gjort webben möjlig i början av 90-talet. Grundtanken med tekniken var att skapa enhetlig semantisk förståelse av begrepp och koncept så data kunde utbytas och delas öppet på webben. Ramverket innehåller standarder för att länka data till metadatabeskrivning för att skapa begreppsförståelse. Detta är betydelsefullt för att enhetligt tolka begrepp och koncept som utbyts mellan organisationer, domänområden och över nationsgränser.

Ramverket bygger på etablerade teorier från diskret matematik och utgör grunden till grafdatabaser som lämpar sig för att lagra dynamiska relationer och semantisk förfrågningar. Ramverket innehåller också beskrivningslogik som utvecklades inom artificiell intelligens (AI) i början 80-talet för att konstruera regler för att validera logiska resonemang. Tillsammans möjliggör det beskrivning av logiska resonemang i digitalt format som kan användas för att utvinna implicit kunskap från begreppsmodeller som beskriver känd fakta. Exempelvis används ramverket inom DNA forskningen för att hitta nya samband mellan DNA sekvenser som inte varit känt sedan tidigare.

Vid tidpunkten när ramverket skapades fanns det en vision om en decentraliserad webb där personer, organisationer och företag delade data med varandra. Där den semantiska webben och smarta agenter utgjorde en gemensam digitala infrastruktur som kunde lösa våra behov genom att hitta relationer mellan producenter och konsumenter av tjänster utan att behöva vara anpassade att lösa specifika uppgift eller förfrågningar. Detta kan ses mot dagens agenter som Apple Siri och Google Assistent, vilket enbart kan utföra uppgifter och hitta kopplingar de är specifikt designade att utföra.

Den vision som Tim Berners-Lee (skaparen av HTTP & HTML) tillsammans med andra forskare hade existerar inte idag på grund av olika orsaker. Webben som en gång skapades som en öppen digital infrastruktur för att dela data och tjänster med varandra har bytts ut mot ett internet där stora plattformsägare dominerar och behåller äganderätt till data och information. En annan anledning är att principer om öppenhet och delaktighet kan missbrukas av illasinnade aktörer och kan utgöra ett säkerhetsproblem i ett digitaliserat samhälle.

Idag vidareutvecklas delar av ramverket för att passa dagens internet. Exempelvis lanserade W3C formatet JSON-LD 2014 för att göra teknologin mer tillgänglig. JSON är det dominerande format för många webbtjänster idag. Samma år lanserade Google tjänsten Knowledge Graph Search API som använder sig av formatet JSON-LD för att åskådliggöra relaterade begrepp och koncept till sökord. Året efter startade Google, Bing och Yahoo schema.org för att förbättra söktjänster på webben genom att tillhandahålla begreppsmodeller för att beskriva vanliga sökord och koncept. Ytligare exempel är Facebook OpenGraph som är en RDF liknande standard för att integrera artiklar som andra publiceras på nätet till företagets egen plattform som med hjälp metadatabeskrivning för att personifiera nyhetsflöden för användare.

Ett ökat intresse kring ramverket från bland annat europeiskt håll via interoperabilitets ramverket ISA² och Shift2Rail projektet för att öka innovationspotentialen inom det europeiska järnvägssystemet. Visar på att ramverket anpassats för att bättre passa dagens internet med uppkopplade enheter, stor mängder data och säkerhetsproblematik. Samtidigt som problem med fragmenteringen av dagens IT system, standarder och format kvarstår. Detta har gjort att ramverket fått ny luft under vingarna för att komma till rätta med problemet med att vidareutnyttja och sätta data i kontext.

Data blir inte mer värdefull eller lättare att vidareutnyttja bara för att det publiceras i RDF-format. För att skapa semantisk interoperabilitet behövs bland annat investeringar i referens begreppsmodeller, liknande det som göras inom olika program och projekt på EU-nivå. Detta möjliggör att data som representerar begrepp och koncept kan vidareutnyttjas inom samhällsviktiga sektorer. Förutom investering i referensmodeller behövs verksamhetsförmågor och attitydförändring att implementera öppen teknologi och standarder i verksamheter för att realisera enhetligt datautbyte. Om pågående EU-initiativ och utveckling av RDF-ramverket kommer leda till ökat utbyte för bättre delaktighet mellan samhällets olika delar återstår att se. Men vision om en enhetlig semantisk webb är antagligen en tankekonstruktion bäst lämpad för skrivbordet.

Creative Commons-licens

Innehållet är skapat av Clear Byte och är licensierad under Creative Commons Erkännande-IckeKommersiell-DelaLika 4.0 Internationell licens.