Datahantering, åtkomst och delning

  • Vilken typ av data kan lagras i NGP?

    I NGP lagras främst två typer av data: information om en patient/forskningsperson och genomikdata. 
    Information om en patient/forskningsperson är data såsom namn, ålder, kön och hälsodata som diagnos. Med genomikdata avses uppgifter som rör patientens/forskningspersonens nedärvda eller förvärvade genetiska varianter. Den genetiska datan skapas genom att ett biologiskt prov sekvenseras inom sjukvården. Vårdgivaren kan lagra genomikdatan i sin del av NGP i sitt råa, obearbetade format (rådata) och/eller i ett mer analyserat format, där information om identifierade genetiska förändringar framgår (analysdata). 

  • Vem kan lagra data i NGP?
    I NGP har varje region med universitetssjukvård (som ingår som en part i GMS) en egen skyddad lagringsyta. Genomikdata och annan hälsodata tillhörande en patient eller forskningsperson hämtas från lokala laboratorie- och lagringsinformationssystem och överförs på ett säkert sätt, genom Sjunet eller VPN, in i respektive regions lagringsyta i NGP. 

  • Vem har tillgång till data i NGP?
    Respektive region styr själv över sin egna lagringyta och därmed vilka användare som ska ha behörighet. Vidare reglerar patientdatalagen de situationer då personal får beredas tillgång till en specifik patients uppgifter. 

    Genom att metadatatagga vissa uppgifter kan data vid behov tillgängliggöras för andra användare i NGP, utanför den egna regionens lagringsyta. Detta förutsätter dock att regionen först prövar om data får delas utifrån gällande sekretessregelverk. I dagsläget delas enbart forskningspersoners data mellan olika regioner och universitet i NGP.  Detta avser enbart forskningsstudier med etiktillstånd och där forskningspersonerna samtyckt till att medverka i forskningen. Vidare är det enbart användare som är involverade i respektive forskningsstudie som har tillgång till den delade datan. 

  • Hur sker lagring av data i NGP?
    Genomikdata och annan hälsodata tillhörande en patient eller forskningsperson hämtas från de sjukhus som utför analyserna och överförs på ett säkert och skyddat sätt, genom SjuNet eller krypterad länk, in i respektive regions lagringsyta i NGP. 

    Efter överföringen lagras data som datafiler i NGP. Filerna innehåller genetisk rådata samt information om identifierade genetiska förändringar (analysdata) och vilken kvalitet analyserade data har. Därtill kan andra typer av hälsodata av relevans inom genomikområdet laddas upp till NGP. Det kan till exempel vara information om patienten eller forskningspersonen, så som namn, personnummer eller diagnos eller information från analysinstrument samt den tolkade data som skapas under den diagnostiska processen. 

  • Vad är en datasjö?
    Lagringsytor som ska kunna hantera stora mängder digitala data utformas på olika sätt. NGP använder en så kallad datasjö-arkitektur (data lake) där data lagras i sitt ursprungliga, råa format i stället för att först omvandla och bearbeta dem. De uppgifter som lagras kan vara mer eller mindre strukturerade. Strukturerad information följer en överenskommen struktur, är mer välorganiserad och använder enhetliga termer som i vissa fall kopplas ihop med en kod från en ontologi/terminologisystem. Med ostrukturerad information avses till exempel långa stycken med fritext i Word-filer eller bilder, loggfiler, video och ljudfiler. Datasjön använder sedan avancerade sökalgoritmer för att plocka fram relevant data och metadata ur den råa datan för att besvara specifika frågeställningar.    

    Varje region har sin egen lagringsyta och sökalgoritmer i NGP till vilken endast personer godkända av regionen har behörighet och sättet att organisera data som en datasjö påverkar inte dessa behörigheter. Information som en region väljer att visa ut som gemensam kan läggas över i en gemensam lagringsyta och användas för sökningar från alla projektparter.  

  • Vem äger innehållet och vem har kontroll över innehåll och uttag?
    Varje region äger sin data samt har kontroll över innehåll och uttag. 

  • Vilken data är tänkt att delas inom NGP?
    När NGP nu driftsätts och regionerna följt sina rutiner kring analys av NGP som system för lagring av hälsodata kommer genomikdata (och kopplad metadata som t ex identitiet, frågeställning, fenotypisk information och data kring prov och analys) från klinisk diagnostik att allt efter att data genereras lagras i respektive regions del av NGP. Den av denna data som initialt kommer att delas är den för vilken det finns etikgodkännande inom ramen för en vetenskaplig studie att dela. Den märkning av datan som gör delning möjlig utförs av den region där dataägaren befinner sig. 

    Inom ett samarbete med Folhälsomyndigheten utarbetas samtidigt tekniska lösningar för delning av genomikdata enlig Smittskyddslagen. 

    Slutligen kommer så kallade aggregerade data, resultat från antalsberäkningar inom varje regions data, att delas. Dessa är inte längre kopplade till en enskild person och utgör alltså inte känsliga hälsodata.

    NGP är också förberedd för att i ett nästa steg dela data för primäranvändning av data när de legala förutsättningarna för detta öppnas, liksom att vara en kontaktpunkt för svensk klinisk genomikdata inom den europeiska datadelning som planeras inom European Health Data Space och där beslut förväntas februari 2025.

  • Hur möter NGP behoven av standardisering och klassificering av data samt av en harmoniserad datastruktur?
    Indexeringslösningen som är en central del av NGP möjliggör automatisk stegvis strukturering och raffinering av metadata. Det innebär att även om regionerna idag inte enats om en gemensam informationsstandard för klinisk information kan plattformen hämta in data i flera olika standarder och sedan mappa om den till en gemensam internationell standard. Plattformen kan också presentera samma rådata och metadata enligt olika standarder. På så vis kan data till exempel presenteras enligt DCAT-AP för EDHS och HL7-FHIR eller andra standarder för nationellt eller lokalt bruk. 

  • Måste all data samlas centralt för att kunna bygga upp en variantdatabas?
    Det är fullt möjligt att skapa en variantdatabas även utan NGP men trots att en sådan databas varit en prioriterad fråga inom vården under mer än 10 år har arbetet ännu inte kommit i mål. NGP ger nu möjligheter att utnyttja automatiserad uppladdning och indexering för att på resurseffektivt sätt slutligen få en variantdatabas på plats.