Lagringsytor som ska kunna hantera stora mängder digitala data utformas på olika sätt. NGP använder en så kallad datasjö-arkitektur (data lake) där data lagras i sitt ursprungliga, råa format istället för att först omvandla och bearbeta dem. De uppgifter som lagras kan vara mer eller mindre strukturerade. Strukturerad information följer en överenskommen struktur, är mer välorganiserad, använder enhetliga termer som i vissa fall kopplas ihop med en kod från en ontologi/terminologisystem. Med ostrukturerad information avses till exempel långa stycken med fritext i Word-filer eller bilder, loggfiler, video och ljudfiler. Datasjön använder sedan avancerade sökalgoritmer för att plocka fram relevant data och metadata ur den råa datan för att besvara specifika frågeställningar.