Terugblik: Leernetwerk AI Beeldherkenning - Delen van data, AI en informatie
Centraal in deze themasessie van het leernetwerk stond het delen van data, AI en informatie in de context van AI beeldherkenningstechnologie. Mark Loos van het Netherlands Space Office (NSO) en Peter Verkoulen van TNO en het Centre of Excellence for Data Sharing & Cloud (CoE-DSC) vertelden over de kansen en de meerwaarde van het toegankelijk maken van data, AI en informatie. (september 2024)
Het Leernetwerk AI Beeldherkenning organiseerde in 2024 themasessies over de 4 thema’s uit de marktvisie. Deze sessie op 26 maart 2024 was de eerste van 4 sessies.
Datagedreven en innovatieve samenleving
Het delen van data zorgt voor een meer datagedreven en innovatieve samenleving. Dit is cruciaal voor het creëren van oplossingen voor maatschappelijke uitdagingen als klimaatverandering, mobiliteit en gezondheid. Voor het delen van overheidsinformatie zijn daarom 2 belangrijke uitgangspunten geformuleerd in de marktvisie: ‘één keer verzamelen, meerdere keren gebruiken’ en ‘openbaar tenzij’. Om dit op de juiste manier en bovendien efficiënt te doen, is het van belang dat data en informatie gemakkelijk en toegankelijk beschikbaar zijn. Ook is het belangrijk om vergelijkbare algoritmen voor soortgelijke taken niet onafhankelijk van elkaar te ontwikkelen en te implementeren.
Meer delen van data nodig
Er heerst veel terughoudendheid in het delen van data. Zo wordt momenteel slechts circa 2% van de beschikbare data openbaar gedeeld. Belangrijke reden hiervoor is een gebrek aan vertrouwen tussen organisaties onderling. Ze zijn vaak terughoudend met datadelen, omdat ze niet weten of ze de controle over de data kunnen behouden. ‘Data spaces’ en andere manieren om de onafhankelijkheid van grote technologiebedrijven te waarborgen spelen daarom een cruciale rol in het doorbreken van dit gebrek aan vertrouwen. Bedrijven en organisaties zijn nu vaak nog terughoudend in het delen van data, omdat niet zeker is of ze dan nog controle hebben over de data.
Delen van satellietdata
Een voorbeeld van een data space is het satellietdataportaal van NSO. NSO lanceerde dit portaal in 2012 vooruitlopend op het besluit van de Europese Commissie om het Copernicus Programma op te zetten. Dit programma wil open toegang tot satellietdata wereldwijd mogelijk maken en daarmee innovatie bevorderen. Doel van het satellietportaal is hetzelfde. Het is openbaar toegankelijk en trekt door zijn gebruiksvriendelijkheid veel soorten gebruikers, vertelt Mark. Zo biedt het data in verschillende formats aan. Ook biedt het portaal vergelijkbare data als het Copernicus Programma om zo de continuïteit van datastromen te borgen.
Wetgeving en richtlijnen voor delen van data
Het behouden van de onafhankelijkheid van technologiebedrijven om datadelen te bevorderen, borgt de Europese Unie met verschillende maatregelen, vertelt Peter. Hij is namens TNO verantwoordelijk voor het Center of Excellence for Data Sharing & Cloud dat bedrijven helpt met uitdagingen omtrent datadelen en verantwoordelijk voor de Nederlandse Gaia-X hub. Verplichtende maatregelen zijn bijvoorbeeld wetten en richtlijnen. Dit zijn naar Europees voorbeeld onder andere Algemene verordening gegevensbescherming (AVG, 2016), Richtlijn hergebruik overheidsinformatie (2019), Data governance verordening (2022), Datawet (2024) en Verordening Kunstmatige Intelligentie (2024).
Datadelen initiatieven: Gaia-X en SIMPL
De EU stimuleert datadelen met respect voor de onafhankelijkheid van bedrijven onder andere door ondersteuning van initiatieven, zoals Gaia-X en SIMPL, zo licht Peter toe. Deze zijn gericht op het creëren van een federatief systeem: een verzameling van onderling verbonden maar autonome systemen die samenwerken om een gemeenschappelijk doel te bereiken.
Gaia-X is een Europees project gericht op het bevorderen van digitale onafhankelijkheid van Europa. Het doel is een federatief systeem te creëren waarin organisaties, landen en Cloud-aanbieders data op een veilige en betrouwbare manier kunnen delen. Gaia-X is een belangrijk instrument om een veilige Europese Cloud-voorziening te realiseren. Het is overigens niet de bedoeling om hiermee een Europese hyperscaler te ontwikkelen.
SIMPL biedt een open source software-infrastructuur als basis voor de Common European Data Spaces. Het is een gestandaardiseerde manier om datadelen tussen verschillende sectoren en landen mogelijk te maken. SIMPL is gebaseerd op federatieve principes. Dat betekent dat de data bij de bron blijft, maar ook toegankelijk wordt gemaakt voor andere gebruikers. Dit komt de interoperabiliteit en datatoegang ten goede.
Datadelen en licentievoorwaarden
Bij het delen van data zijn vaak ook licentievoorwaarden van belang, legt Mark uit. Zo stelt NSO als eigenaar van het satellietdataportaal de data in het portaal weliswaar gratis beschikbaar voor Nederlandse gebruikers maar zijn er wél licentiebeperkingen. Een organisatie mag de data alleen intern gebruiken en het is niet toegestaan om de originele data of halffabricaten te verspreiden. Dit komt omdat NSO zelf ook data inkoopt en dus geen eigenaar is van die data. Elke publieke organisatie, die zelf data inkoopt of data van bijvoorbeeld het satellietdataportaal deelt, moet de licentievoorwaarden van die data naleven. Wel mogen gebruikers afgeleide producten, zoals geclassificeerde beelden, vrij verspreiden.
Uitdagingen bij het delen van data, AI en informatie
- Gebrek aan vertrouwen: bedrijven en organisaties zijn veelal terughoudend in het delen van data, omdat niet bekend is of de controle over de data wordt behouden.
- Technologische en juridische complexiteit: het opzetten van interoperabele systemen tussen sectoren en landen is technologisch uitdagend en vereist robuuste juridische kaders. Want hoe zit het met AVG? En hoe werken licenties?
- Portabiliteit en interoperabiliteit: Portabiliteit is het zonder belemmeringen kunnen overdragen van data tussen cloud-omgevingen, interoperabiliteit is het vermogen van systemen en processen om effectief en efficiënt informatie te kunnen communiceren en samenwerken. Regels over de portabiliteit van data tussen verschillende Cloud-omgevingen moeten bedrijven beschermen tegen lock-in risico’s bij één leverancier.
- Data continuïteit: het borgen van data continuïteit is belangrijk voor lange termijn projecten en innovaties. Geopolitieke ontwikkelingen kunnen hiervoor een bedreiging vormen.
Ontwikkelingen die datadelen gaan verbeteren:
- Wetgeving: de verwachting is dat Europese wetgeving de markt voor datadelen de komende jaren fundamenteel gaat veranderen naar een meer gecontroleerd en soeverein datadelen.
- Samenwerking tussen landen en sectoren: om datadelen te verbeteren, is ook in toenemende mate samenwerking tussen landen en sectoren nodig. Dit moet leiden tot nieuwe en schaalbare data-ecosystemen.
- Grote bedrijven gaan Gaia-X labels uitvragen: wanneer grote bedrijven en aanbesteding plichtige organisaties in Europe de Gaia-X labels gaan uitvragen bij leveranciers geeft dit een impuls voor adoptie van Gaia-X. Het draagt bij aan het creëren van een markt voor datadelen.