‘Vroeger zei men “data is het nieuwe goud”, maar dan moet het wel data van goede kwaliteit zijn’, zei onderzoeker Laure Wynants toen ik haar sprak over haar onderzoek naar AI-gedreven modellen die tijdens de coronacrisis zijn ontwikkeld. De uitkomst daarvan is ontluisterend: bijna alle algoritmes bleken te rammelen en presteren ondermaats. Dat komt voor een belangrijk deel doordat te veel gevraagd wordt van te kleine datasets.
De potentie van datamodellen en algoritmes in de zorg leidt weinig twijfel. Om die ten volle te benutten is het zaak de handen ineen te slaan. Kennis en expertise delen is cruciaal en veel partijen – zorgorganisaties, bedrijven, (semi)overheidsinstellingen – zijn daarmee bezig. Bovendien worden er zaken als hulpmiddelen, richtlijnen en veldnormen opgesteld om de kwaliteit van modellen te verbeteren.
Data delen kan bij die tendens niet achter blijven. Toch is toegang tot zorgdata voor veelbelovende start-ups vaak een enorm struikelblok. Dat je met zorggegevens secuur moet omgaan, staat als een paal boven water. Maar er kan en mag veel meer gedeeld worden dan veel partijen denken. Juridisch is er ruimte en uit onderzoek blijkt dat patiënten er vaak – onder voorwaarden – weinig bezwaar tegen hebben.
Daar komt nog bij dat de technologische ontwikkelingen niet stilstaan. Neem een recente studie van TNO, in samenwerking met het CBS, zorgverzekeraar CZ en het Limburgse ziekenhuis Zuyderland. Zij gebruikten hiervoor Multi-Party Computation (MPC), een gereedschapskist met crypto-grafische technieken. Die maken het mogelijk datasets als het ware te bezoeken en er statistische berekeningen mee uit te voeren terwijl de data niet naar een centraal punt hoeven te verhuizen. Als de stakeholders dergelijke ontwikkelingen omarmen en vooral kijken naar wat wel kan, komt de dans om de zorgdata eindelijk ten einde. Dan kan het pas echt gaan swingen.