De balans tussen data analytics en privacy

Op: 19 mrt 2021

Cyber Security

De meeste organisaties erkennen de noodzaak van een data driven businessmodel. De belangrijkste redenen hiervoor zijn onder andere kostenreductie, betere onderbouwing van besluitvorming en een objectievere besluitvorming. Hoewel data al decennialang verzameld en geïnterpreteerd wordt, is data analytics de afgelopen vijftien jaar in een stroomversnelling geraakt. Niet voor niets spreken we nu van BIG data. De data die verzameld wordt is niet alleen van levensbelang voor organisaties, maar brengt ook zorgen met zich mee. Organisaties zoeken een balans om data analytics en privacy hand in hand te laten lopen.

Staan data analytics en privacy tegenover elkaar?

Dagelijks horen we berichten over datalekken en identiteitsdiefstal. Consumenten zijn zich daardoor steeds meer bewust van het belang van de bescherming van hun data. Overheden zijn wakker geworden en stellen steeds strengere eisen aan het verzamelen en beheren van consumentendata. De vraag rijst nu of data analytics en privacy elkaar in de weg staan? Ook hier geldt: niet zolang er een goede balans gevonden wordt.

Stap 1: bewustwording en training data privacy

De balans vinden begint bij een holistische aanpak. Slechts 25% van de organisatie traint haar medewerkers regelmatig op het gebied van data privacy. Binnen dit onderzoek wordt ‘regelmatig’ gedefineerd als (slechts) twee keer per kaar. Dat staat haaks op de maatschappelijke ontwikkelingen. Daar is de eerste winst te behalen. Investeer tijd en geld in training, in herhaling van de boodschap over het belang van data privacy en zorg voor transparantie over het gebruik van data.

Stap 2: intensiveer samenwerkingen

Een tweede punt waar winst te behalen valt is in de samenwerking binnen de (vaak gesilode) organisaties. Het vraagt om een nauwe samenwerking tussen IT, security- en privacy officers, legal en -last but not least- marketing. Medewerkers binnen deze afdelingen moeten zich continu bewust zijn van het belang van data privacy en het gebruik van diezelfde data. Een open discussie is hier essentieel voor goede besluitvorming en tijdig ingrijpen.

Stap 3: synthetische data & anonimiseren van data

Een derde belangrijk aandachtspunt is het design van data-analyse projecten. “Privacy by design” moet het motto zijn. De makkelijkste manier om dit te bereiken is het anonimiseren van data of het gebruik van ‘synthetische’ data. Synthetische data is data uit statistische modellen waar de input steeds wordt gevarieerd. Daardoor komt er ook steeds andere output, maar wel allemaal binnen dezelfde categorieën. Als voorbeeld kunnen geboortedata vervangen worden door leeftijden of (nog beter) leeftijdscategorieën. Als dat voor meer data in hetzelfde model gedaan wordt, blijft de data relevant en bruikbaar maar kan er niet exact worden nagegaan om wie het gaat. Vooral bij het testen van modellen om de uitkomsten in te zetten bij bedrijfsmodellen of conclusies te trekken uit medisch onderzoek is dit bruikbaar.

Stap 4: openheid en transparantie

Tot slot is het belangrijk om open en transparant te zijn naar klanten over het gebruik van hun data. Vertrouwen komt te voet en gaat te paard. Je kunt beter eerlijk zijn over welke data je verzamelt dan dat achteraf blijkt dat er onredelijk veel data is verzamelt. Als die data dan ook nog eens op straat komt te liggen is de ramp soms niet te overzien.

Investeren in data analyses en privacy

Data driven organisaties hebben een voorsprong. Om die voorsprong te houden is er een continue noodzaak om te blijven investeren in data analyse en privacy. De data is noodzakelijk om onderbouwd de juiste beslissingen te nemen. In potentie kan er echter ook veel mis gaan. Maar met de juiste balans voor technologie, samenwerking, training en ondersteuning en proactief informeren van klanten is er een prima balans te vinden tussen data analytics en privacy.