NL EN

Big Data en opsporingsdiensten

In de NRC Next van 15 juli staat een interessant artikel over het gebruik van Big Data door opsporingsdiensten (“Hoe vis je hier interessante informatie uit?”). De verslaggever constateert dat het sinds de zaak Snowden duidelijk is dat de overheid toegang heeft tot veel van onze gegevens. In het artikel wordt ingegaan op de wijze waarop de opsporingsdiensten uit deze berg van gegevens bruikbare patronen destilleren. Het zomaar analyseren van een berg data is in ieder geval geen optie.

 

Maarten de Rijke, hoogleraar informatieverwerking en internet aan de UvA, licht toe op welke wijze de opsporingsdiensten dan wel werken. Opsporingsdiensten zijn niet op zoek naar één resultaat, maar zijn geïnteresseerd in het vinden van allerlei potentieel gevaarlijke personen en organisaties. Om de juiste personen te vinden moeten duizenden kenmerken worden afgewogen.  Maar hoe bepaal je om welke kenmerken het gaat? Zo bezien lijkt de zoektocht van de opsporingsdiensten veel op de werkwijze van zoekmachines zoals Google. De Rijke denkt dat ze zelf ongeveer van dezelfde algoritmen gebruik maken en dat er ook sprake is van een samenwerking.

 

Allereerst wordt er gekeken naar ‘metadata’. Bijvoorbeeld wie er op welk moment wordt gebeld. Op deze wijze verkrijgt de opsporingsdienst al veel informatie over iemands gedrag. Zo kan duidelijk worden dat iemand in contact treedt met mensen die al in de gaten worden gehouden. Als een persoon vervolgens interessant genoeg lijkt, kunnen de e-mails en berichten van die persoon geanalyseerd worden. Dit kost meer rekenkracht. Daarbij wordt vooral gekeken naar veranderingen in het gedrag. De Rijke geeft een voorbeeld.

 

Vanuit sociaal onderzoek zijn er allerlei patronen duidelijk geworden die kunnen duiden op radicalisering. Eén van die patronen is dat mensen zich een tijd bezig houden met steeds meer onderwerpen en met steeds meer mensen. Dat is op zich niet vreemd, maar dan slaat het om en gaat het over één onderwerp dat met slechts een kleine groep wordt gedeeld. Dat is verdacht.

 

Voor een dergelijke geavanceerde manier van analyseren heb je veel data over langere tijd nodig en een idee naar welke patronen moet worden gezocht. Vooral dat laatste is lastig voor onderzoek naar terroristische aanslagen. Er zijn te weinig terroristische aanslagen om als voorbeeld te dienen. Er is daarom informatie van ‘de straat’ nodig. Kennis over hoe radicalisering werkt en wat terroristen doen. De Rijke stelt daarom dat voor het begrijpen van Big Data altijd ook Little Data noodzakelijk is.

 

Het artikel richt zich vervolgens op het Nederlands Forensisch Instituut (NFI) dat zich ook met het gebruik van Big Data bezig houdt. Het NFI moet bijvoorbeeld uit terrabytes data aangeleverd door politie of justitie destilleren wie deel uitmaken van een crimineel netwerk. Het NFI heeft slimme analysesoftware die verborgen patronen naar boven haalt. Zo kan op grond van de analyse van een bepaalde schrijfstijl, het gebruik van bepaalde woorden en spelfouten worden achterhaald wie er achter een pseudoniem schuil gaat.

 

Het gebruik van Big Data is echter niet zaligmakend. Zo kunnen  bijvoorbeeld niet alle terroristische aanslagen worden voorkomen door de analyse van de data. Als er geen sprake is van patronen, valt er ook niets te analyseren. De lone wolves die alleen opereren en geen contact met anderen hebben over het plegen van een aanslag zullen door de analyse van data niet worden gevonden.

 

Bovendien staat het steeds verder analyseren van data die betrekking heeft op personen, op gespannen voet met de privacy van die personen. Het artikel gaat daar niet op in, maar de mogelijkheid om steeds meer data te verzamelen en te analyseren vereist goede juridische waarborgen om te voorkomen dat deze gegevens op onrechtmatige wijze worden gebruikt.

 

Het artikel is in de papieren versie alsmede in de online editie te vinden (alleen voor abonnees).

 

 

 

 

 

BRON: nrc.nl


PAGINA DOORSTUREN

DEZE PAGINA IS SUCCESVOL DOORGESTUURD!

REACTIE (1)

Frans woensdag 17 juli 2013 16:33

"De lone wolves die alleen opereren en geen contact met anderen hebben over het plegen van een aanslag zullen door de analyse van data niet worden gevonden."

Waarom niet? Ook dat is toch een patroon dat herkend kan worden?

"Bovendien staat het steeds verder analyseren van data die betrekking heeft op personen, op gespannen voet met de privacy van die personen. Het artikel gaat daar niet op in"

Het is een beetje jammer dat ook deze samenvatting daar niet op in gaat... Hoe zit het nu?

EEN REACTIE PLAATSEN

UW E-MAIL ADRES WORDT NIET GETOOND AAN ANDERE BEZOEKERS.

  1. NAAM
  2. E-MAILADRES
  3. BERICHT
  4. WANNEER U DEZE REGEL KUNT LEZEN, VUL HET VOLGENDE VELD DAN NIET IN!
  5.