Grafische database brengt magie in onderzoeksjournalistiek

Nieuws | Nieuws

Om het geheugen op te frissen: de Panama Papers is een project van het International Consortium of Investigative Journalists (ICIJ): een Amerikaanse organisatie voor onderzoeksjournalistiek. Begin vorig jaar kregen zij via de Süddeutsche Zeitung de geruchtmakende documenten in handen; miljoenen interne e-mails, rapporten, PowerPoints en andere bestanden van Mossack Fonseca, een juridisch advieskantoor in Panama.

Het ICIJ schakelde ruim 370 onderzoeksjournalisten uit 76 landen in om de documenten door te lichten. Ook Nederlandse journalisten van Trouw en het FD werkten daar aan mee. Uit de resultaten kwamen tientallen staatshoofden, politici en miljardairs naar voren die offshorebedrijven bleken te bezitten. In de meeste gevallen wisten zij hiermee belasting te ontduiken.

Innovatie doorslaggevend

Terug naar de werkwijze van de journalisten. Want al had het ICIJ duizenden mensen op de Panama Papers gezet, 2,6 terabyte aan data spit je niet zomaar door. Daarom maakten de journalisten gebruik van software van onder andere Nuix, een Australisch softwarebedrijf en van de Zweedse start-up Neo Technology. Deze bedrijven bieden een zogenaamde grafische database aan. Die grafische database vindt binnen enkele minuten antwoorden op vragen waar een reguliere database dagen voor nodig zou hebben. Tel uit je winst.

Helemaal nieuw is de grafische database niet. Dezelfde techniek wordt al langer gebruikt door bedrijven als Walmart, eBay en Lufthansa om de voorkeuren van klanten in kaart te brengen. Door de doorslaggevende rol in de Panama Papers, is de grafische database nu echter plotseling wereldberoemd.

Goudklompjes vinden

Een grafische database dus, in plaats van een ‘gewone’ database. Maar wat kan zo’n grafische database nu precies dat een andere database niet kan? Eric Smit, oprichter en hoofdredacteur van Follow the Money (FTM), legt uit: “Met datajournalistiek kun je vooral structureren, patronen vinden. Een grafische database daarentegen, zoekt juist niet naar die algemene structuren, maar naar de anomalieën. Waar liggen opvallende verbindingen? Op die manier kun je goudklompjes vinden in enorme hoeveelheden ongestructureerde documenten. En daar zijn wij als journalisten naar op zoek.”

Hoe je die goudklompjes precies vindt? Stel je de database voor als een spinnenweb dat in dit geval bestaat uit alle namen, rekeningafschriften, adressen en andere informatie die werd gevonden in de betreffende documenten. In dat spinnenweb zie je bijvoorbeeld dat een bekende politicus verbonden is met een bepaald adres. Datzelfde adres is weer verbonden met een persoon die ook verbonden is met een verdacht rekeningnummer. Et voilà: een startpunt voor een journalistiek onderzoek.

In een interview met Computer Weekly beweert Emil Eifrem, co-founder en CEO van Neo Technology, dat de grafische database doorslaggevend is geweest voor het succes van de Panama Papers. Eifrem: “Als deze documenten tien jaar geleden waren gelekt, had niemand erover geschreven.”

De grote woorden komen niet alleen van de softwareontwikkelaars. Ook journalisten die meewerkten aan de Panama Papers zijn enthousiast. Zo gaf Mar Cabra, data en research editor bij ICIJ, in een recent interview aan dat deze database volgens haar “een revolutionaire tool is die het onderzoeksjournalistieke proces heeft getransformeerd.” Ze vervolgt: “Onderzoek op deze schaal was eerder simpelweg onmogelijk geweest. Het is magisch.”.

Jeukende handen bij FTM

Je zou zeggen dat het niet lang kan duren voor onderzoeksjournalisten in Nederland zich ook vol op de grafische databases storten. Follow the Money is er in ieder geval al druk mee. Smit: “Wij werken sinds kort samen met Indica, een Nederlands softwarebedrijf dat soortgelijke software ontwikkelt. Wij hoeven ons nooit door 2.6 terabyte aan documenten heen te werken, zoals bij de Panama Papers het geval was. Maar ook voor kleinere hoeveelheden informatie gaat deze techniek erg nuttig zijn. Mijn handen jeuken om er binnenkort mee aan de slag te gaan.”

Nieuwsbrief

Ontvang ons laatste nieuws
Hidden
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.