Tien jaar Data School, het onderzoeksplatform dat bijdraagt aan journalistieke onthullingen

Nieuws | Vernieuwing

De Data School van de Universiteit Utrecht maakte samen met de Groene Amsterdammer spraakmakende verhalen, bijvoorbeeld over de haat die vrouwelijke politici online te verduren krijgen en over de risico’s van eetstoornisvideo’s op TikTok. Al tien jaar is het onderzoeks- en onderwijsplatform een samenwerkingspartner van media, bedrijven en overheden. ‘Zowel data gebruiken in de praktijk, als kritisch reflecteren op de impact hiervan op de samenleving. Dat is de Data School.’

‘Tien procent van alle tweets gericht aan vrouwelijke politici is haatdragend of agressief,’ concludeerden journalisten van de Groene Amsterdammer in maart 2021. Om tot deze ontdekking te komen analyseerden ze met behulp van kunstmatige intelligentie ruim 330.000 tweets. Ze trainden een AI-taalmodel – liefkozend ‘RoBERTa’ genaamd – om tweets te herkennen als ‘agressief’ of ‘haatdragend’. Het leidde tot een veelbesproken artikel, dat afgelopen jaar werd bekroond met een Tegel.

Nu zit het trainen van AI niet in het repertoire van de gemiddelde journalist. Het was dan ook dankzij een samenwerking met wetenschappers van de Data School (tot voor kort: Utrecht Data School) dat de journalisten van de Groene deze mega-analyse voor elkaar kregen.

Met dit soort samenwerkingen maakte de Data School de afgelopen tien jaar naam. Naast de eigen wetenschappelijke projecten werken de onderzoekers van de Data School samen met bedrijven, overheden en media, bijvoorbeeld aan het analyseren van online discussies of het ontwikkelen van ethische richtlijnen voor het gebruik van data. In de woorden van Mirko Schäfer, een van de oprichters: ‘Zowel data gebruiken in de praktijk, als kritisch reflecteren op de impact hiervan op de samenleving. Dat is de Data School.’

Geldnood

De samenwerking tussen wetenschap en praktijk werd uit geldnood geboren. Rond 2013 wilde mediawetenschapper Schäfer aan de slag met de data die op sociale media te vinden zijn. ‘Hoeveel likes heeft iemand? Hoeveel volgers? Welke netwerken communiceren met elkaar? Dat was allemaal relevante kennis die wij mee wilden nemen in ons wetenschappelijk werk, maar wij wisten niet hoe dat werkt,’ vertelt Schäfer. Binnen de universiteit was geen geld beschikbaar om deze kennis te vergaren. ‘Toen ontstond het idee om partners te zoeken die behoefte hadden aan data-analyses.’

En die vonden ze snel. In de eerste helft van 2013 werkte de Data School samen met Unicef, het Ministerie van Infrastructuur en Milieu en een onderzoeksbureau. Tegen een vergoeding trainde de Data School studenten in de basics van data-analyse, waarna deze voor de organisaties een project uitvoerden, zoals sociale media- en netwerkanalyses. Het hielp dat bedrijven geen duidelijke opdrachten hadden klaarliggen, vertelt Karin van Es, mediawetenschapper en een van de leidinggevenden van de Data School. ‘Dit was nog in de tijd dat bedrijven iets met data wilden, maar niet wisten wat er mogelijk was. Bedrijven waren zelf ook gewoon nieuwsgierig.’ Zowel docenten als studenten kregen de ruimte om uit te vogelen wat je allemaal met data kunt doen.

We komen niet binnen als wetenschappers met een enquête, maar als experts met gereedschap

Sinds die tijd werkte de Data School samen met uiteenlopende partijen, van ministeries en gemeenten tot bedrijven en ngo’s. Tegenwoordig weten de meeste organisaties een stuk beter wat ze met data willen, maar dat betekent niet dat de Data School wetenschap-op-bestelling levert. Het onderwijs- en onderzoeksplatform gaat alleen met partners in zee die echt samen iets willen onderzoeken. ‘Zo krijgen wij meer inzicht in het veld dat we bestuderen,’ zegt Schäfer, en dat geeft de onderzoekers weer nieuwe inspiratie voor hun eigen wetenschappelijke werk. ‘Wij komen niet bij organisaties binnen als wetenschappers met een enquête, maar als experts met gereedschap. En gaandeweg krijgen we inzicht in hun werkwijze en geplande en gefaalde projecten.’

Na verloop van tijd wisten ook mediaorganisaties de school te vinden. Zo ging de Data School begin 2019 voor KRO-NCRV aan de slag. De omroep was op zoek naar nieuwe manieren om haar prestaties te meten, aangezien de kijkcijfers en ledenaantallen die ze hier van oudsher voor gebruikte steeds minder belangrijk werden. En recent heeft de Data School voor het AD tweeënhalf jaar corona-berichtgeving geanalyseerd. ‘Bij de krant wilden ze hierop terugblikken. Ze wilden bijvoorbeeld weten of ze vooral het overheidsbeleid hadden gevolgd, of ook zelf thema’s geagendeerd hadden,’ vertelt Van Es. ‘En welke sprekers werden aangehaald in hun artikelen. Vooral politici en OMT-leden, zo bleek, en dat levert niet per se kritische verhalen op. Over dit soort bevindingen kunnen ze op de redactie weer nadenken.’

Kruisbestuiving

Aanvankelijk was de samenwerking met de media dus vooral gericht op het onderzoeken van de mediapraktijk, maar de laatste jaren is het platform ook zelf journalistiek onderzoek gaan doen, samen met de Groene Amsterdammer. Dit leverde spraakmakende verhalen op, over onder andere eetstoornisvideo’s op TikTok, coronacomplotten op sociale media en boerenprotesten op TikTok.

Inmiddels is de samenwerking zo structureel dat promovendus Joris Veerbeek twee dagen per week op de redactie van de Groene werkt en drie dagen op de Data School. Samen met Eva Hofman, tech-redacteur bij de Groene Amsterdammer, gebruikt hij AI om grote hoeveelheden tweets, video’s en andere data te analyseren. Veerbeek: ‘Ik ontwikkel voor de Groene technieken die relevant zijn voor journalisten, en voor mijn proefschrift bestudeer ik hoe redacties en redacteuren omgaan met die technieken en andere vormen van kunstmatige intelligentie.’

Hofman vindt het een prettige kruisbestuiving. ‘Als ik in het veld reportages maak en interviews afneem, krijg ik vaak allemaal ideeën en ontwikkel ik hypotheses over het thema. En als Joris de data induikt en tot dezelfde ideeën of vermoedens komt, dan verstevigt dat het onderzoek.’ Dit gebeurde bijvoorbeeld bij het stuk over eetstoornisvideo’s op TikTok: ‘Mensen uit de medische wereld vertelden ons hoe je stapsgewijs een eetstoornis ontwikkelt. Joris zag vervolgens gelijkenissen met hoe een fuik werkt op TikTok.’ Net zoals een eetstoornis van kwaad naar erger gaat, krijgen TikTok-gebruikers ook steeds extremere video’s voorgeschoteld. ‘Dat je dat kunt laten zien, werkt goed in een verhaal.’

Verantwoorden wat je doet

Om het wetenschappelijke gehalte van de data-analyses op peil te houden, schrijft Veerbeek bij iedere publicatie een uitgebreide verantwoording waarin hij onderzoekskeuzes uitlegt. ‘Soms hebben we onderling discussies: noemen we dit groepje mensen op Twitter complotdenkers of niet? Dan wijden we een alinea aan een verantwoording van onze keuze. Zodat mensen zelf kunnen uitmaken of ze het er mee eens zijn.’ Veerbeek merkt dat hij weinig kritiek krijgt op de methodiek, ondanks dat de artikelen vaak over gevoelige onderwerpen gaan, en volgens hem heeft dat te maken met de verantwoordingen. ‘Als je iemand een stuk van een paar duizend woorden stuurt waarin je uitlegt hoe je het hebt gedaan, is de discussie meestal wel klaar.’

Foto: Data School

Nieuwsbrief

Ontvang ons laatste nieuws
Hidden
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.