De beste tools (IX): zo vind en verzamel je data

Nieuws |

Journalisten zijn vaak geen bètatypes. Ze houden van taal, niet van cijfers. Maar data en datajournalistiek worden wel steeds belangrijker. Deze tools helpen je bij het vinden, verzamelen en converteren van data.

Statista

Bij Statista vind je open datasets van over de hele wereld. Door een zoekwoord in te toetsen, kun je gemakkelijk een dataset vinden bij een onderwerp. Wil je weten hoe lang moslims wereldwijd vasten? Dat kun je er vinden. Hoe groot de markt is voor afhaaleten in Europese landen? Geen punt. Het aantal smartphonegebruikers van 2014 tot 2020? Zo te downloaden. De simpele datasets zijn kosteloos (na aanmelding). Voor exclusieve content moet je betalen.

Chrome Scraper

Stel, je wilt bijvoorbeeld een overzichtelijke lijst maken van alle politici die de afgelopen tien jaar in de Amerikaanse Senaat hebben gezeten. Die data staan waarschijnlijk verspreid op een website. Scrapen is dan het toverwoord. Het is niets minder dan het geautomatiseerd downloaden van informatie van een site. Je kunt het bijvoorbeeld via Google Spreadsheets doen, maar daar moet je codeerskills voor hebben. Met Scraper heb je die niet nodig. Scraper is een extensie die je kunt downloaden voor Chrome. De extensie haalt de data uit de webpagina en maakt er vervolgens een spreadsheet van.

Tabula

Het Britse Huis van Afgevaardigden maakte jaren geleden 5.500 pdf’s openbaar met de uitgaven van de kamerleden. Een enorme dataset, die The Guardian met behulp van een crowdsource-actie handmatig uitploos. Dat kan nu makkelijker met Tabula. Je kan deze tool downloaden en vervolgens data uit pdf-bestanden simpel omzetten in een CSV- of Excelbestand.

Mr Data Converter

De gevonden of verzamelde data heeft niet altijd het juiste bestandsformaat. Soms heeft je databestand een andere structuur nodig zodat het door een script gelezen kan worden. Of de programmeur waarmee je samenwerkt, wil de data graag in een bepaald formaat hebben. Met Mr Data Converter kun je gemakkelijk bestanden omzetten naar bijvoorbeeld HTML, JSON, Ruby en Python.
Deze tools zijn geselecteerd door Albertine Piels van DigitalStory.Tools, een lijst met de beste 85 tools in 17 categorieën, die journalisten helpen bij het maken van digitale verhalen. DigitalStory.Tools is een initiatief van Hackastory, een community van journalisten, coders en designers.

Nieuwsbrief

Ontvang ons laatste nieuws
Hidden
Dit veld is bedoeld voor validatiedoeleinden en moet niet worden gewijzigd.