Research doen in boeken wordt straks makkelijker met Nesciosearch

nesciosearch

De voor journalisten bestemde boekenzoekmachine Nesciosearch is bijna klaar om door redacties gebruikt te gaan worden. Dit najaar wordt de tool, die vooralsnog gratis is, aangeboden aan verschillende media.

Op zoek naar een Nederlandse expert die boeken heeft gepubliceerd over de Griekse schuldencrisis in historisch perspectief? Weten in welke Nederlandse roman voor het eerst een mobiele telefoon voorkomt? Met de nieuwe zoekmachine Nesciosearch moet dat voor redacties makkelijker worden.

De boekenzoekmachine is gemaakt door Bookarang, een in 2013 opgericht bedrijf dat kunstmatige intelligentie gebruikt om lezers betere boekenaanbevelingen te doen. Het bedrijf werkt samen met enkele boekenverkopers en bibliotheken om lezers te helpen bij het ontdekken van boeken.

In plaats van boeken aan te bevelen op basis van koop- en zoekgedrag van gebruikers, zoals bijvoorbeeld Amazon doet, doet Bookarang met behulp van kunstmatige intelligentie aanbevelingen op basis van tekstuele overeenkomsten. De analysesoftware rangschikt boeken automatisch op inhoudelijke parameters, zoals stemming, gelaagdheid, thema’s en schrijfstijl.

Volledig boekenaanbod

Deze technologie wordt nu ook gebruikt in Nesciosearch. De zoekmachine geeft journalisten voor het eerst de mogelijkheid om het volledige boekenaanbod in Nederland te doorzoeken. ‘Alles wat in Nederland als e-book verschijnt, maken wij doorzoekbaar,’ legt Victor Bergen Henegouwen van Bookarang uit. ‘Daardoor krijgt een journalist opeens toegang tot veel meer bronnen dan eerst.’

De zoekmachine toont alleen zogeheten ‘snippets’ van boeken, het fragment waar het gezochte woord in voorkomt.  Wil een journalist het boek lezen, dan moet die het boek kopen.

Op welke manier verschilt het van wat nu al mogelijk is met Google Books? Bergen Henegouwen: ‘Google Books heeft niet de rechten die wij hebben. Wij hebben afspraken met alle Nederlandse uitgeverijen om hun aanbod te doorzoeken.’

Nesciosearch voegt daarnaast nieuwe zoekmethodes toe, aldus Bergen Henegouwen. ‘In de boekenwereld was het nog niet mogelijk om uitgebreid semantisch te zoeken. In onze zoekmachine kun je bijvoorbeeld aangeven dat je alleen kwalitatief hoogstaande literaire teksten wilt zoeken. Ons algoritme herkent op basis van de plaats en frequentie van woorden welke teksten daar onder vallen.’

Trotski

Ook is het mogelijk om de zoekmachine te laten zoeken naar verwante termen. Als je zoekt naar ‘Stalin’, dan toont de zoekmachine desgewenst ook resultaten van synoniemen als ‘Iosif Vissarionovitsj Dzjoegasjvili’ of aanverwante begrippen als ‘Trotski’.

Bookarang kreeg eind 2016 92.960 euro van het Stimuleringsfonds voor de Journalistiek om de boekenzoekmachine te ontwikkelen. De zoekmachine heette aanvankelijk Backlight, maar is vorig jaar omgedoopt tot Nesciosearch.

Journalisten kunnen al een bèta-account aanmaken voor Nesciosearch. In oktober gaat Bookarang de tool aanbieden bij verschillende redacties. Aanvankelijk zal Nesciosearch gratis te gebruiken zijn, voor later is het idee om een abonnementsmodel in te voeren.

De ontwikkeling van Nesciosearch duurde langer dan gepland. Dat komt doordat de ontwikkeling van de technologie achter Nesciosearch ingewikkelder was dan gedacht, legt Bergen Henegouwen uit. ‘Maar de kinderziektes zijn er inmiddels uit. Nu kunnen we de dienst stapsgewijs aan gebruikers gaan aanbieden.’

Foto: Susan Yin via Unsplash

Over Ernst-Jan Hamel

Ernst-Jan Hamel is freelance journalist en docent aan de School voor Journalistiek in Utrecht.