Kunstmatige stemmen, korte nieuwsbulletins: de journalistieke uitdagingen van voice

voice

‘Voice is de toekomst. We gaan een schermloos tijdperk tegemoet, waarin spraakgestuurde technologie overal in de omgeving is verweven.’ Dat zei futurist Amy Webb onlangs op de GEN Summit in Athene, waar hoofdredacteuren, start-ups en techbedrijven drie dagen lang praatten over de toekomst van de journalistiek. Maar is de journalistiek al klaar voor voice?

Er is nog maar één slimme speaker die Nederlands spreekt: de Google Home. Die is nu ruim een half jaar te koop, en sindsdien heeft ruim 6 procent van de huishoudens er een op de keukentafel of in de woonkamer staan. Naar verwachting blijft dat percentage snel stijgen: de adoption rate of ‘acceptatiesnelheid’ van smart speakers wereldwijd is hoger dan bij smartphones en tablets.

Reden genoeg om eens wat dieper te duiken in de ontwikkelingen van voice op het gebied van journalistiek. In dit eerste deel onderzoeken we met welke uitdagingen mediabedrijven worstelen op het gebied van voice. In deel twee kijken we praktisch hoe we deze vraagstukken kunnen oplossen, aan de hand van de lessen die getrokken worden uit recente experimenten. Tot slot blikken we vooruit: hoe zou de journalistiek eruit kunnen gaan zien als de spraaktechnologie optimaal werkt?

Maar eerst: de uitdagingen. 

Uitdaging 1: Hoe kun je het nieuws goed brengen als je losse stukjes moet aanleveren?

De meeste nieuwsbedrijven maken nu een flash briefing, een kort audiobulletin dat de Google Assistent afspeelt als je vraagt ‘Wat is het laatste nieuws?’. Als gebruiker geef je in de app aan welke nieuwsbronnen jij wilt horen. 

Google en Amazon zien dat liever anders: zij moedigen redacties aan om content in thematische audiofragmenten aan te bieden. Zo kan het algoritme een persoonlijk bulletin samenstellen op basis van de interesses van de luisteraar. Of als je vraagt: ‘Wat is het laatste nieuws over de verkiezingen?’, dan krijg je daar een specifiek fragment over te horen.

Niet alle uitgevers en mediabedrijven zitten hierop te wachten. Lucas Menget, adjunct-directeur van France Info, zei in een panel over voice op de GEN Summit: ‘We willen en gaan niet zomaar knippen in onze content. Een bulletin is redactioneel opgebouwd, de volgorde en de keuzes die we maken, plaatsen het nieuws en de wereld in context. We moeten als uitgevers samen een vuist maken om eigenaarschap te behouden.’

Problemen met filterbubbels en publiek dat zelf hun nieuws bij elkaar shopt, zijn natuurlijk niet alleen aan de orde bij voice-interfaces. Maar ze maken de situatie wel nog urgenter. Van een spraakassistent krijg je namelijk maar één antwoord op je vraag: dat wat het algoritme je voorschotelt.

Uitdaging 2: Hoe ga je om met ‘synthetische’ content?

Stel: Rob Trip vertelt je via een smart speaker het laatste nieuws. Alleen heeft hij het nooit zelf ingesproken: zijn stem is ‘gesynthetiseerd’. Deze technologie wordt steeds beter. Algoritmes hebben maar een klein deel van een opname van je stem nodig om je ‘alles’ te kunnen laten zeggen, in elke taal. 

Dat biedt kansen, want je kunt je publiek via een extra kanaal bedienen, zonder dat het extra tijd kost. Maar de gevaren spreken voor zich: als je Rob Trip alles kunt laten zeggen, hoe weten luisteraars dan straks nog wanneer hij het ‘echt’ is? Als je denkt dat jij het meteen zou herkennen, check dan eens deze ‘gesynthetiseerde’ stem van presentator en commentator Joe Rogan. Aan de andere kant, de Nederlandse kunstmatige stemmen zijn nog niet al te best. Je kunt dit artikel bijvoorbeeld ook beluisteren, maar de auteur van dit artikel houdt het niet langer dan 20 seconden vol om naar zo’n robotstem te luisteren:

Uitdaging 3:  Hoe verdien je er geld mee?

Over een businesscase voor voice in de journalistiek zijn de meningen op de GEN Summit verdeeld. Zo vindt John Saroff, de CEO van Chartbeat, dat de journalistieke sector moet oppassen om niet weer alles gratis weg te geven. ‘Als iemand de speaker vraagt om Yellow Submarine te spelen, verdienen allerlei partijen geld. Er is echt wel een businessmodel. De nieuwsindustrie zou slim genoeg moeten zijn om ook aan die onderhandeltafel te komen waar de muziekbedrijven wel zitten.’

Wat betreft Nic Newman van Reuters is het beter om nu te focussen op loyaliteit van je publiek. Door je (audio)content via spraakassistenten aan te bieden, laat je je publiek zien dat je ook op dat kanaal te vinden bent, en dat wordt gewaardeerd. Tevreden publiek wordt loyaler aan je merk, en is daardoor meer geneigd om te kiezen voor een betaald abonnement. ‘Om echt zelf geld met je content te verdienen, moet het heel onderscheidend en kwalitatief hoogstaand zijn, een ‘blockbuster’. Maar om dat te kunnen produceren moet je eerst de resources hebben. Volgens mij moet de focus meer liggen op het begrijpen van de ontwikkelingen, dan op vandaag geld ermee verdienen.’ 

Foto: Kevin Bhagat 

Over Jolien van de Griendt

Jolien is freelance journalist met een grote voorliefde voor innovatieve vormen van storytelling. Omdat je met een nieuwe vorm vaak een groter of ander publiek kunt bereiken. Ze is co-founder van journalistieke start-up Newschain en werkt aan toepassingen en formats voor Voice in de media.