Voice gaat het internet veranderen
Inhoudsopgave
Een van de onderwerpen waar bij Novum prominent aandacht wordt gegeven is de Voice technologie van (o.a.) de Google Assistent. Wij vroegen onze collega Jeroen Vonk ernaar:
Hoe Project Zilver duidelijk maakt dat online dienstverlening helemaal anders moet
Gewoon praten met de computer. Sinds kort kan het met bijvoorbeeld de Nederlandstalige versie van Google Assistent. Die werd eind 2018 gepresenteerd. “Voor mij was dat het moment om de spraakmogelijkheden te gaan verkennen voor de Sociale Verzekeringsbank. Hoe mooi zou het niet zijn als je gewoon aan de computer kunt vragen wanneer de kinderbijslag wordt gestort, of hoe je AOW kunt aanvragen?”
Nu, een jaar nadat we de eerste experimenten begonnen, weten we meer: om van spraaktechnologie een succes te maken moet het web heel anders worden ingericht. Het werkt alleen als je duidelijke, menselijke antwoorden kunt geven op vragen. De komende jaren staan dus in het teken van ‘Voice first’, of eigenlijk: ‘human first’.
Hoe zijn we tot deze uitkomst gekomen? Achteraf gezien lijkt het simpel. We zijn begonnen te denken vanuit de oudere doelgroep van de Sociale Verzekeringsbank: ontvangers van AOW. En hoe we die via een voice-assistant van dienst kunnen zijn.
Ouderen gaan niet voor
Jongere mensen, dus mensen van onder de 65, kunnen al mee met de meeste nieuwe technologie. Ze gaan makkelijker om met computers en overheidsdiensten. Ze snappen ook beter hoe ‘voice’ werkt. Als je dus iets gaat doen voor mensen die kinderbijslag ontvangen, dan is dat voor niemand een echte uitdaging. Iets voor ouderen doen is uitdagender, juist ook omdat die doelgroep heel vaak wordt overgeslagen.
‘Voice’ kan voor ouderen die afgeschrikt worden door toetsenborden of icoontjes op aanraakschermen een uitkomst zijn. Gewoon iets vragen, zonder ingewikkelde codes of toetscombinaties in te voeren, of submenus en tabbladen te hoeven aanklikken. Dat wil iedereen, maar ouderen zeker.
In de voorbereiding van ons experiment kwam ik erachter dat we nauwelijks wetenschappelijke kennis over deze groep hebben. Onderzoeken in Amerika die met ouderen waren gedaan, bleken te gaan om mensen tussen de 50 en 55 jaar oud. Dat zijn geen oudere mensen. Oudere mensen zijn de mensen die met pensioen zijn en die niet meer volledig aan het arbeidsproces deelnemen. Mensen die aansluiting missen op de nieuwe wereld.
Iedereen heeft zo’n buurvrouw
Als ik andere bedrijven vertelde over dit onderzoek, zeiden ze: ‘mensen van bóven de 65? Maar dat is toch heel lastig? Die willen dat toch helemaal niet?’ Als ik dan doorvroeg, bleek dat ze ook dachten dat ouderen dat helemaal niet meer kónden. Maar mensen van 65 hebben waarschijnlijk hun halve leven op een steeds moderner kantoor gezeten. Ze hebben met computers leren omgaan, de opkomst van de smartphone meegemaakt. Dus: hoe kom je erbij dat het niet gaat?
Dan blijkt dat Iedereen altijd wel een buurvrouw heeft, een personage dat voldoet aan hun beeld om het niet te hoeven doen. Ik ken natuurlijk ook mensen die niks met digitalisering te maken willen hebben. Die hebben bijvoorbeeld in de winkel gestaan, de kassa digitaal zien worden en die hoeven dat nu allemaal niet meer, die willen gewoon een krant lezen. Prima.
Maar zo ziet de wereld er niet meer uit. Inmiddels heeft, mede dankzij onze bevindingen, ook Google ervoor gekozen om de mensen van boven de 55 serieus in onderzoeken mee te nemen.
Geen praktijkvoorbeelden
De technologie rond spraaktoepassingen, kort gezegd: voice, is nog zo vers dat er eigenlijk nauwelijks praktijkvoorbeelden zijn te vinden. Daarom zijn we eerst zelf met een onderzoek naar bruikbare tools begonnen. We hebben uiteindelijk een hele simpele Google action, zeg maar een Voice-app, gemaakt met Dialogflow, een gratis tool van Google. Met deze Voice app kon je vragen wat een bepaalde regeling van de SVB was, hoe je ervoor in aanmerking komt en het belangrijkste: op welke datum het geld wordt gestort. Met deze demonstratie konden we de interne stakeholders bij de SVB inspireren om ons onderzoek verder te brengen.
De app bleek al snel niet geschikt om mee verder te gaan. Hij werkte met een vrij simpele boomstructuur: een vraag leidt tot een beperkt aantal mogelijke antwoorden, die weer tot andere vragen en antwoorden leiden. maar dat is niet voldoende voor de problemen die we wilden oplossen.
Tijdens onze zoektocht naar praktijkvoorbeelden kwam ik steeds vaker de naam Maarten Lens-Fitzgerald tegen. Hij is voice specialist en altijd bezig met nieuwe media. Hij had al intensieve contacten met Google en tijdens onze gesprekken sloten ook Anbo en Achmea zich aan.
We besloten tot samenwerking en formuleerden een gerichte onderzoeksvraag. Het accent moest minder op hulp komen te liggen: Mensen moesten het dagelijks gaan gebruiken, voor hun gemak, dus ook ook gewoon vragen stellen over het weer of de treinverbinding naar Amersfoort.
Onze droom was helder: hoe mooi zou het zijn als organisaties diensten zouden aanbieden die aansluiten bij de behoefte van ouderen. Dan zouden de meer op zorg gerichte toepassingen vanzelf landen. Hiermee was Project Zilver geboren.
Project Zilver
Na een eerste scoping-sessie, waarin alle betrokken partijen kennis maakten en hun wensen uitspraken en doelen formuleerden, gingen we aan de slag. We gebruikten daarvoor alle moderne technieken en werkvormen, zoals Design thinking, Google Design Sprint en Lean Startup. Belangrijkste kenmerk: zo snel mogelijk van idee naar praktijk.
Eerst moesten we de kwestie van de doelgroep oplossen: hoe goed kenden we die? Zoals ik hiervoor al aangaf is er bitter weinig onderzoek gedaan naar mensen van boven de 65. We hadden dus niets anders dan aannames.
Onder aanvoering van de ANBO hebben we daarom onderzoek gedaan naar wat voor technologie ouderen nu al gebruiken, of ze hun stem daar nu al bij gebruiken en of ze mee wilden doen in een experiment met een Google Home. Uiteindelijk kregen we 3450 enquêtes terug. De resultaten waren verrassend: driekwart (74%) van de ondervraagde 60-plussers gebruikt een smartphone. Iets minder, ruim tweederde, gebruikt ook slimme technologie in huis, zoals een slimme meter of een smart tv.
Intelligente thermostaten en audiosystemen als Chromecast en SONOS waren minder bekend. Eenvijfde van de ondervraagden paste al met enige regelmaat stembesturing toe, bijvoorbeeld in de auto.
In de enquête vroegen we ook naar wat mensen voor verwachtingen hadden bij spraaktechnologie. Daar kwamen zeer uiteenlopende reacties op, zoals het gebruik voor routeplanning, het opzoeken van informatie, wekkers en herinneringen, deuren bedienen of mails openen en beantwoorden. Hele praktische zaken dus.
Uitpakken: niet allemaal tegelijk
Een van de vragen in de enquête was of men wilde meedoen aan een praktijktest met een Google Home. Daarvoor meldden zich 250 mensen aan, waaruit we er 14 hebben gekozen. Tijdens een bijeenkomst met deze 14 ouderen hebben we uitgelegd wat een Google Home is, hoe die gebruikt kan worden en deze ook samen geïnstalleerd.
Dat leverde interessante dingen op. Zo kwamen we erachter dat één Google Home installeren best gaat, maar dat het problematisch wordt als je er meer wilt doen in dezelfde ruimte. Nu zal dat in de praktijk niet vaak gebeuren, maar voor deze test gold dat wel. Dat had Google zich niet gerealiseerd. Op zo’n speaker staat een nummer, en dat nummer kan je zonder vergrootglas niet lezen. Het is wel het nummer dat de Home uniek maakt. Op het moment dat je hem gaat installeren met de Google Home App, komt jouw Google Home in beeld. Met één is dat makkelijk, maar heb je er meer dan één weet je niet welke het is. Is het 36669 of 34789? Wij hadden er zes in de lucht. Dan kun je wel op een knopje drukken en dan klinkt er geluid, maar welke is nu gaan spelen?
De truc is: eentje installeren, van de stroom af halen, de app afsluiten, en dan pas de volgende. Zoiets moet dus in de handleiding komen, zoals dat wel al gebeurt bij de slimme lampen van Ikea. Dat zijn inzichten die je alleen in de praktijk opdoet. Maar dan nog: er was ook een mevrouw bij, die de verpakking zonder omhaal openscheurde en niet naar de gebruiksaanwijzing keek: ‘zo doe ik dat altijd’, zei ze. Daar moet je dus ook rekening mee houden.
Technisch is alles mogelijk, inhoudelijk nog niet
Wat bleek uit de test is dat deze mensen wel degelijk goed kunnen omgaan met nieuwe technologie, maar dat ze wel heel veel mogelijkheden missen als ze spraak gebruiken. De techniek had lang niet op alle vragen antwoord. Veel informatiebronnen zijn nog niet toegankelijk via voice. Als je nu een vraag stelt over een gemeente of over de SVB, dan krijg je niet het gewenste antwoord van de SVB. Je krijgt op zijn best een antwoord waarvan je zeker weet dat het niet kan kloppen.
Technisch is alles mogelijk. We kunnen een voice applicatie maken en voor de antwoorden de website van de SVB als bron gebruiken. Probleem is alleen dat de gemiddelde website niet geschreven is om voorgelezen te worden. Je kunt hem wel laten voorlezen, dat is bij ons bijvoorbeeld al ingebouwd, maar bij zo’n test kom je erachter dat de teksten ongeschikt zijn voor zo’n praktische toepassing.
We hebben vervolgens zelf antwoorden geformuleerd, maar de mensen vonden die antwoorden, die al heel kort waren, nog veel te lang. Die moesten we dus veel korter maken. De stelregel van Amazon en Google is dat een antwoord in één adem gezegd moet kunnen worden. Maar een adem van wie? Een adem van iemand van 65 is korter dan mijn adem. Dus moet je er ook rekening mee houden dat je buiten adem bent als je gaat oefenen en dan je antwoord inspreekt.
Wie kun je nog vertrouwen?
We hebben onze Voice app met AOW vragen ook uitgebreid getest. Daar kregen we als reactie: ‘Het antwoord zal wel kloppen, want ik vertrouw jullie wel.’ Als we dan vroegen waarom ze ons vertrouwden, kregen we terug: ‘Jullie zijn van de overheid, dus ik moet je wel vertrouwen. Als ik jullie niet kan vertrouwen, wie anders?’. Er waren ook mensen die zeiden: ‘Ik moet er nu een kladblok bij pakken om aantekeningen te maken, want het is te veel informatie.’ En dan hebben wij in onze ogen simpele antwoorden gegeven. De meeste mensen begrepen ook niet dat je de Voice app moest aanroepen met “Praat met SVB”, hoe moet iemand nou weten dat je bij de SVB moet zijn?
We zijn toen gaan kijken of we het konden optimaliseren via voice-search, dus dat je zoekresultaten kunt krijgen via spraak. Toen bleek dat het antwoord dat je wilde geven van te voren helemaal uitgeschreven moest worden, waarbij je er rekening mee houdt dat iemand het alleen maar hoort. Dus, als iemand de vraag stelt: ‘wanneer wordt de kinderbijslag gestort?’ dan wil die alleen maar horen: ‘De kinderbijslag komt op 23 april.’ en niet: ‘De Sociale Verzekeringsbank is verantwoordelijk voor het storten van de kinderbijslag. Dat doen zij op 23 april, 22 juli en 24 oktober. Wanneer het op uw bank staat, hangt af van uw bank. Mocht u het niet op tijd ontvangen, kunt u contact met ons opnemen. Kijk daarvoor op onze contactpagina…’ en ga zo maar door. Dan is de vraagsteller helemaal kwijt wat is verteld en weet hij niet dat het op 23 april komt. Het probleem is dat al onze websites vol staan met dat soort antwoorden.
Voice: alles moet anders
De komst van Voice-technologie maakt een nieuwe manier van denken over websites noodzakelijk: Voice First: eerst vanuit spraak. Als je het nog verder doortrekt is het eigenlijk ‘Humans First’.
Dit komt door de manier waarop Google zoekt naar antwoorden. Google heeft een hele grote database: de Knowledge Graph. Daar staat alle informatie in die Google uit bestaande bronnen haalt. Ze kiezen dat op basis van belang voor de gebruikers en dat wordt weer bepaald aan de hand van hoe gebruikers erop klikken, wat ze lezen, waarop ze verder gaan. Als de SVB ook in dat bronsysteem wil komen, kijkt Google eerst naar het aantal bezoekers. Met 10.000 bezoekers per dag is het voor de zoekmachine niet interessant. Wikipedia heeft er bijvoorbeeld wel 10.000 per minuut. Daarom neemt Google de informatie van Wikipedia wel op, maar die van de SVB niet.
De SVB moet dus met een andere oplossing komen. Die ligt in het herstructureren van de website. Als je nu bijvoorbeeld aan Google vraagt hoe ver het is van de aarde naar de maan, dan kijkt google eerst of ze het antwoord in de Knowledge Graph hebben staan. Staat dat er niet, dan zoeken ze in de gewone zoekresultaten naar het meest aannemelijke antwoord. Vervolgens zal Google Home dat oplezen. Om ervoor te zorgen dat de SVB een vraag over de diensten van de SVB via Google Home beantwoordt, moet de SVB de eigen website herstructureren. Die moet zo zijn dat het meest relevante antwoord op de vraag van een gebruiker, dus bijvoorbeeld, wanneer de Kinderbijslag wordt overgemaakt, direct door Google wordt gevonden.
Niet meer zenden, maar luisteren
Ik denk dat binnen nu en twee jaar de website geoptimaliseerd is voor spraaktoepassingen, zodat op de vraag: ‘hoe kan ik aow aanvragen?’, het antwoord luidt: ‘Op de website van de SVB staat: aow aanvragen doe je in deze stappen. Wil je dat nu gaan doen?’. Als je dan ja zegt, wordt je in de applicatie van de SVB meegenomen.
Feitelijk hoef je helemaal niet meer naar een website te gaan voor dit soort informatie: je komt via Voice waar je wilt zijn. Daar gaan we naartoe. Wat ga je dan nog met een website doen? We focussen nu te veel op het zenden van de informatie. Ga eerst maar eens aan de mensen vragen welke informatie ze eigenlijk willen.
Daar ligt een opgave, ook voor de SVB en andere onderdelen van de overheid.