Hoe kunnen we de juiste documenten vinden met AI?

door | aug 6, 2020

Leestijd: 6 minuten

Hoe kunnen we AI inzetten om documenten sneller boven tafel te krijgen?
Het blijkt dat er in de besluitvorming gebruik wordt gemaakt van diverse (interne) stukken en van diverse programma’s, waaronder Microsoft Teams en het Document Management Systeem (DMS). Deze documenten zijn niet altijd te terug te vinden vanwege de grote hoeveelheden. Dit is niet bij de Sociale Verzekeringsbank alleen zo maar ook bij andere overheidsorganisaties.

Vindbaarheid vergroten

Daarom willen we de vindbaarheid vergroten van interne documenten. Dit zijn documenten die niet primair worden gebruikt voor en met klanten. Dit wil nog niet zeggen dat je vervolgens in alle documenten kan. Indien je rechten hebt, dan kun je vervolgens ook in het betreffende document. Het uiteindelijke doel is om de besluitvorming te versnellen aan de hand van de beschikbaarheid van data. Dus de voorgaande informatie van vergaderingen is sneller en überhaupt beschikbaar.

Wat hebben we gedaan?

We zijn hiervoor aan de slag gegaan door eerst te onderzoeken wat voor een type (.doc, .xls, etc) en soort documenten (besluiten, verslagen) er beschikbaar zijn. Op deze documenten wordt vervolgens metadata toegevoegd. Uit onderzoek is gebleken dat van de 13 miljoen bestanden op een opslaglocatie binnen de SVB, een groot gedeelte uit notulen in Word formaat (.doc) bestaat. Juist deze bestanden lenen zich goed voor concept extractie. Dit betekent dat de kern van het document in kernwoorden wordt uitgedrukt. Deze kernwoorden worden dan toegevoegd aan de metadata van het bestand. Metadata kan je zien als een post-it op een document met daarop bondige informatie over het document. Met bijvoorbeeld Teams of DMS kan dan gezocht worden in de metadata van die bestanden om het bijbehorende document op te halen.

Hoe hebben we het gedaan?

Wij hebben eerst onderzocht hoe we dit het beste en snelste konden doen en zijn zo bij de startup Textgain uitgekomen. Deze startup heeft eigen technologie. Deze bleek hier uitermate goed voor geschikt en samen zijn we aan de slag gegaan. De eerste fase in ons AI traject is het toevoegen van metadata aan deze documenten. Om AI te kunnen trainen, moeten we data gebruiken van echte vergaderingen en dus ook echte documenten. Hier liepen we wel tegen de privacy grenzen aan. Vervolgens zijn we gestart met het bouwen van een PoC (Proof of Concept). We hebben hiermee getest of het technisch haalbaar is. Tot slot hebben we met Mendix een app gemaakt die gebruik maakt van het concept extractie algoritme van TextGain. Hiermee konden we concept extractie op een tekst toepassen.

Kracht van startups gebruikt

Door de kracht van de startup optimaal te gebruiken konden we snelheid krijgen in dit traject. We hoefden immers niet zelf iets te bouwen maar konden snel via een API de textanalyse van Textgain gebruiken.

Voor wie hebben we dit gedaan?

In eerste instantie hebben we dit experiment opgezet voor de managers en de staf, maar op termijn moet het beschikbaar zijn voor alle SVB collega’s.

Bekijk het resultaat zelf in de demo

De demo kun je zelf bekijken en uitproberen. Voer een eigen stuk tekst in, als resultaat zie je eronder de kernwoorden die uit je stuk tekst zijn gehaald. Met de zoekfunctie kun je met je kernwoord je ingevoerde tekst terugvinden. Deze werking laat het zoeken in metadata zien. Het kan zijn dat de demo bij veelvuldig gebruik niet goed werkt, probeer het morgen dan opnieuw.

Hoe zit het met de Privacy?

Het beschermen van persoonsgegevens in combinatie met het trainen van echte data is een uitdaging. Daarom hebben wij ervoor gekozen om documenten te gebruiken zonder directe klantgegevens. In de documenten waar we wel mee zijn gaan werken, hebben we in ieder geval de namen uit gehaald.

En nu verder?

We gaan nu verder met het bouwen van een MVP (Minimum Viable Product). Dit is het programma in zijn meeste basale vorm, een eerste versie, die meteen ingezet kan worden. Door het ophalen van feedback van de werking van deze MVP, kan er verder gebouwd en verbeterd worden. Als ultiem einddoel willen we door het gebruik van AI, de bureaucratie verminderen.
De eerste stap is de aanwezige informatie beschikbaar maken, zowel voor mensen als AI. Een tweede stap is het verbinden van de informatie met elkaar, waardoor de AI een proactieve rol kan aannemen. Bijvoorbeeld wanneer er in notulen over een bepaald besluit wordt gesproken in termen van deadlines, betrokken collega’s, etc. De beschikbare data kan door het gebruik van AI verbonden worden aan zowel degene die de data nodig heeft als ook de opsteller van het besluit. Een andere nog te ontwerpen mogelijkheid is een notificatie. Jij wordt met een bericht op de hoogte gesteld (en tevens herinnert) van de nog te ondernemen actie(s) om de deadline te halen.
Tot slot een mogelijke derde stap in dit AI project kan zijn dat AI zelf de acties gaat ondernemen om de deadline te halen. Zo worden de collega’s ontlast en de burger wordt uiteindelijk sneller geholpen.

Een voorbeeld van hoe nu een vergadering loopt en hoe de deelnemers hier aan de informatie komen: er is een meeting gepland, vervolgens krijg je kort voor aanvang de agenda exclusief de achterliggende stukken en besluiten (vaak weet je niet waar je die achterliggende stukken vandaan moet halen en dit moet dan ook nog vaak binnen een zeer kort tijdsbestek). Het gevolg is dat je onvoldoende voorbereid aan een meeting start waardoor er soms zelfs een nieuwe meeting moet worden gepland om tot een gedegen besluit te komen.

Vragen?

Mocht je na het lezen nog een inzicht willen delen die wij wellicht gemist hebben, geef dit dan rechtstreeks aan ons door. We delen deze opgedane inzichten om je mee te nemen in het vervolg van ons AI experiment. Dit om uiteindelijk effectiever tot besluiten te komen, voor nu en in de toekomst!

Werk met ons samen aan deze uitdaging

13 + 15 =

Deel dit artikel