‘Spraakherkenning gaat het toetsenbord vervangen’

Levert spraakherkenning echt productiviteitswinst op? En zal het toetsenbord op termijn verdwijnen? ‘Denk aan de accountmanager die onderweg zijn gesprek uitwerkt.’

De inzet van spraakherkenning is in opkomst. Steeds meer bedrijven verwerken bijvoorbeeld tekst met spraakherkenningsoftware. Marcel van Duijvenbode, mede-oprichter van IT4Speech schetst de ontwikkelingen van spraakherkenning in de zakelijke markt.

‘Het is op dit moment misschien lastig voor te stellen, maar spraaktechnologie zal op termijn het gebruik van het toetsenbord grotendeels vervangen.’ Zijn bedrijf levert onder meer spraakherkenningsoplossingen aan advocatenkantoren en artsen. Die programmatuur zet gesproken woorden om in een digitaal tekstbestand.

Spraaktechnologie steeds beter

Spraaktechnologie – een verzamelterm voor ict-toepassingen waarmee taal wordt omgezet in tekst en vice versa – bestaat al langer. Maar de toepassingen maken de laatste jaren een enorme stroomversnelling door.

‘De software verbetert en hardware wordt sneller. Daardoor kunnen gesproken woorden realtime omgezet worden in tekst. Ook wordt spraaktechnologie steeds vaker gebruikt om apparatuur aan te sturen met gesproken commando’s.’

Daar komt bij dat de opkomst van spraaktechnologie onder consumenten bijdraagt aan het succes ervan in de zakelijke omgeving. ‘Apple maakt bijvoorbeeld gebruik van spraakherkenningssoftware Siri voor het aansturen van smartphones en tablets, en ook navigatieapparatuur van auto’s is met de stem te bedienen. Het wordt steeds meer vanzelfsprekend om de stem te gebruiken in plaats van het toetsenbord.’

Compactere apparatuur

Wat ook meespeelt is dat devices steeds kleiner worden. Zo beschikken tablets en smartphones over kleine toetsenborden die zich niet lenen om lange teksten uit te schrijven. Daardoor zal aansturing met spraak toenemen. ‘Door spraaktechnologie wordt het gemakkelijker en efficiënter om die devices te bedienen.’

Fonemen, stemprofiel en lexicon

Maar hoe werkt spraakherkenning eigenlijk? Van Duijvenbode: ‘Spraakherkenningssoftware maakt op basis van algoritmen een vergelijking tussen de ingesproken klanktonen (fonemen), het maatwerk stemprofiel en het lexicon (woordenlijst). De fonemen worden geanalyseerd en vergeleken met het achterliggende lexicon (woordenlijst), vervolgens wordt de grammatica op de juiste manier toegepast en verschijnt de tekst op het scherm.’

Lage foutmarge door stemherkenning

Sommige zakelijke leveranciers beloven een herkenningsgraad van 99 procent. Van Duijvenbode legt uit dat om die kleine foutmarge van slechts 1 procent te halen de gebruiker van de software vooraf een stemprofiel aanmaakt om herkenning te optimaliseren.

‘Bij zakelijke toepassingen van spraakherkenning ligt de foutmarge stukken lager. Aan de hand van een standaardtekst die wordt ingesproken door de gebruiker wordt een profiel opgebouwd van zijn specifieke klanken en uitspraak van lettercombinaties die passen bij zijn stem. Daarmee wordt de nauwkeurigheid sterk vergroot. Bij consumententoepassingen van spraakherkenning ligt de herkenningsgraad vaak veel lager omdat daar geen gebruik wordt gemaakt van het persoonlijke stemprofiel.’

Jargon in alle applicaties

Voor specifieke beroepsgroepen zoals artsen en advocaten wordt een speciaal lexicon geleverd naast de standaardwoorden zodat het programma ook jargon herkent. Die vaktermen kunnen sowieso aan de woordenlijst worden toegevoegd.

Van Duijvenbode: ‘Een voorbeeld van een sector waar spraakherkenning veel wordt toegepast is de advocatuur. Processtukken, pleitnota’s en dergelijke worden uitgesproken en de software zet die woorden om in tekst. Met spraakherkenning is het mogelijk om direct in alle applicaties in te spreken, zoals: Outlook, Word en CRM.’

Geen typist meer nodig

Ook artsen en medici gebruiken steeds vaker spraakherkenningssoftware. Voorheen sprak een radioloog de uitslagen van een mri-scan in op een opname-appaat en die tekst werd later door een typist uitgewerkt. Nu kunnen uitslagen en verslagleggingen met de juiste koppelingen direct in het juiste veld in het elektronisch patiëntendossier worden ingevoerd zonder dat daar een toetsenbord aan te pas komt.

Productiever en goedkoper

‘Spraakherkenning komt de productiviteit ten goede’, zegt Duijvenbode. ‘Volgens experts gaat het creëren van documenten via spraakherkenning 3 keer sneller dan met typen via het toetsenbord. Bovendien scheelt het ook in de kosten. In zowel de zorg als de advocatuur zijn de uurlonen van specialisten relatief hoog. Doordat ze minder tijd kwijt zijn met het uittypen van verslagen kunnen ze hun tijd besteden aan zorgtaken en wordt werktijd efficiënt benut.’

Productief zonder scherm

Naast toepassingen waarbij gesproken tekst direct wordt omgezet in een tekstbestand zijn er ook toepassingen waarbij dat later gebeurt. Van Duijvenbode: ‘In de zakelijke dienstverlening zie je dat account- en salesmanagers de toepassing van spraakherkenning vooral gebruiken om productief te zijn op momenten dat ze geen scherm voor zich hebben.’

‘Ze kunnen bijvoorbeeld onderweg tussen twee afspraken in de auto via een headset memo’s opnemen. Die gesproken informatie wordt verwerkt naar een tekstbestand en toegevoegd aan het klantprofiel. De binnendienst kan direct opvolging geven als dat nodig is.’

Toekomst meer mogelijk

Van Duijvenbode verwacht dat bij zakelijke toepassingen binnen vijf tot tien jaar spraakherkenning grotendeels het toetsenbord heeft verdreven. ‘Maar voor het zover is, zijn er nog wel stappen te zetten. ‘Nu moet je bijvoorbeeld duidelijk spreken voor een hoge herkenning. Maar naarmate de software verder ontwikkelt en er steeds meer data geanalyseerd wordt zal de werking steeds beter worden.’

‘Ook bij bijvoorbeeld dialecten of onduidelijk spreken. En wat te denken van het uitschrijven van meerdere stemmen die gelijktijdig spreken? Zo kan op termijn bijvoorbeeld voor het uitwerken van een vergadering spraakherkenning worden ingezet.’

Voor nu is er al veel productiviteitswinst te behalen. Voor de accountmanager die onderweg in de auto al het verslag uitwerkt, de arts en advocaat die geen typist meer nodig hebben. En voor de gemiddelde kantoormedewerker die dagelijks veel tekst verwerkt in Office-applicaties.

Lees ook