Taal- en Spraaktechnologie

Sprekende en luisterende computers, het lijkt iets voor in een goede sciencefictionfilm. Toch is de kans groot dat je ze al weleens bent tegengekomen. Als je belt naar de bank bijvoorbeeld. Of in het navigatiesysteem in je auto. Ook met geschreven taal kan de computer steeds beter uit de voeten.

door

Taal- en spraaktechnologie ligt op het kruisingsvlak tussen ICT en Taalwetenschap. Zolang als er computers bestaan, doen wetenschappers al pogingen om deze taal- en spraakvermogen bij te brengen. Taaltechnologen proberen de computer een taal te leren begrijpen en zelf correcte taal te laten produceren. En spraaktechnologen willen de computer spraak leren verstaan en zelf goed verstaanbare spraak laten produceren. Vaak werken ze samen om tot nóg betere resultaten te komen.

Taal of spraak?

Mond

Taal en spraak lijken voor veel mensen precies hetzelfde te zijn. Als je er langer over nadenkt zijn er echter duidelijke verschillen te ontdekken. Taal is een menselijk communicatiesysteem waarmee we gedachten en gevoelens kunnen uiten. We kunnen deze talige boodschap opschrijven, zodat anderen, die dezelfde taal geleerd hebben als wij, het kunnen lezen en begrijpen. Spraak is een andere, akoestische uitingsvorm van onze talige boodschap. Als we spreken ‘verklanken’ we onze talige boodschap.

Een taal kan prima bestaan zonder spraak. Denk bijvoorbeeld maar eens aan gebarentaal: deze kun je niet spreken, maar het is wel een volwaardige taal. Spraak kan echter niet bestaan zonder taal. Als de klanken die je met je mond vormt geen talige boodschap bevatten, zijn het niet meer dan uitgestoten klanken.

De computer in de schoolbanken

Er zijn grofweg twee manieren te onderscheiden waarop wetenschappers een computer taal en spraak kunnen leren. De eerste manier is een regelgebaseerde methode. Hierbij krijgt de computer alle woorden en grammaticaregels van een taal aangeleerd. Ook leert hij nauwkeurig de akoestische kenmerken waaraan spraakklanken moeten voldoen. Op basis van al deze feitjes en regels kan de computer zelf met taal en spraak aan de slag. In de praktijk pakt deze methode meestal niet zo best uit. Mensen gebruiken taal en spraak vaak veel losser dan een computer kan begrijpen. We maken zinnen die niet helemaal grammaticaal zijn of spreken met een regionaal accent. Dan heeft de computer weinig meer aan al zijn regels.

De tweede methode is een statistische methode. De computer krijgt hierbij grote hoeveelheden taal en spraak voorgeschoteld. Deze analyseert hij, zodat hij precies weet wat wel voorkomt in de taal en wat niet. Ook weet hij zo precies op welke manieren mensen een klank kunnen uitspreken. Met deze informatie kan hij een stuk natuurgetrouwer het taal- en spraakvermogen van de mens nabootsen.

De begrijpende computer

Echt begrijpen doet een computer taal en spraak niet. Hij kijkt het alleen af bij mensen of maakt gebruik van de regeltjes die mensen hem aanleren. Maar al die data blijft voor hem gewoon een flinke hoeveelheid enen en nullen. Een zoekmachine zoekt simpelweg naar de termen die jij invult en denkt niet met je mee. Hij geeft geen links naar spijkerbroekensites als je ‘jeans’ invult en geeft geen direct antwoord op je vraag. Ook kan hij de rode draad van een tekst niet volgen. Wetenschappers vinden steeds meer manieren om taalbegrip bij computer te simuleren.

Zandloper

Een computer die taal begrijpt, kan met je meedenken. Als je een vraag intypt in een zoekmachine, geeft hij je direct een antwoord, in plaats van een lange lijst met sites waarop misschien het antwoord te vinden is. Onlangs is Wolfram Alpha gepresenteerd. Dat is geen zoekmachine, maar een antwoordmachine.
Een computer met taalbegrip is niet alleen handig voor zoekmachines. Ook als je de rode draad uit een grote hoeveelheid documenten wilt halen, komt zo’n computer goed van pas. Veel marketingbedrijven maken al gebruik van zulke technieken. Zo kunnen ze gemakkelijk bijhouden hoe consumenten online over hun product praten. Deze techniek heet text mining. Door een analyse van de liedteksten kan de computers zelfs automatisch een sfeervolle afspeellijst voor je samenstellen.

De spraakherkenner

De bekendste toepassing van spraak- en taaltechnologie is misschien wel de spraakherkenner. Je spreekt tegen de computer en hij verstaat wat je zegt. Een automatische spraakherkenner zet het binnengekomen geluidssignaal om in geschreven tekst. Hierbij luistert hij alleen naar spraak; omgevingsgeluiden negeert hij. Dit kan heel handig zijn om bijvoorbeeld teksten aan je tekstverwerker te dicteren. Maar spraakherkenning kan ook een eerste stap zijn van een groter proces, waarin de computer met de herkende spraak verder werkt. Hij kan het bijvoorbeeld proberen te begrijpen om erop te reageren. Of hij kan het vertalen in een vreemde taal.

De spraakherkenner in het dagelijks leven

Steeds meer instellingen maken gebruik van een spraakherkenner. Als je bijvoorbeeld belt naar de bank of de gemeente is de kans groot dat je eerst een computer aan de lijn krijgt. Ook tegen je mobiele telefoon of je navigatiesysteem kan je meestal gewoon zeggen wat je wilt. Blinden kunnen telefonisch bij de computer de boeken bestellen die ze willen lezen en doven of slechthorenden kunnen beter telefoneren als ze kunnen lezen wat hun gesprekspartner zegt. De politie kan met de Kentekenlijn tijdens het rijden kijken of de chauffeur nog boetes open heeft staan en vervolgens kan de rechter na de zitting nog eens terugluisteren hoe de verdachte zich verdedigde. De spraakherkenner kan ook worden ingezet door omroepen om hun tv-programma’s te ondertitelen.

De spraakherkenner kan ook heel handig zijn als je wilt zoeken in spraakfragmenten. Je kunt dan niet, zoals in een tekst, gewoon ctrl+F intypen. De spraakherkenner zet de spraak om in tekst, die vervolgens wel makkelijk doorzoekbaar is. Door de tekst te koppelen aan de spraakopname, kun je het gevonden fragment ook meteen terugluisteren. Zo kun je bijvoorbeeld al zoeken in NOS-journaals of in de toespraken van Koningin Wilhelima tijdens de Tweede Wereldoorlog.

Hoe aardig de computer aan de telefoon ook klinkt, daten met een spraakherkenner zit er voorlopig nog niet in.

Spraaksynthese

Computers die zijn ontworpen om te communiceren met mensen, kunnen meestal niet alleen luisteren, maar ook spreken. Dit heet spraaksynthese. Al voor er computers bestonden probeerden mensen kunstmatig spraak te maken. Ze gebruikten hiervoor bijvoorbeeld blaasbalgen. Met de komst van de computer probeerden technici spraak te maken met een brongeluid dat door verschillende filters werd gehaald. Het resultaat was slecht verstaanbaar en leek in de verste verte niet op menselijke spraak. Tegenwoordig stellen spraaktechnologen de computerspraak samen aan de hand van vooraf ingesproken teksten:

Sprekende computers in de praktijk

Navigatiesysteem

Sprekende computers kom je niet alleen tegen in je navigatiesysteem of als je belt naar een instantie. Ook in de zorg kan spraaksynthese een grote rol spelen. Vooral blinden zijn geholpen met een voorgelezen krant of met een mobiele telefoon die gefotografeerde teksten voorleest. Maar ook dyslectici hebben steun aan een computer die teksten ter controle kan voorlezen.

Automatisch vertalen

Sinds een paar jaar maakt automatisch vertalen een flinke opmars. Bedrijven als Babelfish en Google bieden gratis online diensten hun diensten aan om je tekst van de ene taal naar de andere om te zetten. De bedrijven gebruiken verschillende technieken om te teksten te vertalen: respectievelijk de regelgebaseerde methode en de statistische methode. Beide methoden werken goed, maar helemaal kun je er nog niet op vertrouwen. Met het huidige tekort aan tolken en vertalers (o.a. binnen de EU) steken universiteiten echter steeds meer tijd en geld in onderzoeksprojecten om vertaalsoftware te verbeteren.

Universal_translator-startrek

De Universal Translator uit Star Trek kan moeiteloos vertalen tussen alle talen uit het universum. De huidige taaltechnologie mag dan al een eind op weg zijn, maar zó ver zijn we voorlopig nog niet.

De lezende computer

Digitale teksten bestaan nog niet zolang. Teksten in boeken bestaan al veel langer, en daar zijn er dan ook veel meer van. Om deze beter te kunnen doorzoeken en beschermen tegen de tand des tijds steken veel bibliotheken en universiteiten tijd in het digitaliseren van deze teksten. Overtypen is een monnikenwerk, maar dat is dankzij Optical Character Recognition gelukkig ook meestal niet nodig. OCR-software herkent de letters van de tekst. Omdat ingescande teksten nog wel eens kleine vlekjes hebben, maakt de software echter nog wel eens fouten. Hij ziet dan een ‘i’ aan voor een ‘l’ of ‘rn’ voor een ‘m’. Taaltechnologie kan er vervolgens voor zorgen dat de computer alleen bestaande woorden herkent. Zo maakt de software van ‘kamemelk’ alsnog ‘karnemelk’.

Veel oude boeken, zoals bijbels en krantenarchieven zijn de laatste jaren al gedigitaliseerd en doorzoekbaar gemaakt. Maar niet alleen wetenschappers hebben iets aan OCR-technieken. In Amerika zijn technici bijvoorbeeld bezig aan software waarmee je met je mobieltje als ‘pen’ in de lucht kunt schrijven.

Lees verder