AI met tekst en spraak, artificiële intelligentie, ai, master Applied Science, Centrum voor Artificiële Intelligentie en Data Science; Parel Food and cognition; De geheimen van ons geheugen; Henk van den Heuvel

Radboud-onderzoeker Henk van den Heuvel over AI met geschreven tekst en spraak

Een specialiteit van de Radboud Universiteit op het gebied van Artificial Intelligence (AI), is spraakherkenning combineren met geschreven tekst. Een combinatie van spraaktechnologie en taaltechnologie dus. Henk van den Heuvel, onder andere directeur van het Centre for Language and Speech Technology, doet met zo’n vijftien collega’s onderzoek naar praktische toepassingen van deze vorm van AI.

Er kan hierbij gedacht worden aan toepassingen voor bedrijfsleven, overheid, zorg en onderwijs.

Een veilige omgeving

Bedrijven hebben belangstelling voor de transcriptie van interviews of telefoongesprekken. Daarbij gaat het dus om gesproken taal, die via een spraakherkenner omgezet wordt naar geschreven tekst. Verder hebben bedrijven veel belangstelling voor chatbots, die niet alleen met geschreven tekst werken maar ook met spraak. Je kunt daarmee bijvoorbeeld handsfree dingen doen”, vertelt Van den Heuvel.

Hij en zijn collega’s onderzoeken hoe een veiligere omgeving rondom spraak- en tekstherkenning kan worden gecreëerd. Hierbij moet voorop staan dat data alleen wordt verzameld met expliciete toestemming van de gebruiker. Standaardtoepassingen zoals die van Google lijken het daar namelijk minder nauw mee te nemen. “Een punt van zorg bij veel toepassingen is dat bijvoorbeeld Google Home veel meer opneemt dan mensen weten én het wordt getranscribeerd. Google, Apple en Amazon hebben verreweg de meeste data van iedereen, daar kan geen universiteit tegenop. Hoe meer data je hebt om te trainen, hoe beter je mensen kunt herkennen. Zo worden ze onverslaanbaar.”

Daarnaast werken de standaardtoepassingen van AI van bedrijven als Google minder goed voor specifieke doelgroepen zoals ouderen of kinderen. Ook daar wordt onderzoek naar gedaan door de vakgroep. Bijvoorbeeld: de stemmen van kinderen liggen op heel andere frequenties waardoor de standaard-spraakherkenning niet goed werkt. Die is vaak getraind op volwassenen en maakt daarom veel fouten bij de herkenning kinderstemmen. Datzelfde geldt in meer of mindere mate ook voor ouderen.

Kinderen en onderwijs

De onderzoekers zijn nu met een aantal projecten bezig om betere spraakherkenning voor kinderen te ontwikkelen voor onderwijstoepassingen, in samenwerking met Zwijsen, een grote uitgeverij.

Van den Heuvel: “Je kunt de robot gebruiken als instructeur, je kunt er allerlei vakken mee onderwijzen. Wij gebruiken zelf de automatische spraakherkenning voor taalonderwijs. Wil je bijvoorbeeld leren wat correcte zinnetjes zijn, dan krijg je een aantal opties op het scherm en dan mag je uitspreken wat de goede is volgens jou. Daar kun je leesonderwijs mee testen, bijvoorbeeld de uitspraak van woorden, en kijken of kinderen woordvolgordes goed begrijpen.”

Deze robotinstructeurs zijn ook goed in te zetten bij tweedetaalverwerving. Spin-off Novolearning van de Radboud houdt zich daarmee bezig.

Serious gaming in de zorg

Voor (veelal oudere) mensen met spraakproblemen is de training met taal- en spraaktechnologie ook interessant.

Van den Heuvel: “Voor spraakproblemen als afasie maken we trainingsprogramma’s zodat deze mensen (opnieuw) leren luid genoeg te spreken, of op de juiste toonhoogte. Het voordeel van een computer is dat je het zo vaak kunt doen als je wilt en op een moment dat je zelf kiest. Er moet wel professionele hulp bij zijn, zoals een logopedist, ook om te zorgen dat mensen het volhouden. Daaromheen hebben we ook verschillende projecten: hoe kun je die motivatie vasthouden. Zo kom je ook bij serious gaming terecht: laat mensen een spel uitvoeren met als taak een schat te vinden door tegen de computer te praten. Dit moedigt mensen aan om hun spraak te oefenen.”.

Laat mensen een spel uitvoeren met als taak een schat te vinden door tegen de computer te praten. Zo worden mensen aangemoedigd om hun spraak te oefenen.

Politie en Tweede Kamer

Andere interessant projecten van het onderzoekscentrum lopen bij 112 en de Tweede Kamer

Politieagenten die achter de telefoon zitten moeten mensen te woord staan in een gespannen situatie. Tegelijkertijd moeten ze een rapportage maken van wat er aan de hand is. Als je automatische spraakherkenning gebruikt, kun je bijvoorbeeld meteen de straat die genoemd wordt op de monitor tonen in Google Maps. Dan zie je ook waar de ingang van het huis is, waar ze een politieauto naar toe moeten sturen. Hiervoor ontwikkelden de onderzoekers een proof of concept.

Van den Heuvel: “Ook met de Tweede Kamer hebben we samengewerkt. Ze hebben enorme hoeveelheden overleggen in audio- en videobestanden die moeten worden vastgelegd in de vorm van  een propere tekst. Dat is echt heel veel werk voor de dienst verslaglegging en redactie. Automatische spraakherkenning kan een oplossing bieden.” Daarbij was er nog een aparte uitdaging: wat er letterlijk gezegd is, is geen lopende tekst, het zijn geen mooie zinnen. Daarom keek de vakgroep samen met de Kamer naar het omzetten van deze spreektaal naar nette tekst.

Hiervoor werd de tekst gesplitst: de tekst die uit de herkenner komt is taal A en de tekst die het moet worden is taal B [red. de gehanteerde schrijfwijze in de Nederlandse Handelingen van de Eerste en Tweede Kamer der Staten-Generaal]. Er zijn al veel opgenomen teksten en veel geschreven verslagen. Door dat naast elkaar te leggen en machine learning in te zetten, kwam er een beter bruikbare tekst uit de spraak waarmee de verslagleggers weer verder konden.

Meer over AI

FacebookTwitterEmailLinkedInWhatsApp