Optimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur)
Title | Optimalisatie van tekst-to-speech door gebruik van metainformatie (documentstructuur) |
Publication Type | Presentation |
Year of Publication | 2010 |
Conference Name | Dag van de Fonetiek 2010 |
Authors | Versteegh, Bouke |
Publisher | Nederlandse Vereniging voor Fonetische Wetenschappen |
Conference Location | Utrecht, The Netherlands |
Abstract | De huidige generatie algemeen beschikbare text-to-speech (TTS) systemen (links naar websites) leest tekstbestanden (bv Word-bestand, HTML, PDF) voor aan de gebruiker. Denk hierbij aan situaties waarin de gebruiker auditieve informatie beter tot zich kan nemen dan geschreven informatie, zoals bijvoorbeeld bij het beluisteren van vergaderstukken in de auto, of het beluisteren van collegestof in de sportschool. Echter, in geschreven documenten beperkt de boodschap zich niet slechts tot een rij woorden en zinnen, maar heeft de visuele opmaak een ondersteunende functie voor het begrijpen van de boodschap. Dik gedrukte woorden, lettergroottes, lijsten met bullets, genummerde opsommingen, inspringingen en dergelijke, maken het de lezer makkelijker de functie van elementen en hun onderlinge relaties te begrijpen. Als een TTS-systeem enkel de document-tekst uitspreekt, gaat al deze informatie verloren, en is de documentstructuur minder goed te begrijpen. Voor mijn bachelor-afstudeerstage Kunstmatige Intelligentie onderzoek ik hoe documentstructuur in combinatie met documentinhoud via audio gecommuniceerd kan worden met als doel de begrijpelijkheid te verbeteren. Het ultieme doel is dan vervolgens een applicatie te ontwikkelen waarin deze optimalisatie aan gebruikers kan worden aangeboden in een mobiele omgeving.\\ |