CoToVía, do galego escrito ao falado nun 'clic'

Eduardo Rodríguez Banga, no centro, co resto de compoñentes do Grupo de Tecnoloxías Multimedia © Universidade de Vigo

Despois dunha década de traballo, a Universidade de Vigo, o Instituto da Lingua Galega e o Centro Ramón Piñeiro presentaron este verán o sintetizador de voz CoToVía, que permite a conversión de textos en cadeas orais. No proxecto CoToVía conflúe o traballo do equipo e enxeñeiros e enxeñeiras do Grupo de Tecnoloxías Multimedia da EE de Telecomunicación de Vigo, coordinados primeiro pola catedrática Carmen García Mateo e actualmente polo profesor Eduardo Rodríguez Banga, e de lingüistas da Universidade de Santiago de Compostela, baixo a dirección de Manuel González González. O obxectivo era construír un sistema de conversión automática texto-voz para a lingua galega e para iso, ao longo dos últimos anos foron presentándose distintas versións ata chegar a esta definitiva, construída con unidades pregravadas extraídas da lingua natural.

Os sintetizadores de voz serven para garantirlles a accesibilidade web a persoas con discapacidades visuais, pero son tamén fundamentais na automatización das comunicacións

Os sintetizadores de voz serven para garantirlles a accesibilidade web a persoas con discapacidades visuais, pero son tamén fundamentais na automatización das comunicacións, da información e das relacións sociais: en postos de información automatizados (servizos de banca, reservas de billetes, lectura de mensaxes por vía telefónica...), no ensino de idiomas, no ensino de lectura a nenos con dislexia, nas alarmas orais, na verificación de texto...

CoToVía funciona mediante a concatenación de unidades e difonos extraídos da linguaxe natural, emulando voces masculinas e femininas. Isto faise a través de tres módulos destinados a arquivar os recursos lingüísticos, acústicos e prosódicos (entoación, ortografía, duración dun segmento, etc) cos que se interpretará o texto dun xeito intelixible, fiable e cunha gran naturalidade e proximidade ao discurso oral. Isto supón un destacado avance respecto ás primeiras versións do programa que contaban cunha voz máis mecánica. Unha vez obtida a frase textual, o programa normaliza o texto e realiza un preprocesado do mesmo, para despois realizar unha análise morfolóxico e sintáctico. Esta tarefa deriva nunha transcrición fonética, a partir da que se dan ordes para buscar unha secuencia determinada no módulo acústico e un modulado prosódico, coa duración dos segmentos, a súa intensidade e a frecuencia de cada vogal.

A partir de agora, o equipo do proxecto CoToVía seguirá traballando nunha nova dirección máis flexible e diversificada de elaboración de recursos auxiliares para o desenvolvemento deste tipo de tecnoloxías

A versión definitiva de CoToVía púxose ao libre dispor de toda a comunidade como Creative Commons, cunha licenza GPL 3.0+, de maneira que pode ser empregada libremente por calquera empresa ou usuario, coa única condición do recoñecemento de que os seus autores son o CRPIH e a Universidade de Vigo. A partir de agora, o equipo do proxecto CoToVía seguirá traballando nunha nova dirección máis flexible e diversificada de elaboración de recursos auxiliares para o desenvolvemento deste tipo de tecnoloxías.

 

Ciencia e tecnoloxía en Praza.gal ofrecida por

Eduardo Rodríguez Banga, no centro, co resto de compoñentes do Grupo de Tecnoloxías Multimedia © Universidade de Vigo
Manuel Gonzalez e Valentín García na presentación © Universidade de Vigo

Grazas ás socias e socios editamos un xornal plural

As socias e socios de Praza.gal son esenciais para editarmos cada día un xornal plural. Dende moi pouco a túa achega económica pode axudarnos a soster e ampliar a nosa redacción e, así, a contarmos máis, mellor e sen cancelas.