'Spontaneous Speech': a fala real do galego chega para ficar no universo dixital

Captación de voz do Proxecto Nós, Ribadeo. CC-BY-SA Proxecto Nós

A plataforma colaborativa Common Voice, impulsada por Mozilla, incorpora o recoñecemento da fala espontánea, que permitirá rexistrar doazóns con acentos diversos, variantes léxicas e morfolóxicas, que adoitan desaparecer na fala lida

O galego e a súa diversidade dialectal dan un novo paso para garantir a súa presenza no ecosistema dixital do futuro, ademais de documentar e protexer a súa riqueza oral. Segundo informan desde o Proxecto Nós, a plataforma colaborativa Common Voice, impulsada por Mozilla e alimentada por persoas voluntarias de todo o mundo, incorpora unha nova funcionalidade para o recoñecemento da fala, nomeada Spontaneous Speech (‘fala espontánea’), que permitirá rexistrar doazóns con acentos diversos, variantes léxicas e morfolóxicas, cambios de código ou fenómenos propios da oralidade que adoitan desaparecer na fala lida. 

Ata agora, as contribucións nesta plataforma colaborativa (que ten como misión construír recursos abertos para o recoñecemento da fala) consistían en gravacións de lectura en voz alta de textos dispoñibles en dominio público. A nova funcionalidade, que de momento está en fase de probas, abre a porta á recollida dunha fala máis natural, diversa e representativa do uso real da lingua no día a día: a través de preguntas sinxelas rexistradas en Common Voice, as voluntarias poderán gravar respostas breves e espontáneas que recollerán a súa variedade dialectal. 

Imaxe na plataforma para a recollida de voces do Proxecto Nós. CC-BY-SA Proxecto Nós

O Instituto da Lingua Galega (ILG), a través do Proxecto Nós, colaborou coa redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego

Esta nova ferramenta, facilitará a participación de falantes de distintas idades, rexións ou niveis de alfabetización dixital, ademais de recoñecer e valorizar a fala real, rica en matices e moito máis representativa do uso lingüístico actual que os textos escritos tradicionais.

A través de preguntas

Dentro da plataforma Common Voice, ao escolleren, na sección Fale, a opción Responda preguntas, as persoas colaboradoras poden gravar as súas respostas; ademais, tamén poden participar transcribindo as respostas doutras usuarias e validando esas transcricións, o que contribúe a crear un corpus de fala de calidade.

O Instituto da Lingua Galega (ILG), a través do Proxecto Nós, colaborou coa redacción do primeiro conxunto de preguntas dispoñibles para a recollida de fala espontánea en galego. Porén, calquera persoa pode propoñer novas preguntas a través da plataforma, o que garante que os contidos evolucionen de forma aberta e participativa.

Calquera persoa pode doar a súa voz, tanto lendo textos en voz alta como respondendo as novas preguntas de fala espontánea. O obxectivo é recompilar gravacións  para desenvolver tecnoloxía que representen a diversidade do galego

As achegas recollidas a través de Spontaneous Speech darán lugar a un conxunto de datos independente, que se publicará baixo licenza CC0, en liña coa filosofía de datos abertos de Common Voice. Isto permitirá que investigadoras, lingüistas, etc. accedan a datos de fala espontánea en lingua galega de forma libre e gratuíta, fomentando deste xeito o desenvolvemento de tecnoloxías inclusivas e plurais.

Baixo o lema AgasallaNós, e co obxectivo de facilitar a participación na recollida de voz en galego dentro da plataforma Common Voice, o Proxecto Nós ten dispoñible a páxina web doagalego.nos.gal  para contribuír ao proxecto. A través desta web calquera persoa pode doar a súa voz, tanto lendo textos en voz alta como respondendo as novas preguntas de fala espontánea. O obxectivo é recompilar gravacións que representen a diversidade do galego, co fin de contribuír ao desenvolvemento de tecnoloxías de recoñecemento da fala que identifiquen toda a riqueza da nosa lingua. 

Doantes de voz no Culturgal. CC-BY-SA Proxecto Nós

O Proxecto Nós é unha iniciativa para situar o galego canda as linguas máis desenvolvidas no ámbito da tecnoloxía da lingua e a Intelixencia Artificial. O seu obxectivo principal é xerar os recursos necesarios para facilitar o desenvolvemento de servizos e produtos baseados na tecnoloxía da lingua como asistentes de voz, tradutores automáticos ou axentes conversacionais. 

En paralelo, o proxecto promove tamén a presenza dixital do galego, facilitando a creación dunha ampla variedade de ferramentas e de recursos de alta calidade e de uso libre. Algunhas delas (un tradutor neuronal multilingüe, un recoñecedor de voz que converte fala en texto escrito, e unha aplicación de síntese de voz que le en galego) xa están á disposición e accesibles a través da web do proxecto para calquera persoa, institución, organización ou empresa que queira desenvolver un produto tecnolóxico, aplicación ou servizo que incorpore a lingua galega. Deste xeito, ademais de garantir os dereitos lingüísticos da comunidade galegofalante no mundo dixital, tamén se contribuirá á modernización e dixitalización do ecosistema de empresas galegas e á creación de valor con novos produtos que empreguen o galego.

Grazas ás socias e socios editamos un xornal plural

As socias e socios de Praza.gal son esenciais para editarmos cada día un xornal plural. Dende moi pouco a túa achega económica pode axudarnos a soster e ampliar a nosa redacción e, así, a contarmos máis, mellor e sen cancelas.