Traballa no proxecto 'Common Voice en galego' de Proxecto Trasno

Antón Méixome: "Common Voice é a resposta do software libre galego ao gran muro idiomático na tecnoloxía"

O Proxecto Trasno é unha "comunidade aberta de voluntarios que se dedican a localizar software libre ao galego" e Antón Méixome forma parte dela desde a súa creación en 1999. Agora este colectivo vén de lanzar o "Proxecto Common Voice", de Mozilla, para o galego. Unha iniciativa que está na súa primeira fase, a de recollida de frases breves escritas na nosa lingua, da que buscan achegar 5.000 expresións.  
IMG20210210173203
photo_camera Proxecto Trasno botou a andar en 1999 e Antón Méixome integrouse nese colectivo voluntario. (Foto: Nós Diario)

Explíquenos brevemente en que consiste o Proxecto Common Voice?

Trátase dun proxecto de intelixencia artificial de recoñecemento de voz, o típico asistente de voz que ten Alexa ou Siri, unhas caixiñas que responden porque entenden o que se lles di.

Isto necesita dunha base de datos, unha materia prima que son as voces de falantes nunha gran cantidade e calidade, de tal maneira que logo se poidan pasar a un sistema informático, a uns algoritmos baseados en redes neuronais, que o que conseguen crear é un punto medio de entendemento da pronuncia das falantes dun idioma. Iso procésase en forma de texto, de tal modo que se crean regras para unha interacción lóxica entre a persoa e o dispositivo.

Por desgraza en galego non existe ningún repertorio de voces que se poidan utilizar para crear tales produtos ou tales servizos, e crealo é carísimo. As grandes empresas non fan o investimento de gravar todo ese repertorio de voz para pór en funcionamento unha intelixencia artificial nesa lingua, xa non polo custo económico, senón polo tempo de dedicación que precisa. 

Así o common voice é unha resposta que dan o software libre e a cultura colaborativa a este gran muro que temos que saltar no relativo ao idioma.

En que fase está o proxecto? Cal é a súa mecánica?

Estamos arrancando. O proxecto leva aberto arredor de dous anos pero nós estivemos observando desde o principio para ver a súa complexidade e deixámolo madurar, o ecosistema, as ferramentas, as normas... Porque entendemos que somos unha comunidade cos recursos limitados e necesitamos que as cousas estean facilitadas. Pensamos que agora era o momento e botámolo a andar.

Agora recollemos expresións breves, temos como punto 5.000 frases, logo hai que revisalas e validalas e incluirémolas na comunidade Mozilla. Despois esas frases pasarán a un sistema de gravación, unha pantalla na que as diferentes persoas colaboradoras, particulares, irán vendo en grupos de cinco as frases. É unha das cousas máis bonitas, trátase de recoller acentos, modulacións, expresións particulares de cada unha.

Porque a intelixencia artificial que fale galego ten que entender alguén que fale con seseo ou sen el, ou que teña rotacismo, que sexa unha persoa que vocaliza moi ben ou quen non... que fale como alguén de alta formación cultural ou de baixa... homes, mulleres... Menores non, porque esta participación é unha licenza de dominio público, é dicir, de todas, e iso no caso de menores precisaría o permiso das nais, pais... 

Que ten que facer quen queira colaborar?  

Enviar frases ao noso correo electrónico cunha listaxe de oracións. Nós recollémola e cargámola no sistema, revisámola e corrixímola se é preciso, vemos que teñan interese e valídanse. O sistema xa é intelixente e se a frase xa está, vaino detectar, ou se non cumpre algunha das normas, por exemplo, números en díxitos... Colaborar é sinxelo e a través do correo electrónico a persoa que participa terá toda a información.

Bótase en falla a participación da Administración? 

O idioma é responsabilidade de todas as falantes. En Proxecto Trasno non pretendemos que a Administración faga todo isto, cremos na sociedade civil e hai moitas cousas que facemos porque nos parecen de interese sen necesidade de que a Administración tome parte.

O mellor que pode facer a Administración neste campo é crear infraestrutura, boa conexión e cobertura, que no sistema educativo se utilice software libre... e non deixarse levar pola mercadotecnia comercial.

Comentarios