martes 09/03/21

Proxecto Common Voice: para que as máquinas poidan entender e falar en galego

A iniciativa de Proxecto Trasno procura recadar frases curtas de uso cotián para que, logo, falantes nativos de galego graven as súas voces interpretando esas frases para que poidan usarse en máquinas. Xa teñen máis de 1.700 expresións

common voice
(Imaxe: Proxecto Trasno)

“Nos vindeiros anos, os servizos, produtos e estudos baseados na intelixencia artificial (IA) estarán por todas partes pero non poderemos interactuar en galego con eles non sendo que axudemos nisto”. Así explican desde o Proxecto Trasno un dos retos que o galego ten por diante e que non é pouca cousa. “Un asistente de voz, un lector de textos para persoas con necesidades especiais, asistente de condución en automóbil, un mordomo doméstico, un acompañante robótico para a vellez,… son algúns dos exemplos nos que o galego ten que estar presente, pero como podemos facer isto posible?”, pregúntanse. E eles mesmos apuntan a resposta

“A Fundación Mozilla creou o proxecto Common Voice. Un proxecto que quere crear unha tecnoloxía Open Source para que as máquinas que usaremos no futuro poidan entender e falar con calquera idioma do mundo”. E Proxecto Trasno pula poque o galego estea aí. Lembran que levan anos colaborando coa Fundación Mozilla, “desde o nacemento no 2003,  e froito dese traballo todos os usuarios temos dispoñible o navegador de Internet Firefox en lingua galega”.

Como axudar ?

“O proxecto consiste en recadar un número importante de frases curtas de uso cotián para que, logo, falantes nativos galegos graven as súas voces interpretando esas frases recadadas. Todas as gravacións serán analizadas por este modelo e farán 'maxicamente' que as máquinas entendan o noso prezado idioma”.

Até agora xa recolleron máis de 1.700 frases. O seu obxectivo é superar as 5.000. “En canto teñamos máis de 5000 frases validadas, abrirase a fase de gravación. Durante o proceso seguiremos recollendo máis frases pero ao mesmo tempo iremos cubrindo o obxectivo de 10000 horas de fragmentos de son necesarios para que a intelixencia artificial do DeepSpeech poida crear o modelo de lingua galega.

E pódese axudar de diferentes maneira, sinalan desde este proxecto: Redactar frases orixinais e remitilas por correo a [email protected] No correo poñer Asunto: [CV] Frases para Common Voice; colaborar na revisión das frases que deben estar correctamente escritas, gravar as frases a viva voz, doando a túa voz co teu estilo, acento, modo e maneira de falar en galego...

E hai tamén outras tarefas nas que podes axudar: Revisar as gravacións para comprobar que a gravación se entende ben e di exactamente o mesmo que o texto correspondente; organizar unha quedada para recoller, revisar ou gravar pola túa conta e incorporarte ao proxecto de maneira directa....

É importante, lembran, “que se poidan doar con licenza de dominio público, a. É dicir, non se poden extraer nin de libros nin de sitios web a non ser que teñamos permiso dos autores ou propietarios para doalas ao dominio público”.

comentarios