Contracultura

Senén Barro: "O Proxecto Nós trata de pór a lingua galega na economía e na sociedade dixitais"

Senén Barro, doutor en Física, é o director do Centro Singular de Investigación en Tecnoloxías Intelixentes da Universidade de Santiago de Compostela (CiTIUS) a través do cal lidera o Proxecto Nós en colaboración co Instituto de Lingua Galega. Barro aborda as aplicacións desta investigación que, como el di, “trata de pór o galego na economía e na 
sociedade dixitais”.
O profesor é director do Centro Singular de Investigación en Tecnoloxías Intelixentes da USC (Ramon Vaamonde).
photo_camera O profesor é director do Centro Singular de Investigación en Tecnoloxías Intelixentes da USC. (Foto: Ramón Vaamonde)

Que implica o Proxecto Nós para a cultura en galego?

É un proxecto de tecnoloxías lingüísticas que trata de pór o galego na economía e na sociedade dixitais. Se temos en conta que a maior parte do que consumimos é dixital, desde un punto de vista cultural, mais tamén de educación ou de servizos como a administración ou a atención médica; unha lingua que non estea presente nas máquinas que interaccionan connosco vai ir desaparecendo das nosas vidas. 

Cada vez prodúcese máis a través de contidos e de dispositivos dixitais e se a nosa lingua non está presente nesta vida nós tamén iremos empobrecendo a nosa relación con ela en todos os ámbitos. 

Unha aplicación moi clara deste traballo é a dos subtítulos, non?

Esta é unha das aplicacións máis comúns porque efectivamente consumimos moitos recursos multimedia que non están en galego ou que si o están mais que non son accesíbeis para persoas con dificultades auditivas. O problema que atopamos é que non hai recursos con suficiente calidade para facelo.

O galego ten moitas deficiencias desde o punto de vista dos recursos, aplicacións e usos no mundo dixital e precisamente por isto o Proxecto Nós quere ir poñendo solucións achegando recursos, ferramentas e aplicacións. Dentro do ámbito da intelixencia artificial, as tecnoloxías lingüísticas son as que están recibindo máis atención e máis investimento.

Nestes momentos, o proxecto está centrado na compilación deses recursos de texto e voz. Por que?

Hai que pensar que este corpus de recursos é a materia prima da que despois se alimentan os modelos textuais e de voz relacionados coa intelixencia artificial. Hoxe en día, as solucións que se dan a nivel de ferramentas e aplicacións relacionadas coas tecnoloxías lingüísticas están baseadas en estratexias de intelixencia artificial e modelos de computación neuronal. Estes son modelos moi complexos que funcionan moi ben na medida en que poden ser adestrados con grandes cantidades de datos, que poden ser texto ou voz. 

En galego, os recursos que hai non son suficientes. A proba é que contamos con modelos de tradución automática ou de conversación feitos por grandes empresas que integraron corpus de galego, mais que son deficientes porque os recursos que alimentaron estes modelos foron escasos.

E fórono por inexistentes, non porque houbese unha intención real de ignorar o galego. Por outra parte, os recursos que fan terceiros normalmente non son de libre disposición e por tanto non son reutilizábeis por grupos de investigación, empresas ou administracións públicas. 

O mes pasado Nós foi incluído no Proxecto Estratéxico para a Recuperación e Transformación Económica (Perte) da Nova Economía da Lingua. Que significa isto para o proxecto?

É moi importante porque o Perte pretende facer a nivel das linguas oficiais do Estado español (español, éuscaro, catalán e galego) o que Nós pretende facer a nivel da Galiza. Por unha parte, isto supón unha achega de recursos que van permitir acelerar o paso.

Tamén hai que pensar que o Proxecto Nós non é só a varios anos vista, senón que debería levarse a cabo de por vida. O que o ocorre é que se nos próximos anos non facemos un esforzo moi grande, posibelmente perdamos a oportunidade de situarnos ao nivel das linguas máis desenvolvidas nas tecnoloxías. 

Ademais, o interesante é que isto vai facerse en cooperación co resto de linguas, co que iremos máis rápido porque poderemos desenvolver un corpus multilingüe. Hoxe, os modelos máis potentes e con mellores prestacións son multilingües e multimodais, é dicir, que integran a un tempo voz e texto, cando non imaxe.  

Comentarios