luns 23/11/20
A tese de Pichel verifica a teoría lingüística de Carvalho Calero

'Carvalho' marca a distancia entre linguas

O cálculo automático da distancia entre idiomas, por medio do corpus "Carvalho", foi o eixo da tese presentada polo enxeñeiro informático José Ramom Pichel, a finais de outubro na USC (Universidade de Santiago de Compostela)
Na dereita, José Ramom Pichel, autor da tese. (Foto: Nós Diario)
Na dereita, José Ramom Pichel, autor da tese. (Foto: Nós Diario)

A tese elaborada por José Ramom Pichel verifica as teses lingüísticas de Ricardo Carvalho Calero, xa que demostra que na segunda metade do século XX o galego estaba máis próximo ao castelán se se utilizaba a mesma ortografía, e máis próximo ao portugués se o que se facía era usar unha codificación ortográfica común ao portugués e ao castelán.

O principal obxectivo da tese, realizada polo co fundador de Imaxin Software, foi o de “crear unha metodoloxía baseada en corpus de texto escrito que cuantificara automaticamente a distancia actual e histórica entre linguas ou variantes lingüísticas”, e que puidese ser aplicada a calquera lingua do mundo.

Este corpus creado ad hoc e multilingüe chamouse Carvalho e está constituído por documentos de diferentes períodos históricos, cunha métrica xa verificada para identificar linguas e que se chama “perplexidade”.  

Con este método, José Ramom Pichel conta que foi posíbel "cuantificar a distancia actual entre 44 linguas europeas, a evolución entre períodos históricos de varias linguas, a distancia histórica entre portugués e español, galego e portugués, galego e español e tamén entre variedades do portugués europeo e do Brasil e do español europeo e da Arxentina".

Con respecto a outros resultados, verificáronse tamén as hipóteses cualitativas xa apuntadas pola lingüística histórica de clasificación de linguas e xeráronse novas observacións sobre hipóteses controvertidas de filiación entre linguas, como pode ser a relación, aínda que afastada, existente entre o idioma eúscaro e mais a lingua xeorxiana.

O método, que tamén foi aplicado pola universidades italianas de Florencia e mais de Siena, para analizar o distanciamento histórico do italiano medieval, está dispoñíbel en código aberto a través do GitHub, xunto cos diferentes corpus que forman "Carvalho".

A tese estivo codirixida polos profesores Iñaki Alegría da UPV (Universidade do País Vasco) e Paulo Gamalho, vicedecano da Facultade de Filoloxía da Universidade de Compostela e investigador do CiTIUS (Centro Singular de Investigación en Tecnoloxías Intelixentes).

comentarios