xoves, 24 de setembro de 2015

Éxito na rede do primeiro diccionario dixital de sinónimos galegos

O grupo de investigación en Tecnoloxías da Lingua Galega ultima tamén unha base de datos léxica que xa emprega Google.

O Dicionario de Sinónimos do Galego editado pola Universidade de Vigo supera xa as 100.000 consultas en liña e o millar de descargas en Google Play, a tenda de produtos para aparellos con Android, e na App Store de Apple, cifras que os seus autores valoran como “moi elevadas”, xa que a versión móbil leva apenas uns meses en funcionamento. “A obra foi feita con moito traballo e moito amor pola lingua e para nós a máxima compensación é que sexa moi utilizada e ben aproveitada, por iso animamos a todo o mundo a empregala a eito tanto na web coma no móbil”, explica o profesor Xavier Gómez Guinovart, coautor do dicionario xunto a Xosé Mª Gómez Clemente, especialista da Universidade en lexicografía e terminoloxía galega, e Alberto Simões, profesor da Universidade do Minho especialista en procesamento informático de dicionarios.
Portal do diccionario de sinónimos en galego.
Portal do diccionario de sinónimos en galego.
Esta nova ferramenta tecnolóxica-lingüística contén máis de 200.000 voces na nosa lingua agrupadas nunhas 30.000 entradas. “A idea inicial foi pór a dispor do público o dicionario a través da web do Seminario de Lingüística Informática (http://sli.uvigo.es), como facemos en xeral con todos os recursos lingüísticos que desenvolvemos no grupo de investigación en Tecnoloxías e Aplicacións da Lingua Galega (TALG) no que estou integrado”, subliña Gómez Guinovart, ao tempo que explica que a posibilidade de distribuír o dicionario tamén en forma de aplicación móbil foi posterior e xurdiu nunha conversa de traballo cos integrantes da Área de Normalización Lingüística, que editou este traballo a través do convenio de colaboración en materia de normalización lingüística entre a Universidade de Vigo e a Consellería de Cultura, Educación e Ordenación Universitaria. “Considerámolo unha vía máis de potenciar a normalización do noso idioma”, explican os autores.
Ao inicio do proxecto os investigadores carecían de ningún dicionario de sinónimos, nin comercial nin libre, en soporte dixital no que basearse e, por esta razón, optaron por revisar, ampliar e dixitalizar un dicionario de sinónimos tradicional do galego publicado en papel e xa descatalogado: o dicionario publicado por Galaxia en 1997 baixo a coordinación de Camiño Noia, Xosé María Gómez Clemente e Pedro Benavente, e que contou coa participación de Gonzalo Constela, Xosé Henrique Costas e Valentín Arias na súa redacción, un traballo ao que se refiren como excelente. “Como base do traballo, contamos co conxunto de ficheiros en Word elaborados polos autores da obra orixinal, e sobre estes alicerces, tivemos que realizar un arduo traballo de normalización, revisión e ampliación para chegar ao dicionario dixital co que contamos agora”, explica o autor.
O diccionario emprega como base o de Galaxia publicado en 1997
“O dicionario fonte co que traballamos foi redactado en 1997, seguindo a normativa de 1982. Por tanto, a preparación do dicionario implicou a corrección do texto segundo os criterios normativos vixentes na actualidade”, explican os autores. Esta revisión normativa representou un volume de traballo moi elevado, xa que obrigou a revisar o texto do dicionario na súa totalidade. Unha vez rematada a normalización informática e lingüística do texto, prepararon unha interface web para facilitar a súa consulta pública e emprenderon unha dilatada fase de ampliación e revisión lexicográfica que incluíu a expansión dos sinónimos que dan lugar a pistas perdidas no dicionario e a resolución das remisións lexicográficas desde unhas entradas a outras.
Ao marxe da elaboración do dicionario, os investigadores do Seminario de Lingüística Informática, ao que pertence Gómez Guinovart, atópanse inmersos na construción do Galnet, unha base de datos léxica para o galego ao estilo WordNet do inglés. “Trátase dunha rede léxico-semántica de grande alcance que permitirá un salto cuantitativo no procesamento informático da nosa lingua, en aplicacións das tecnoloxías lingüísticas como a tradución automática, a recuperación da información, a clasificación automática de textos ou o resumo automático”, recalca o investigador, que exemplifica a importancia desta nova ferramenta adiantando que xa foi adoptada por Google como parte da tecnoloxía utilizada na actualidade por Google Translate para a tradución automática da lingua galega.


Ningún comentario:

Publicar un comentario