Unha tese estuda os recursos lingüísticos que se precisan para etiquetar estatística e automaticamente corpus en galego.
O galego atópase entre as linguas con
recursos computacionais “robustos” que a sitúan “na vangarda da
lingüística computacional”. Eva Mª Domínguez Noya sostén esta
información na súa tese de doutoramento ‘Etiquetaxe e desambiguación automáticas en galego: o sistema XIADA’
baseándose nos datos: o galego posúe un etiquetador morfolóxico
automático estatístico de alta precisión, cuxa taxa de acerto se sitúa
no 96%, e un corpusetiquetado morfoloxicamente de case 600.000 unidades
cun sistema de recuperación de información flexible e cómodo.
A construción de recursos lingüísticos, entre os cales están os corpus, é necesaria en toda lingua para profundar no seu coñecemento, mais tamén é fundamental para o procesamento da linguaxe natural. Nos últimos anos, ademais, as novas tecnoloxías da información xorden como un parámetro máis de clasificación das linguas en función da súa presenza ou ausencia nelas, e o galego non é alleo a esta corrente.
Proxecto multidisciplinar
No Centro Ramón Piñeiro para a Investigación en Humanidades o catedrático de Lingüística española da USC Guillermo Rojo dirixe un proxecto multidisciplinar cuxo obxectivo é facilitar a recuperación de información do Corpus de Referencia do Galego Actual (CORGA), ademais de por forma ortográfica, por etiqueta morfosintáctica e lema. Resultado dese proxecto é a ferramenta creada especificamente para o galego denominada Etiquetador/Lematizador do Galego Actual (XIADA).
‘A tese estivo codirixida polo profesor do Departamento de Lingua Española da USC Guillermo Rojo e a profesora do Departamento de Filoloxía Galega M.ª Sol López Martínez. O traballo, que acadou a cualificación de Sobresaliente cum laude.
A construción de recursos lingüísticos, entre os cales están os corpus, é necesaria en toda lingua para profundar no seu coñecemento, mais tamén é fundamental para o procesamento da linguaxe natural. Nos últimos anos, ademais, as novas tecnoloxías da información xorden como un parámetro máis de clasificación das linguas en función da súa presenza ou ausencia nelas, e o galego non é alleo a esta corrente.
Proxecto multidisciplinar
No Centro Ramón Piñeiro para a Investigación en Humanidades o catedrático de Lingüística española da USC Guillermo Rojo dirixe un proxecto multidisciplinar cuxo obxectivo é facilitar a recuperación de información do Corpus de Referencia do Galego Actual (CORGA), ademais de por forma ortográfica, por etiqueta morfosintáctica e lema. Resultado dese proxecto é a ferramenta creada especificamente para o galego denominada Etiquetador/Lematizador do Galego Actual (XIADA).
‘A tese estivo codirixida polo profesor do Departamento de Lingua Española da USC Guillermo Rojo e a profesora do Departamento de Filoloxía Galega M.ª Sol López Martínez. O traballo, que acadou a cualificación de Sobresaliente cum laude.
Ningún comentario:
Publicar un comentario