El lenguaje controlado y la traducción automática como vehículos de transmisión del conocimiento científico
Author
Other authors
Publication date
2021-09-05Abstract
La transmisión eficaz del conocimiento científico resulta crucial en tiempos de crisis como
el que estamos viviendo debido a la pandemia de SARS-CoV-2. Aunque el uso del inglés
como lengua franca de la ciencia permite una comunicación global, su hegemonía podría
estar causando una brecha lingüística. El objetivo del presente estudio fue realizar una
primera aproximación a la aplicación conjunta del lenguaje controlado, la traducción
automática y la posedición a la traducción de artículos científicos en el par de idiomas
ES>EN para mejorar la traducibilidad automática sin comprometer la calidad del texto de
partida. Para ello se seleccionó un único artículo médico al que se le aplicó control a nivel
léxico-terminológico y a nivel gramatical a través de diez reglas recopiladas de la literatura.
Tanto el texto bruto como el controlado fueron traducidos a través de Google Translate. Los
productos de la traducción automática fueron poseditados y se realizó una anotación
exhaustiva de la preedición y de la posedición con el fin de evaluar el esfuerzo técnico de
ambos procesos, evaluar la efectividad del lenguaje controlado y estudiar el error. La
preedición en conjunto tuvo un efecto positivo al reducir el esfuerzo de posedición en el
texto controlado, aunque este fue inferior al esperado. El control gramatical y el control
léxico-terminológico tuvieron respuestas dispares. Las reglas de control gramatical fueron
menos eficaces de lo previsto, especialmente al tener en cuenta el elevado esfuerzo de
preedición que requirieron y que fueron responsables de introducir un número considerable
de errores en el texto controlado. El control léxico-terminológico tuvo una eficiencia
elevada, ya que consiguió reducir los errores de imprecisión léxica a la mitad. Ambos tipos
de control del lenguaje podrían incrementar su eficacia con el desarrollo de herramientas
informáticas específicas para el español, no disponibles hasta la fecha.
The effective transmission of scientific knowledge is paramount in times of crisis such as
the one we are experiencing due to the SARS-CoV-2 pandemic. Although the use of English
as lingua franca of science enables global communication, its hegemonic presence could also
be creating a language gap. The goal of the present study was to carry out the first attempt
to a joint application of controlled language, machine translation, and post-editing to the
translation of scientific articles from Spanish to English and improve automatic
translatability without compromising the quality of the source text. A single medical article
was selected and subject to restrictions at a lexical-terminological level and grammatical
level, which was applied through ten rules as compiled from the literature. Both the raw text
and the controlled version were translated using Google Translate. The machine translation
products were post-edited, and the pre-edited and post-edited resulting texts were
exhaustively annotated to estimate the technical effort required during both processes,
evaluate the effectiveness of the controlled language, and study the error. Pre-editing had a
positive effect and reduced the post-editing effort in the controlled text, although its impact
was lower than expected. Grammatical control and lexical-terminological control had
dissimilar outcomes. Grammar control rules were less effective than foreseen, especially
considering the high pre-editing effort required, while they were also responsible for
introducing a considerable number of errors in the controlled text. The lexical-terminological
control was highly efficient and reduced lexical accuracy errors by half. The effectiveness
of both types of language control would benefit from the development of computer tools
specifically designed for the Spanish language, which are not available to date.
Document Type
Master's final project
Document version
Director/a: Ruben Giró Anglada
Director/a: Carla Parra Escartín
Language
Spanish
Keywords
Traducció automàtica
Tesaurus
Traducció i interpretació
Edició
Investigació
Pages
132 p.
Note
Curs 2020-2021
This item appears in the following Collection(s)
Rights
Tots els drets reservats
Except where otherwise noted, this item's license is described as https://creativecommons.org/licenses/by-nc-nd/4.0/deed.ca