Meses sin escribir en el blog. ¿La razón? El nacimiento de mi primera hija. Esto me obligó a estar de permiso prenatal y postnatal. Tener una hija ha sido una bendición. Eli es una niña hermosa, inteligente y, como todo bebé, solicita siempre la atención de sus papás, así que eso ha hecho que mis horas de trabajo hayan mermado dramáticamente. Luego de seis meses, estoy empezando a organizarme un poco y, dentro de esa organización, entra el retomar la escritura en mi blog. No sé si seré constante este año, pero lo intentaré.

En esta entrada, quiero hablar sobre el documento bilingüe en la traducción asistida por computadora (TAC). Es importante que el traductor que trabaje con sistemas de traducción asistida sepa que, durante el proceso de traducción, no va a estar trabajando en el documento original, sino en un documento bilingüe. El documento bilingüe es un documento en el que se encontrará el texto segmentado junto con su traducción. Es decir, por cada segmento original se tendrá el segmento de destino. Visualmente, podríamos imaginarnos que el documento bilingüe es un documento en el que existen básicamente dos columnas. En las filas de la primera columna se encuentran los segmentos del documento original, mientras que en las filas de la segunda columna se encuentran los segmentos ya traducidos. En este documento suciounclean document, en inglés), como también se le llama, se puede incorporar información sobre la estructura del documento original.

Cuando se quiere crear ya el documento traducido, lo que hace el sistema TAC es tomar todos los segmentos traducidos que están en el documento bilingüe y los coloca en un documento final, en el lugar en el que estaban los segmentos originales correspondientes. Con todo esto, vemos que el documento bilingüe es el puente que existe entre el documento original y el documento final y es en donde el traductor trabajará, ya sea traduciendo el documento original o revisando la traducción del mismo.

El documento bilingüe también es muy útil, cuando se quieren revisar los segmentos de destino, antes de incorporarlos a una memoria de traducción. Podría ocurrir el caso en el que un cliente le envíe a un traductor el documento bilingüe y la memoria de traducción, pero se le indique que la memoria solo la va a utilizar de consulta, más no va a incorporar ningún segmento en la misma y que lo que debe enviar es el documento bilingüe ya con la traducción incorporada.

Esta manera de trabajar es muy útil para el cliente, puesto que, primero, revisa lo que el traductor ha hecho, efectúa las modificaciones necesarias en cada segmento y confirma cada uno de ellos, para guardarlo en su memoria de traducción. Además, ayuda a tener un mejor control de calidad de lo que el ciente incorpora en su memoria de traducción y reducirá el tiempo de mantenimiento de la memoria, cuando le toque hacerlo. Puede ocurrir que el cliente no envíe ningún tipo de memoria, que sólo envíe el documento bilingüe y el traductor tiene que devolverlo lleno. En este último caso, el traductor tendría que crear su memoria, pero para su propio consumo y optimización de su trabajo.

Otro motivo por el que el traductor podría enviar un documento bilingüe y no su memoria es que, al crear su memoria, podría estar utilizando reglas de segmentación diferentes a las reglas de segmentación que utiliza el cliente en sus propias memorias de traducción o también podría cargar información diferente a la que podría tener el cliente en su memoria. Por ejemplo, el traductor pudo haber creado en la memoria un campo para definir el nombre del cliente, mientras que su cliente no tiene dicho campo en la memoria.  De ahí que sea más fácil para el traductor enviar el documento bilingüe que su memoria de traducción. Si el traductor enviara su memoria y el cliente la importa a la de él, entonces, estaría cargando datos de la memoria del traductor en la memoria del cliente que a lo mejor no se quieren tener. Además, al importar la memoria de traducción del traductor en la memoria del cliente, se podrían estar perdiendo segmentos importados por diferentes razones y condiciones de importación, mientras que con un documento bilingüe, el cliente abrirá el documento en su sistema TAC, cuando lea un segmento, lo confirmará y así el segmento se guardará en la memoria del cliente, con la información de dicha memoria y no con la información de la memoria de traducción del traductor.

Para el caso de pretraducciones con SDL Trados Studio, existe la función PerfectMatch, que permite comparar los archivos de origen que se van a traducir con archivos bilingües ya traducidos, en lugar de hacerlo con una memoria de traducción. También, se pueden cargar archivos bilingües al sistema TAC, para utilizar la función de alineación y crear nuevas memorias de traducción, como ocurre con MemoQ.

El formato por excelencia del documento bilingüe es el formato .xliff. Tal como lo indican en Wikipedia, este es un formato basado en el lenguaje de etiquetado xml, creado por OASIS (Organization for the Advancement of Structured Information Standards), en el año 2002, que se utiliza para facilitar la localización, ya que puede especificar cuáles son los elementos y propiedades necesarios para almacenar el contenido que se extrae de archivos de diferentes formatos de origen (de distintos programas, como Quark Xpress, Framemaker, MS Word, MS Power Point, etc.) y su correspondiente traducción. Este formato permite extraer los elementos traducibles de los no traducibles. El traductor sólo tendría que trabajar con los elementos traducibles, luego, al crear el documento traducido o la versión final, se vuelven a unir todos los elementos y se obtiene un documento traducido al formato original.

Sin embargo, el documento bilingüe también se puede exportar del sistema TAC a otro formato. Por ejemplo, MemoQ y Déjà Vu permiten exporta el documento bilingüe a los formatos .rtf y .doc. Trados puede exportar el documento bilingüe al formato .docx, mientras que Swordfish exporta el documento bilingüe al formato HTML.  En el caso de Wordfast Pro, el documento bilingüe tiene un formato basado también en XML, que sería TXML. Ese documento también se puede exportar al formato .rtf. Debemos recordar que Trados 2007 guarda sus documentos bilingües en el formato TTX. Cabe agregar que los documentos bilingües también pueden presentarse en los formatos .po y .csv. El formato .po es el formato de los archivos bilingües dentro del mundo del software libre. Los archivos guardados en este tipo de formato no sólo se pueden editar en algunos sistemas TAC, como Swordfish y MemoQ, sino también en editores de texto específicos para este tipo de archivo, como Poedit.

Vista de un documento bilingüe en PoEdit

Vista de un documento bilingüe en Poedit. Haga clic sobre la imagen para verla más grande

Cuando se exporta el documento bilingüe a un formato .docx, .doc, .rtf o .html, no sólo se verán las columnas de los segmentos de origen y destino, sino que posiblemente existirá una columna que indique el porcentaje de coincidencia que existe entre el segmento a traducir y la memoria con la que se estaba trabajando y otra columna con los comentarios del segmento, siempre y cuando se hayan agregado comentarios; en caso de que no hayan comentarios, esa columna no existiría.  También existirá una columna con el ID del segmento.

Documento bilingüe en formato .doc generado por SDL Trados Studio 2014

Documento bilingüe en formato .doc generado por SDL Trados Studio 2014. Haga clic sobre la imagen para verla más grande

 

Con un documento bilingüe en formato .doc o .docx o .rtf, se podrían utilizar las funciones de control de cambio del procesador de texto con el que se trabaje, por ejemplo, Microsoft Word, para revisarlo y hacer los cambios respectivos en la traducción. Posteriormente, el documento bilingüe revisado se vuelve a cargar al sistema TAC y solo tocaría ir de segmento en segmento confirmando cada uno para guardar la información actualizada en la memoria de traducción.

Documento bilingüe en formato .rtf generado por MemoQ 2014

Documento bilingüe en formato .rtf generado por MemoQ 2014. Haga clic sobre la imagen para verla más grande.

 

Como podemos ver, el documento bilingüe que se crea con un sistema TAC es más útil de lo que pensamos.

¡Un saludo para todos y mucho éxito en este nuevo año que ya ha empezado!