¿Revisan sus documentos PDF antes de empezar a traducirlos en un sistema TAC?

Estaba dispuesta a hablar esta semana sobre los extractores de terminología, pero quiero hablar de qué se debería tomar en cuenta antes de traducir un documento entregado en formato PDF y que se ha convertido a un formato editable. Ayer, me enviaron en formato PDF un manual para traducir del alemán a español y debo entregar un documento bilingüe en formato SDLXLIFF y la memoria de traducción en formato TMX. Bueno, si el cliente le dice a uno que traduzca un documento con un sistema TAC y lo envía en PDF es porque seguramente se podrá convertir directamente con el convertidor de formatos que tiene el sistema TAC y listo. Sin embargo, sé que no necesariamente es así, cada documento en formato PDF es un mundo y se puede ver como un candidato a convertirse en un documento editable. Me ha pasado que me han enviado documentos con una calidad de imagen bastante mala y, sin embargo, los he podido convertir sin problemas, mientras que, en otras oportunidades, he recibido documentos escaneados con alta resolución que no ha habido manera de convertirlos.

Cuando se ha resuelto la conversión del documento a un formato editable, todavía queda la tarea de revisar el documento resultante. ¿Qué se debe revisar en dicho documento antes de cargarlo al sistema TAC? Aquí presento una pautas básicas que aplico a todo documento.

1.- ¿Existen saltos de párrafo en donde debería haber un espacio simple?

2.- ¿Existen espacios en blanco entre sílabas de una palabra?

3.- ¿Existen cuadros de texto en donde debería existir una tabla o en una tabla?

4.- ¿Existen cuadros de texto incrustados en un párrafo y no de todo un párrafo?

4.- ¿Se convirtieron también los textos que se incluyen en las imágenes?

5.- ¿Existen palabras con errores ortográficos, debido a que el programa no los reconoció correctamente?

6.- ¿El orden de aparición del contenido del texto es igual al del documento original?

7.- ¿Los signos de puntuación son los mismos que aparecen en el original?

Ahora bien, se podría pensar que es un trabajo laborioso el hacer esto antes de cargar el documento en el sistema TAC, pero existen razones de peso por lo que se debería hacer. Si se carga el documento al sistema TAC sin revisarlo, se reducirá la calidad del contenido que se guardará en la memoria y el tiempo que tardaría el sistema en buscar la información en dicha memoria. Por ejemplo, si no se identifican los saltos de página que deberían ser espacios simples y se corrigen, cuando aparezca el documento segmentado, podría ocurrir que dicha oración se dividió en dos segmentos, en vez de estar en uno solo. En algunos sistemas TAC se podrían unir dichos segmentos, pero no en otros sistemas en los que cada segmento se consideraría un párrafo distinto y, por esa razón, no se podrían unir, por lo que tocaría guardarlos por separado y, a la hora de encontrarnos con un segmento idéntico que contuviera la oración completa, podría pasar que se presentarían los segmentos como coincidencias parciales o simplemente no aparecería ninguna coincidencia para ese segmento, lo que haría perder tiempo, buscando las concordancias parciales y hasta se estaría guardando información duplicada.

Otro caso típico es cuando existe un espacio simple entre sílabas de palabras, por ejemplo, e jemplo o e jem plo, en lugar de ejemplo, incluso pueden existir espacios simples entre cada una de las letras que conforman la palabra, por ejemplo, e j e m p l o. En estos casos, podría ocurrir, primero, que aparezcan etiquetas de formato en esos espacios en blanco, lo que hace que, visualmente hablando, sea bien incómodo identificar lo que se vaya a traducir. Por otro lado, si al traducir se mantuvieran en los segmentos de destino dichas etiquetas, entonces, cuando apareciera un nuevo segmento idéntico al que se guardó con etiquetas de formato, pero sin etiquetas, el programa simplemente podría no reconocer el segmento guardado con etiquetas como una coincidencia exacta o al menos parcial. Si se diera el caso de que muestre la coincidencia con las etiquetas, se perdería el tiempo por tener que eliminar las etiquetas que estarían de más.

En conclusión, si van a traducir en un sistema TAC un documento que les han entregado en formato PDF, siempre revisen el documento que han convertido a formato editable, así reducirán el tiempo que tardarán traduciendo y también una tremenda rabieta mientras traducen.

¡Saludos para todos!

 

¿Cuál es la tecnología con la que podemos contar a la hora de gestionar la terminología de nuestros proyectos?

Como traductor, seguramente consultarás una gran cantidad de glosarios terminológicos y, además, crearás los tuyos propios, para, claro está, poder presentar traducciones de calidad. Quiero aprovechar esta entrada para hablar sobre cuál es la tecnología con la que podemos contar hoy en día para trabajar todo lo relacionado con la gestión terminológica de nuestros proyectos de traducción. Vale destacar que si bien este artículo va dirigido a traductores, no excluye a terminólogos, filólogos e intérpretes.

En líneas generales, me gustaría clasificar la tecnología de gestión terminológica en dos grandes grupos: las aplicaciones destinadas a organizar glosarios terminológicos y diccionarios ya creados y las aplicaciones que nos permiten crear nuestros propios glosarios terminológicos. Por supuesto, dentro de estos dos grandes grupos, se van a encontrar aplicaciones de licenciamiento tradicional (en este caso, se pueden incluir las aplicaciones que se instalan en computadoras personales y en servidores), las aplicaciones de software libre, las aplicaciones en la nube y los sistemas de gestión terminológica integrados a los sistemas de traducción asistida por computadora (TAC). No será la mejor clasificación, pero es la manera en la que puedo organizar mejor mis ideas al respecto.

Voy a empezar por las aplicaciones que nos permiten crear nuestros propios glosarios terminológicos. Dentro de las aplicaciones de plataforma independiente para crear glosarios terminológicos, se encuentran SDL Multiterm 2014 y Termstar NXT y tITerm. En el caso de las dos primeras aplicaciones, se pueden crear glosarios independientes y, posteriormente, dichos glosarios conectarlos con los sistemas de traducción asistida SDL Trados Studio 2014 y Transit NXT, respectivamente. En el caso de SDL Multiterm, ésta tiene una plantilla que se puede integrar a MS Word, lo que haría más sencillo identificar y crear una ficha terminológica directamente de un documento que esté abierto en dicho programa.

SDL MultiTerm 2014 Desktop
SDL MultiTerm 2014 Desktop

Existen otros programas de plataforma independiente que no se conectan a sistemas de traducción asistida por computadoras, tales como AnyLexic y Lingo 4.0, que, sin embargo, permiten importar y exportar glosarios en formatos como csv y xls y txt, en el caso de AnyLexic, y XML, TBX, TMX y RTF, en el caso de Lingo.

Programa de gestión terminológica AnyLexic 2.0
Programa de gestión terminológica AnyLexic 2.0

Todos estos programas que mencioné son compatibles con las distintas versiones del sistema operativo MS Windows, aunque TiTerm también es compatible con el sistema operativo Mac OS X. Si eres intérprete, te podrían interesar los siguientes sistemas de gestión terminológica: InterpretBank, Interplex y Lookup, en los dos últimos casos, las aplicaciones se han diseñado pensando no solo en el traductor, sino también en el intérprete; además, Interplex se puede descargar en el Ipad y en el Iphone. Otra cosa interesante de Interplex es su lado social, pues la empresa dona el 20% lo donan a Cystic Fibrosis Foundation

Dentro del grupo de aplicaciones web para la gestión terminológica en la nube, se tienen las siguientes: Termbases.eu, MultiQA, HyperTerm, Termweb, Evoterm, Avilingvo.Pro. Todas estas aplicaciones web permiten crear glosarios en la nube y poder acceder a ellos, desde cualquier parte del mundo, en donde se tenga acceso a Internet. Básicamente, todos ellos buscan crear glosarios, añadir, editar y eliminar términos y cuentan también con funcionalidades para importar y exportar glosarios terminológicos en distintos formatos, lo que permitiría también integrarlos a proyectos de traducción creados con sistemas de traducción asistida por computadora (TAC).  Termbase.eu, sobre el cual escribí ya hace mucho tiempo, cuenta con una versión gratuita y una paga. Así que el traductor podrá, desde el mismo momento en el que se registra, empezar a gestionar su terminología. Algunas propuestas indican que hay que registrarse a su base de datos de suscriptores, para recibir una prueba de la aplicación.

Termbases.eu
Termbases.eu

Si trabajan con sistemas de traducción asistida por computadora, el programa seguramente contará con las funciones para crear glosarios e ir añadiendo términos a los glosarios, en la medida en la que se avanza en la traducción, aunque también permite añadir términos antes de empezar y, claro está, va también a permitir importar y exportar glosarios, además, podrían tener un editor de bases de datos terminológicas, que permitiría abrir los glosarios para editar su contenido según las necesidades del traductor.

Editor de terminología de MemoQ
Editor de terminología de MemoQ

Existen aplicaciones que buscan reunir una comunidad para desarrollar un trabajo colaborativo de libre distribución en torno a la gestión de la terminología, como es el caso de Wiktionary. También, existe la comunidad de Termwiki, que tiene como objetivo crear una red social de aprendizaje a través de la terminología y se presta como un espacio para crear y discutir aspectos terminológicos. Últimamente, Termwiki la utilizan los traductores a modo de portafolio relacionado con sus aportes terminológicos.

Aparte de los sistemas de gestión terminológica, también existen los buscadores de diccionarios, glosarios y páginas web (look-up tools) que te permiten buscar simultáneamente en distintas fuentes el término deseado. Mientras la cantidad de sistemas de gestión terminológica es reducida, la cantidad de buscadores de diccionarios es más bien abrumadora, existen versiones pagas, como Wordfinder, y gratuitas, como QwickUp, Onelook Intelliwebsearch, las versiones gratuitas son las que más abundan.

IntelliWebSearch
IntelliWebSearch

Podemos complementar el uso de los buscadores de diccionarios, glosarios y páginas web con las barras de búsqueda y complementos, que nos permiten reducir el tiempo que tardamos en buscar una palabra, puesto que cuentan con una función de búsqueda, que nos permite indicarle el término que queremos buscar y automáticamente mostrará en una ventana los resultados solicitados. Generalmente, las barras de herramientas se instalan en el buscador de preferencia, a través del cual se conecta a las distintas páginas o servicios, desde donde obtiene la información que nos va a mostrar en pantalla, Term-minator o Proz toolbar serían barras de búsqueda de terminología, aunque también existen complementos que se pueden instalar en MS Word y permiten, desde ahí, buscar el término cuya información deseamos conocer, en este caso podemos hablar de Terminotix toolbar.

Esta es una brevísima clasificación de las tecnologías a las que se puede recurrir a la hora de gestionar nuestro trabajo terminológico. Queda por hablar de los extractores de terminología, pero eso lo dejo para otra entrada.

¡Saludos!

 

 

 

 

 

Nociones básicas para ejecutar el mantenimiento de una memoria de traducción

Ya tienen un largo tiempo trabajando con una memoria de traducción y les podría ocurrir que, cuando el programa de traducción asistida les muestra las concordancias parciales o exactas de una unidad de traducción activa, estas no cumplen con su criterio de búsqueda por diversas razones, como, por ejemplo, que las unidades de traducción no se hayan traducido previamente o que lo estén parcialmente o hasta que la traducción sea incorrecta. En este caso, ¡ya toca hacerle un mantenimiento a la memoria de traducción! Sin embargo, ¿cómo deberían empezar a efectuar dicho mantenimiento? En esta entrada, les explico las nociones básicas para ejecutar el mantenimiento de su memoria de traducción. La mayoría de los sistemas de traducción asistida por computadora (TAC) cuenta con una función que permite abrir las memorias de traducción para conocer su contenido; esto sería algo así como un editor de memorias de traducción, que permite, entre otras cosas, borrar las unidades de traducción, editarlas e importar unidades de traducción de otras memorias a la memoria activa. Con dichas funciones podrán hacer un mantenimiento a su memoria, es decir, buscarán las unidades de traducción que merman la calidad de su memoria y que alargan el tiempo de búsqueda de información y, por ende, que disminuyen su productividad. Si el sistema de traducción con el que trabajan no les permite mostrar el contenido de su memoria de traducción, entonces, podrían recurrir a los sistemas de control automatizado de la calidad de las traducciones (si pulsan aquí, podrán acceder al artículo que el año pasado escribí sobre estos sistemas de control de calidad).

Vista del editor de memorias de traducción de MemoQ
Vista del editor de memorias de traducción de MemoQ. Haga clic sobre la imagen para verla más grande.

¿Qué tipos de unidades de traducción se deberían buscar durante el mantenimiento? Primero, se deben buscar las unidades cuyos segmentos de destino estén vacíos. Al mostrar el editor de la memoria de traducción los segmentos de destino vacíos, tenemos la posibilidad de eliminarlos o de traducirlos. Luego, deberíamos buscar las unidades de traducción en donde el segmento de origen y los de destino sean iguales. Nuevamente, aquí se tiene la posibilidad de eliminarlos o traducirlos o, si se considera necesario, mantenerlos tal cual. Posteriormente, debemos buscar las unidades de traducción repetidas. En este caso, puede ocurrir que encontremos unidades cuyos segmentos de destino sean iguales en cuanto a contenido, pero que pueden variar, porque un segmento tiene un signo de puntuación que el otro no tiene. Podemos decidir cuál unidad eliminar o, nuevamente, mantenerlas todas en nuestra memoria, si se considera necesario.

Editor de memorias de traducción de SDL Trados Studio
Editor de memorias de traducción de SDL Trados Studio. Haga clic sobre la imagen para verla más grande.

Cabe agregar que las memorias de traducción cuentan con información que yo siempre digo que es de carácter administrativo, ya que indica, por ejemplo, quién creo la unidad de traducción, quién la editó por última vez, quién la utilizó la última vez, en qué fecha se creó, en qué fecha se modificó, cuántas veces se ha utilizado la unidad. Esta información es predeterminada. Es decir, esta información se adjuntará a la unidad de traducción que se confirma sin que nosotros se lo hayamos pedido. Con esta información, podemos, a través de filtros, buscar unidades de traducción de un traductor específico o creadas o modificados en una fecha específica. También se pueden editar o eliminar las unidades, tomando en cuenta el criterio de quién los modificó o utilizó la última vez. Por otro lado, al momento de crear una memoria de traducción, uno puede añadirle campos descriptivos, que permitan agregar más información administrativa sobre la memoria que estamos creando. Estos campos podrían ser cliente, área de especialización, estado del segmento (rechazado, aprobado, en revisión, etc.), tipo de documento, entre otros que se consideren importantes. Cada vez que se crea un proyecto, la información de dichos campos se puede modificar y así las nuevas unidades a traducir contendrán la información descriptiva actualizada. Con esa información, también se pueden filtrar las unidades que se desean editar o eliminar. Cabe agregar que, tomando en cuenta que esta información se puede modificar en algunos sistemas TAC, la misma también podría ser objeto de mantenimiento.

Dentro de nuestro mantenimiento, debemos añadir la actualización de la terminología empleada en nuestros proyectos, por lo que, en esos casos, toca buscar las unidades que contengan la terminología a editar. Quizás, durante el mantenimiento, nos preocupamos mucho por los segmentos de destino. Sin embargo, también es importante tener presente que también podríamos editar los segmentos de origen, así podemos reducir la probabilidad de que no aparezca dicho segmento en los resultados, al momento de traducir, por no parecerse al segmento activo. Una manera de buscar información sobre segmentos de origen a editar sería buscando palabras con caracteres no alfabéticos.

Al efectuar estos pocos pasos, podrán hacer un mantenimiento básico de su memoria de traducción y optimizar su contenido.

¡Un saludo para todos!

La función autotexto en la traducción asistida por computadora (TAC)

En las pocas horas de trabajo que he tenido, durante los últimos seis meses, me he dado cuenta de lo útil que ha sido la opción autotexto, al momento de traducir con ayuda de un sistema de traducción asistida por computadora (TAC).

Primero que nada, ¿en qué consiste la función autotexto? Esta función permite automatizar la inserción de texto de uso frecuente en un documento, para que no se tenga que escribir n veces las mismas palabras, frases o expresiones, de esta forma, se reduce el tiempo que tardamos en escribir. Luego de que tecleamos uno o dos caracteres, el autotexto trata de “adivinar” qué es lo que queremos escribir y nos ofrece una lista de opciones de la cual seleccionamos la que mejor nos convenga.

Función de autotexto desde el diccionario Autosuggest en SDL Trados Studio 2014
Función autotexto desde el diccionario Autosuggest en SDL Trados Studio 2014

La función autotexto ya no es de uso exclusivo de los procesadores de texto, puesto que también la podemos utilizar al redactar mensajes de correo electrónico y al escribir mensajes por medio de nuestros dispositivos móviles, tales como celulares o tabletas. También, cuando escribimos algo en nuestro buscador, sea una palabra o un enlace de una página web, sobre todo en Google Chrome, vemos cómo se nos muestra una lista de lo que podría ser nuestra búsqueda. Por supuesto, la traducción asistida no podía dejar de lado esta opción y es que observo que quienes desarrollan sistemas de traducción asistida miran mucho las funciones de los procesadores de texto y buscan la manera de integrar dichas funciones en sus sistemas.

Función de autotexto desde la lista de autotexto de SDL Trados Studio 2014
Función de autotexto desde la lista de autotexto de SDL Trados Studio 2014

 

En el caso de SDL Trados Studio, existe la función Autosuggest, que permite a partir de glosarios terminológicos, memorias de traducción con más de diez mil segmentos y frases introducidas por el propio usuario, crear sugerencias automáticas de lo que estaríamos a punto de escribir. MemoQ también cuenta con esa opción. En este caso, MemoQ analiza el segmento de origen y, si la información está en la memoria, al momento de introducir las primeras letras de la palabra, aparecerá automáticamente la posible traducción. Como dije al principio, esta función es muy común en los sistemas de traducción asistida por computadora, así que también la encontrarán en otros sistemas TAC, tales como Dèjá Vu, Transit, Wordfast, Cafetran, entre otros.

Función de autotexto de MemoQ
Función de autotexto de MemoQ

El autotexto es una función que busca de alguna manera disminuir el tiempo que uno tarda al escribir una expresión. Puede ocurrir que una porción del segmento ya esté traducida. Sin embargo, el programa podría no mostrar los segmentos en donde se encuentra esa porción, debido a que consideraría que el porcentaje de coincidencia de los segmentos de la memoria con respecto al segmento activo que se está traduciendo está por debajo del límite de concordancia establecido. También se puede considerar guardar esa porción del segmento cuando no es un término, sino más bien una frase u oración que aparece múltiples veces dentro del texto que se está traduciendo.

Son muchas las veces que observo como se subestima esta opción. Si está bien configurada, nos puede ayudar en gran medida a aumentar nuestra productividad.

¡Un saludo para todos!

 

El documento bilingüe en la traducción asistida por computadora

Meses sin escribir en el blog. ¿La razón? El nacimiento de mi primera hija. Esto me obligó a estar de permiso prenatal y postnatal. Tener una hija ha sido una bendición. Eli es una niña hermosa, inteligente y, como todo bebé, solicita siempre la atención de sus papás, así que eso ha hecho que mis horas de trabajo hayan mermado dramáticamente. Luego de seis meses, estoy empezando a organizarme un poco y, dentro de esa organización, entra el retomar la escritura en mi blog. No sé si seré constante este año, pero lo intentaré.

En esta entrada, quiero hablar sobre el documento bilingüe en la traducción asistida por computadora (TAC). Es importante que el traductor que trabaje con sistemas de traducción asistida sepa que, durante el proceso de traducción, no va a estar trabajando en el documento original, sino en un documento bilingüe. El documento bilingüe es un documento en el que se encontrará el texto segmentado junto con su traducción. Es decir, por cada segmento original se tendrá el segmento de destino. Visualmente, podríamos imaginarnos que el documento bilingüe es un documento en el que existen básicamente dos columnas. En las filas de la primera columna se encuentran los segmentos del documento original, mientras que en las filas de la segunda columna se encuentran los segmentos ya traducidos. En este documento suciounclean document, en inglés), como también se le llama, se puede incorporar información sobre la estructura del documento original.

Cuando se quiere crear ya el documento traducido, lo que hace el sistema TAC es tomar todos los segmentos traducidos que están en el documento bilingüe y los coloca en un documento final, en el lugar en el que estaban los segmentos originales correspondientes. Con todo esto, vemos que el documento bilingüe es el puente que existe entre el documento original y el documento final y es en donde el traductor trabajará, ya sea traduciendo el documento original o revisando la traducción del mismo.

El documento bilingüe también es muy útil, cuando se quieren revisar los segmentos de destino, antes de incorporarlos a una memoria de traducción. Podría ocurrir el caso en el que un cliente le envíe a un traductor el documento bilingüe y la memoria de traducción, pero se le indique que la memoria solo la va a utilizar de consulta, más no va a incorporar ningún segmento en la misma y que lo que debe enviar es el documento bilingüe ya con la traducción incorporada.

Esta manera de trabajar es muy útil para el cliente, puesto que, primero, revisa lo que el traductor ha hecho, efectúa las modificaciones necesarias en cada segmento y confirma cada uno de ellos, para guardarlo en su memoria de traducción. Además, ayuda a tener un mejor control de calidad de lo que el ciente incorpora en su memoria de traducción y reducirá el tiempo de mantenimiento de la memoria, cuando le toque hacerlo. Puede ocurrir que el cliente no envíe ningún tipo de memoria, que sólo envíe el documento bilingüe y el traductor tiene que devolverlo lleno. En este último caso, el traductor tendría que crear su memoria, pero para su propio consumo y optimización de su trabajo.

Otro motivo por el que el traductor podría enviar un documento bilingüe y no su memoria es que, al crear su memoria, podría estar utilizando reglas de segmentación diferentes a las reglas de segmentación que utiliza el cliente en sus propias memorias de traducción o también podría cargar información diferente a la que podría tener el cliente en su memoria. Por ejemplo, el traductor pudo haber creado en la memoria un campo para definir el nombre del cliente, mientras que su cliente no tiene dicho campo en la memoria.  De ahí que sea más fácil para el traductor enviar el documento bilingüe que su memoria de traducción. Si el traductor enviara su memoria y el cliente la importa a la de él, entonces, estaría cargando datos de la memoria del traductor en la memoria del cliente que a lo mejor no se quieren tener. Además, al importar la memoria de traducción del traductor en la memoria del cliente, se podrían estar perdiendo segmentos importados por diferentes razones y condiciones de importación, mientras que con un documento bilingüe, el cliente abrirá el documento en su sistema TAC, cuando lea un segmento, lo confirmará y así el segmento se guardará en la memoria del cliente, con la información de dicha memoria y no con la información de la memoria de traducción del traductor.

Para el caso de pretraducciones con SDL Trados Studio, existe la función PerfectMatch, que permite comparar los archivos de origen que se van a traducir con archivos bilingües ya traducidos, en lugar de hacerlo con una memoria de traducción. También, se pueden cargar archivos bilingües al sistema TAC, para utilizar la función de alineación y crear nuevas memorias de traducción, como ocurre con MemoQ.

El formato por excelencia del documento bilingüe es el formato .xliff. Tal como lo indican en Wikipedia, este es un formato basado en el lenguaje de etiquetado xml, creado por OASIS (Organization for the Advancement of Structured Information Standards), en el año 2002, que se utiliza para facilitar la localización, ya que puede especificar cuáles son los elementos y propiedades necesarios para almacenar el contenido que se extrae de archivos de diferentes formatos de origen (de distintos programas, como Quark Xpress, Framemaker, MS Word, MS Power Point, etc.) y su correspondiente traducción. Este formato permite extraer los elementos traducibles de los no traducibles. El traductor sólo tendría que trabajar con los elementos traducibles, luego, al crear el documento traducido o la versión final, se vuelven a unir todos los elementos y se obtiene un documento traducido al formato original.

Sin embargo, el documento bilingüe también se puede exportar del sistema TAC a otro formato. Por ejemplo, MemoQ y Déjà Vu permiten exporta el documento bilingüe a los formatos .rtf y .doc. Trados puede exportar el documento bilingüe al formato .docx, mientras que Swordfish exporta el documento bilingüe al formato HTML.  En el caso de Wordfast Pro, el documento bilingüe tiene un formato basado también en XML, que sería TXML. Ese documento también se puede exportar al formato .rtf. Debemos recordar que Trados 2007 guarda sus documentos bilingües en el formato TTX. Cabe agregar que los documentos bilingües también pueden presentarse en los formatos .po y .csv. El formato .po es el formato de los archivos bilingües dentro del mundo del software libre. Los archivos guardados en este tipo de formato no sólo se pueden editar en algunos sistemas TAC, como Swordfish y MemoQ, sino también en editores de texto específicos para este tipo de archivo, como Poedit.

Vista de un documento bilingüe en PoEdit
Vista de un documento bilingüe en Poedit. Haga clic sobre la imagen para verla más grande

Cuando se exporta el documento bilingüe a un formato .docx, .doc, .rtf o .html, no sólo se verán las columnas de los segmentos de origen y destino, sino que posiblemente existirá una columna que indique el porcentaje de coincidencia que existe entre el segmento a traducir y la memoria con la que se estaba trabajando y otra columna con los comentarios del segmento, siempre y cuando se hayan agregado comentarios; en caso de que no hayan comentarios, esa columna no existiría.  También existirá una columna con el ID del segmento.

Documento bilingüe en formato .doc generado por SDL Trados Studio 2014
Documento bilingüe en formato .doc generado por SDL Trados Studio 2014. Haga clic sobre la imagen para verla más grande

 

Con un documento bilingüe en formato .doc o .docx o .rtf, se podrían utilizar las funciones de control de cambio del procesador de texto con el que se trabaje, por ejemplo, Microsoft Word, para revisarlo y hacer los cambios respectivos en la traducción. Posteriormente, el documento bilingüe revisado se vuelve a cargar al sistema TAC y solo tocaría ir de segmento en segmento confirmando cada uno para guardar la información actualizada en la memoria de traducción.

Documento bilingüe en formato .rtf generado por MemoQ 2014
Documento bilingüe en formato .rtf generado por MemoQ 2014. Haga clic sobre la imagen para verla más grande.

 

Como podemos ver, el documento bilingüe que se crea con un sistema TAC es más útil de lo que pensamos.

¡Un saludo para todos y mucho éxito en este nuevo año que ya ha empezado!

Software para el control automatizado de la calidad de las traducciones

¡Bien! Terminaste la traducción con tu sistema de traducción asistida por computadora, pero sientes que las funciones de control de calidad no son suficientes para verificar la consistencia de tus traducciones. Si bien tengo que reconocer que observo que los desarrolladores de traducción asistida por computadora (TAC) han mejorado considerablemente las funciones de control de calidad de sus productos, considero que nunca está de más contar con programas externos que complementen el proceso de control de calidad. Estos programas externos se llaman programas o herramientas de control de calidad de las traducciones.

Las herramientas para el control de calidad de traducciones básicamente son herramientas que permiten cargar un archivo bilingüe (que contiene segmentos en la lengua original y su correspondiente traducción en la lengua de destino), para luego comparar, revisar y corregir cada segmento original con su correspondiente segmento de destino. Este tipo de herramientas también permite realizar correcciones desde el punto de vista terminológico.

Me atrevo a decir que estas herramientas de control de calidad sirven también para efectuar el mantenimiento de las memorias de traducción. Algunos programas de traducción asistida por computadora (TAC) no cuentan con esta función de mantenimiento, Swordfish Translation Editor y Wordfast Pro son dos ejemplos de ello. Otro aspecto útil es que estos programas pueden generar informes de errores que se podrían compartir con el traductor del proyecto para que verifique su traducción.

Los programas de control de calidad de traducciones cuentan con funciones básicas que permiten detectar: inconsistencias terminológicas, segmentos originales que no tienen traducción, segmentos originales y de destino idénticos, unidades de traducción repetidas, segmentos con inconsistencias en las etiquetas, segmentos con formatos incorrectos de números, errores de puntuación y de terminología, segmentos con espacions adicionales, y segmentos con errores ortográficos.

El mercado cuenta con pocas propuestas al respecto. Sin embargo, encuentro que cada opción tiene sus particularidades que la diferencia del resto. A continuación les mencionaré las que he encontrado.

ApSIC Xbench. Esta propuesta tiene ya varios años en el mercado y es una propuesta de la empresa española ApSIC, S.L. Actualmente cuenta con una versión gratuita, que sería el programa Xbench 2.9, y una versión paga que sería Xbench 3.0. Para la versión paga, el usuario paga un programa de suscripción de una año por usuario. Puede tener instalado el programa en una computadora, pero múltiples licencias, según la cantidad de usuarios que tengan acceso a la computadora y, por supuesto, al programa. Me gusta de ApSIC Xbench es que cuentan con una sección para búsquedas en Internet y también para búsqueda de terminología. Este es el único programa de control de calidad de traducciones con múltiples filtros de archivos bilingües de distintos sistemas de traducción asistida y también los formatos normalizados TMX y XLIFF. La versión paga cuesta 99 Euros sin IVA.  Para probar, pueden utilizar la versión gratuita, aunque la empresa señala que ya no hay más actualizaciones para la versión gratuita, puesto que se están dedicando al desarrollo de la versión paga. Importante saber que cuenta con un plugin para los que trabajan con SDL Trados Studio 2014 y es sólo para usuarios del sistema operativo Windows. Como último punto, que no sé si considerarlo ventaja o desventaja o ninguna de las dos, es el hecho de que se debe tener MS Word o SDLX, en caso de que los archivos bilingües están en el formato de esos programas. La licencia se renueva anualmente.

Entorno de trabajo de Apsic Xbench 2.9
Entorno de trabajo de Apsic Xbench 2.9. Haga clic sobre la imagen, para verla más grande.

D.O.G. ErrorSpy. Este programa lo ha desarrollado la empresa alemana D.O.G., especializada en servicios de traducción, documentación y desarrollo de software para el sector lingüístico. La empresa ha diseñado su producto, teniendo en cuenta al revisor de traducciones más que al traductor. El programa genera una lista de errores del archivo que está revisando. Si se necesitan revisar archivos de trados en formato TTX, se deberá tener instalada la versión de Trados compatible con dicho formato. Además de revisar, también permite efectuar las correcciones al archivo directamente en el programa. La versión Error Spy 8 Freelance ronda los 250 Euros.

Entorno de trabajo de ErrorSpy (haga clic sobre la imagen, para verla más grande)
Entorno de trabajo de ErrorSpy. Haga clic sobre la imagen, para verla más grande.

 

Verifika. Este es un producto desarrollado por la empresa Palex Group Inc. Verifika también detecta los errores de consistencia de los segmentos, de terminología y los errores ortográficos y genera la lista de errores correspondientes, además, permite realizar correcciones al archivo sin necesidad de volver al sistema de traducción asistida. Esto es útil en el caso de que se desee realizar el mantenimiento de la memoria, quizás no tanto si se trabaja con un archivo bilingüe con el que se desee actualizar la memoria posteriormente. El modelo de licenciamiento se basa tanto en el número de idiomas para revisar y el número de máquinas en donde se desea instalar el programa. La versión freelance que permite revisar un máximo de tres idiomas y sólo se puede instalar en una computadora cuesta 90 Euros. Sin embargo, no queda como muy claro si sólo puede comprar una licencia por ese monto, puesto que en las condiciones de compra, la empresa indica que para esta versión la compra mínima deberá ser de 4 licencias. Así que si eso es así, pues una licencia sin restricciones del idioma costaría 359 Euros. Anualmente, hay que actualizar la suscripción.

Entorno de trabajo de Verifika
Entorno de trabajo de Verifika. Haga clic sobre la imagen, para verla más grande.

Yamagata QA Distiller. Veo que, luego de ApSIC Xbench, QA Distiller es una de las herramientas para el control de calidad de traducciones más conocida del mercado y cuenta con muy buenos comentarios. Este es un producto de la empresa belga Yamagata Europe. Básicamente, cuenta con las mismas funciones con las que cuenta ApSIC Xbench, además del editor de correcciones, como Verifika y ErrorSpy. Al igual que Verifika, QA Distiller cuenta con una versión freelance para tres idiomas y un usuario por un precio de 249 Euros. Si se desean todos los idiomas, entonces la versión Professional para un solo usuario cuesta 1000 Euros. La versión para empresas, que tiene todas las funcionalidades y permite que cinco usuarios lo manejen cuesta 2500 Euros. Esta versión es sólo para usuarios de MS Windows.

Entorno de trabajo de QADistiller
Entorno de trabajo de QADistiller. Haga clic sobre la imagen, para verla más grande.

Moravia PQAC. Esta es una propuesta gratuita y online desarrollada por la empresa checa Moravia. Esta herramienta está en la nube y, para poder usarla, se tiene que registrar uno como usuario. Es una herramienta bastante básica, puesto que sólo genera las listas de comprobación de errores. No permite revisar archivos en formato TMX. Para generar las listas de comprobación, el sistema le da a uno 30 segundos para que pueda seleccionar todos los aspectos que desees revisar. Posteriormente, los resultados se los envían al correo con el que se registró. Los resultados los envía en formato HTML.

Entorno de trabajo de Moravia PQAC (haga clic sobre la imagen, para verla más grande)
Entorno de trabajo de Moravia PQAC. Haga clic sobre la imagen, para verla más grande.

CheckMate de Okapi. Esta es una propuesta útil para aquellos usuarios de Mac y Linux, porque es multiplataforma. En cuanto al número de  funcionalidades de comprobación, éste es menor que el de las propuestas anteriores. Solo se pueden generar listas de comprobación de errores más no se pueden editar directamente en el documento bilingüe. Además, el número de formatos a procesar es menor, pero se pueden procesar los más importantes y conocidos como son XLIFF y TMX.

Entorno de trabajo de CheckMake (haga clic sobre la imagen, para verla más grande)
Entorno de trabajo de CheckMake (haga clic sobre la imagen, para verla más grande)

Pienso que aquellos que deseen empezar a conocer las herramientas de plataforma independiente de control de calidad de traducciones deberían utilizar, primero, las versiones de prueba, para definir cuál es la herramienta que más les conviene. Es muy importante, por supuesto, tener buenas listas de referencias y glosarios terminológicos a partir de las cuales se puedan generar buenas listas de comprobación de errores. Los usuarios se quejan mucho de los falsos errores y eso depende mucho de dichas listas de referencias.

Además, pienso que, si realmente se quiere tener como complemento al sistema de traducción asistida por computadora un programa para el control de calidad de las traducciones, se debería invertir en una propuesta que, además, permita la edición de los errores en el mismo archivo, sobretodo para el caso en el que se desee hacer mantenimiento de las memorias de traducción.

¡Un saludo para todos!

 

Funciones y herramientas de edición para revisar y corregir documentos en formato PDF

Algún día toca revisar y hasta corregir documentos en formato PDF. Muchas agencias de traducción tienen la tendencia a enviar el documento final que se va a revisar en formato PDF, inclusive aunque le toque al traductor actualizar la memoria de traducción del proyecto, en caso de que estén trabajando con sistemas de traducción asistida por computadora. Para hacer la revisión, podemos utilizar lectores de PDF que cuentan con funcionalidades básicas para la revisión del documento, pero si, además, se desea corregir el documento, adjuntar archivos en los comentarios o comentarios en audio, se deberá recurrir a un editor de PDF. ¿Cuáles serían las funciones de las cuales nos podemos valer para revisar y corregir un documento en estos editores y lectores? Además, ¿A qué programas podríamos recurrir para esta tarea? A continuación menciono, primero, las funciones más comunes que vamos a ver y, luego, mencionaré algunos programas que podrán serles de utilidad.

Función para insertar notas. Las notas son como los comentarios en MS Word. Uno simplemente destaca una parte del texto e indica que desea añadir un comentario relacionado con la selección. El comentario se creará a un lado del documento y se tendrá un ícono sobre la sección que se ha comentado.

Imagen 1-Comentario en un texto en formato pdf
Imagen 1-Comentario en un texto en formato pdf

Funciones para insertar texto dentro del documento. En este caso, se puede insertar cuadros de texto dentro del documento. Existen distintos tipos de cuadros de texto. Los hay simple, pero también están las cajas de texto y las llamadas, que son cuadros de texto que incluyen una flecha que indica la referencia sobre la que se va a hacer el comentario.

Imagen 2- Caja de texto y llamada para insertar comentarios
Imagen 2- Caja de texto y llamada para insertar comentarios

Funciones para destacar el texto. Los editores deberán tener funciones para resaltar, tachar o subrayar el texto. Esto será muy útil cuando se complementa con las funciones para insertar notas o texto.

Imagen 3- Función para resaltar texto que va acompañado de un comentario
Imagen 3- Función para resaltar texto que va acompañado de un comentario

Funciones para insertar formas y sellos. Los editores de pdf cuentan con funciones para insertar distintos tipos de formas y sellos. Esto sería útil para un corrector profesional, porque le permitiría crear los símbolos que usa típicamente a la hora de revisar un documento, en lugar de añadir sólo el comentario. Me gustó mucho un artículo que leí al respecto de una correctora profesional. Si pulsan aquí, podrán leerlo.

Imagen 4-formas y sello con caja de texto, llamada y comentario
Imagen 4-formas y sello con caja de texto, llamada y comentario

Función para editar el contenido del documento. En este caso, hablo de funciones que permiten seleccionar una sección y modificar el contenido de dicha sección.

Funciones para grabar comentarios de voz. Para los correctores que no quieren escribir y se les da mejor el explicarse al hablar tienen esta función. Simplemente, se selecciona parte del texto y se activa la función para grabar el comentario.

Imagen 5- Ícono de audio que indica que se ha incluido como comentario para el texto resaltado en amarillo
Imagen 5- Ícono de audio que indica que se ha incluido como comentario para el texto resaltado en amarillo

Función para escuchar el texto. Para muchos traductores les será útil la función para escuchar, pues podría complementar la revisión que están leyendo. Creo que se necesita una gran concentración para revisar un texto de esta forma, pero también podría ser una metodología que se adapte perfectamente bien a un revisor o corrector que les guste leer y escuchar en voz alta lo que leen. Adobe Acrobat Reader cuenta con esta función. Lo único es que, para el idioma español, hay que descargarse el archivo de voz aparte.

Función para adjuntar archivos como comentarios. En este caso, la función permite adjuntar un archivo que formará parte del comentario que se está creando.

Funciones para importar y exportar comentarios. Cuando vi esta función me pregunté para qué eran necesario. La gente de Adobe, explica la razón de ser de estas funciones. Según ellos y cito textualmente “…Los documentos PDF de un flujo de trabajo de revisión suelen incluir derechos de comentario. Si agrega comentarios a un PDF que no forma parte de una revisión administrada, quizá deba exportarlos para enviárselos a alguien o importar los comentarios que reciba”. Por lo que comentarios que no tengan nada que ver con la revisión será mejor exportarlos y enviarlos a la persona indicada de canalizarlos. También, si el documento se ha creado en MS Word, pero se ha revisado en PDF, los comentarios se podrán exportar del documento en PDF e importar al documento en MS Word.

Existe una cantidad importante de lectores y editores de PDF. Aquí hago mención a una muy pequeña selección de la amplia oferta existente en el mercado.

Adobe Acrobat Pro. Esta sería la primera opción a tomar en cuenta. Si bien es un programa costoso (casi 450 USD), lo menciono como referencia, porque ahora la empresa Adobe está promocionando, además del programa de licenciamiento tradicional, el programa como servicio de software (software as a service). Así que por poco menos de 20 USD mensuales, uno se puede suscribir al servicio y tener acceso, a través de Internet, a todas las funcionaliades que ofrece la versión Adobe Acrobat Pro XI. El programa de licenciamiento tradicional es compatible con las distintas versiones de los sistemas operativos MS Windows y Mac Os.El servicio de software podrán utilizarlo todos los usuarios, independientemente del sistema operativo de su computadora.

PDF-XChange Editor. Este programa es de la empresa Tracker Software. Es un editor bastante bueno para revisar y corregir documentos en PDF. Cuenta con una versión gratuita con funcionalidades limitadas y una versión paga que para un solo usuario no sobrepasa los 50 USD. La empresa también cuenta con distintas versiones del producto,  por ejemplo, se tiene una para usuarios que utilizan el programa solo en su hogar y otra versión más completa para empresas. La versión más completa no soprepasa los 80 USD. Este programa es solo para usuarios de las distintas versiones del sistema operativo MS Windows.

Nitro Pro. Otro programa del que se habla muy bien, puesto que también cumple las funciones de Adobe Acrobat Pro, aunque su precio es mucho menor, pero no es tan económico como PDF-XChange Editor, puesto que una sola licencia sobrepasa los 100 USD. Este software lo ha diseñado la empresa Nitro Software, Inc. Lo que más me llama la atención de este programa es su entorno visual que se basa en la cinta de opciones, como en el caso de los productos de Microsoft. Cuenta también con versiones para personas naturales o usuarios que solo requieran de una sola licencia y para empresas que necesiten que el programa lo utilicen varios usuarios.

PDFEdit. Es un programa de software libre compatible con los sistemas operativos Windows y Unix. Al parecer, cuenta con una edición portátil, que no requiere de instalación. No comento mucho al respecto, porque no lo he utilizado, pero, para aquellos que son amantes del software libre, ésta es una buena opción.

Para correcciones sencillas, que no requieran edición del documento PDF, quizás con un lector de PDF es más que suficiente. Yo utilizo PDF-Xchange Viewer, pero también tengo a la mano el famoso Adobe Acrobat Reader. En este caso, es una cuestión de gustos.

¡Un saludo para todos!

 

¿Cómo podemos controlar la calidad al trabajar con programas de traducción asistida por computadora (TAC)?

 Durante las próximas cuatro entradas, me centraré en todo lo relacionado con las tecnologías aplicadas al control de calidad de los textos traducidos, pues es un área en la que también quiero profundizar un poco más. En esta oportunidad, quise empezar con las funciones de control de calidad que se pueden utilizar a la hora de traducir con sistemas de traducción asistida por computadora (TAC). Una de las primeras cosas que observo en los distintos programas TAC que manejo es que todos tienen funciones de control de calidad o de verificación. Por supuesto, unos tienen más funciones que otros. Estas funciones de control de calidad van más allá de simplemente revisar un texto y corregirlo. Aquí, la calidad va a ser muy importante no sólo para el documento final o traducción que se entrega al cliente y que, por supuesto, es la razón de ser del servicio, sino también para la información que se necesita guardar en la memoria de traducción del proyecto y que tiene que ser la mejor. De nada nos serviría que guardáramos información en donde el segmento original contenga errores o que el segmento de destino tenga una pésima traducción o tenga la información incompleta o, lo peor de lo peor, que esté vacío. Esto, en vez de ayudarnos a mejorar nuestra productividad, lo que haría es hacernos perder tiempo muy valioso por el trabajo que antes no se hizo bien. Entonces, ¿qué funciones podemos tomar en cuenta a la hora de controlar la calidad de nuestras traducciones desarrolladas con sistemas TAC?

Funciones de control de calidad de distintos sistemas TAC
Funciones de control de calidad de distintos sistemas TAC (pulse una vez sobre la imagen para verla más grande)

 

Función para añadir comentarios. Primero que nada, aunque no se incluye como parte de las funciones de control de calidad o de verificación, lo más seguro es que exista una función que permita añadir comentarios al documento que se está traduciendo. Los comentarios se pueden incluir en un segmento específico o también para el documento general. Esta función puede ser útil en distintos ambientes de trabajo como, por ejemplo, cuando existe un equipo de traductores, en donde hay un revisor y un corrector o, también, cuando un revisor indica qué cambios hay que hacer y el traductor ejecuta los cambios indicados por el revisor. Inclusive, en el caso de un traductor que trabaja solo en un proyecto, éste podrá añadir comentarios sobre problemas de sentido o terminológico que desee discutir con el cliente.

Correctores ortográficos. Parte de nuestro proceso de aseguramiento de la calidad pasa por revisar la ortografía de nuestro documento traducido. Así que es normal que exista la función de corrección ortográfica. Generalmente, el corrector ortográfico se tiene que configurar según la combinación lingüística del proyecto y del diccionario a utilizar. Puede que se tenga la opción de elegir entre el corrector ortográfico de MS Word o el corrector ortográfico de libre distribución Hunspell.

Control de cambios. Esta función la he visto en el sistema SDL Trados Studio. Al igual que la función de control de cambios de MS Word, se pueden hacer cambios y, si está activa la función, estos cambios aparecerán y para que se guarden se tendrán que aceptar. Función muy útil, porque nuevamente el revisor hace los cambios y el encargado de aprobar dichos cambios podrá aceptarlos o rechazarlos.

Exportar revisión externa. Esta función permite exportar el documento bilingüe a MS Word, en donde se podrán hacer los cambios necesarios a los segmentos de destino. En este caso, se pueden utilizar las funciones de revisión de MS Word. Los cambios se importan nuevamente al sistema TAC y se confirman, para guardarlos en la memoria de traducción. 

Vista previa de la traducción. Nada mejor que ver lo traducido en contexto, sobre todo ahora que los documentos bilingües se guardan en el formato XLIFF, lo que hace que el sistema TAC solo extraiga el texto traducible y deje lo demás intacto. Esto hace que no necesariamente el orden de los segmentos en el sistema TAC sea el mismo orden en el que aparece la información en el documento original, por ejemplo, podría mostrar todos los encabezados de un capítulo y, luego, el contenido de dicho capítulo, así que la función para tener una vista previa de la traducción permitirá que nuestras correcciones relacionadas con el estilo y el sentido sean las correctas. La vista previa la pueden generar en formato .doc o .docx o en HTML. A veces se generan vistas previas del documento bilingüe, como es el caso de Swordfish.

Función para verificar la consistencia terminológica. En este caso, la función nos permite comprobar si los términos que tenemos en nuestro glosario terminológico del proyecto se han utilizado cuando dicho término aparece en un segmento activo. Hay programas que permiten inclusive verificar si la terminología que se está utilizando es una terminología prohibida o en desuso. 

Función para verificar el estado de cada segmento. Al activar esta función, el programa nos indica cuántos segmentos quedaron sin traducirse, además, nos lleva a cada uno de dichos segmentos, para corregir el vacío existente. Por supuesto, también permite saber cuáles son los que no se han confirmado todavía o no se han guardado en la memoria de traducción. Aparte de esta función, existen los filtros, que permiten que el programa nos muestre cuáles son los segmentos que faltan por traducir, cuáles son los segmentos rechazados. También se puede determinar si un segmento de destino tiene más o menos información que su segmento original. Esto es muy útil en los casos en donde el idioma de destino requiera más cantidad de palabras que en el idioma original, así que si existe un segmento con menos palabras que el segmento original, el programa nos informará al respecto.

Función para verificar el formato de fecha y número. Si bien no todos los programas lo tienen, sí hay algunos, como MemoQ y SDL Trados Studio, que permiten verificar si el formato de fecha y de números concuerda con el formato configurado al inicio del proyecto y para la combinación lingüística para la que se está traduciendo. La revisión de estos formatos se podrá efectuar cuando se active la función de control de calidad  o de verificación (que activa varias funciones al mismo tiempo).

Funciones para verificar si existen espacios adicionales y si se cumplen las normas de puntuación. En este caso, existe siempre una función de calidad que permite verificar espacios adicionales entre palabras y al final de la oración, inclusive luego de colocar la puntuación final correspondiente para el segmento. También, el programa cuenta con una función que permite verificar si se cumple con las normas de puntuación según el idioma de destino. Esto es muy útil, sobre todo para los que traducimos al idioma español, cuando toca verificar los signos de exclamación o de interrogación, también cuando toca verificar si se han completado bien los paréntesis. El programa, además, avisará si el segmento de destino no cuenta con la misma puntuación final que el segmento original, es decir, si el segmento original tienen un punto al final y el segmento de destino tiene una coma; al activarse la función de verificación o de control de calidad, el programa avisará sobre esa variación.

Función para verificar que se hayan colocado las etiquetas respectivas. En la traducción asistida por computadora, existen las etiquetas que son como instrucciones que incluyen información sobre el formato del contenido que está entre ellas. Generalmente, la información se enmarca dentro de dos etiquetas, como para indicar el principio y el fin de donde irá un formato específico, como por ejemplo, negrita, cursiva, etc., sin embargo, no es el caso de Swordfish. Con la función para verificar las etiquetas se puede, por un lado, saber cuáles son los segmentos a los que no se les ha incorporado las etiquetas y, por otro lado, saber cuándo se han incorporado de forma incompleta.

Bien configuradas, las funciones de control de calidad o de verificación son los aliados que nos permiten garantizarles a nuestros clientes traducciones de primera calidad.

¡Un saludo para todos!

Preguntas básicas sobre el aseguramiento de la calidad en el desarrollo y localización de software

Mi ultimo artículo de la serie de artículos sobre la localización de software y de páginas web, con un enfoque más para un traductor que se está introduciendo en el mercado laboral, se centra en el aseguramiento de la calidad del software. Aquí me planteo, como lo he venido haciendo en los artículos anteriores, preguntas, que trato de responder con el libro que todo traductor debería leer antes de embarcarse en este mundo de la localización titulado A Practical Guide to Localization, de Bert Esselink, aunque, esta vez, también he recurrido a mis apuntes del curso de localización de software y de páginas web, que hice en el Institute of Localization Professionals, en el año 2009, y he consultado algunas páginas especializadas en testeo de software.

De más esta decir que podrán encontrar en la web, muchos artículos sobre este tema, escritos por traductores renombrados en el área. Yo busco aportar una visión un tanto simplificada de un área que no lo es, al menos para empezar a digerir los primeros conceptos y las primeras ideas.

1.- ¿Qué es el aseguramiento de la calidad de un software?

El aseguramiento de la calidad consta de procesos y pasos que se implementan para garantizar la calidad óptima del producto final a distribuir o servicio a prestar. En el mundo de la localización de software, cuando se habla de aseguramiento de la calidad, se busca evaluar el software a comercializar antes, durante y después del proceso de localización, para verificar que cumpla con las especificaciones de diseño iniciales.

2.- Escucho mucho hablar de testing o testeo. ¿Específicamente, qué es el testeo de software?

El testeo de software es un proceso que consiste en identificar los problemas que impiden que el programa, desde el punto de vista operativo y estético, funcione adecuadamente. La idea es identificar los problemas, informar sobre ellos y resolverlos en pro del beneficio del usuario que vaya a utilizar dicho producto. Nunca está de más decir que esta evaluación la lleva a cabo un equipo multidisciplinario de profesionales, por ejemplo, quien realiza la prueba no corrige el error que encuentra.

3.- ¿Qué tipos de testeo se pueden llevar a cabo en un software?

Desde mi punto de vista, existen varias clasificaciones. Bert Esselink identifica tres niveles de testeo que son el testeo o las pruebas de internacionalización, el testeo o las pruebas de localización y el testeo funcional o las pruebas funcionales. Hablo de testeo o de pruebas como sinónimos.

Las pruebas de internacionalización consisten en verificar qué tan bien se ha internacionalizado el producto para localizarlo posteriormente. Este tipo de pruebas se implementa a lo largo del ciclo del desarrollo del producto y comprende, a su vez, dos tipos de pruebas que son las pruebas de compatibilidad internacional (international support test) y las pruebas de localizabilidad (localizability test). En las pruebas de compatibilidad internacional se verifica qué tan compatible es el programa con los idiomas a los cuales se va a localizar y con las configuraciones regionales del mercado al que se va a distribuir, además de la evaluación de los scripts. El objetivo de estas pruebas es la de verificar qué tan fácil es ajustar el producto a un determinado mercado. Las pruebas de localizabilidad se encargan de verificar qué tan fácil es localizar el software y se determinan los ajustes que hay que efectuar al código fuente y a los hardcode-strings, nuevamente, para que se facilite el proceso de localización.

El testeo o las pruebas de localización se llevan a cabo ya en la versión traducida del software y consisten en dos tipos de prueba que son el testeo lingüístico y el testeo funcional, aquí sí no hablo de pruebas, pues es más fácil encontrar información con estas denominaciones. Estos tipos de prueba las debe ejecutar una persona cuya lengua materna sea la misma que la del idioma al que se ha traducido el programa. Inclusive, se recomienda que estas pruebas las lleve a cabo un traductor. En el caso del testeo lingüístico el encargado de evaluar el programa se enfoca en verificar si existen errores lingüísticos, tales como errores de sentido, segmentos sin traducir, errores de puntuación y de estilo, entre otros muchos aspectos. En el caso del testeo cosmético, el responsable se enfocará en evaluar la interfaz del usuario, es decir, todos los aspectos visuales del producto localizado, tales como cuadros de diálogos, menús, informes y mensajes.

El testeo funcional o las pruebas funcionales se centran en verificar que el producto cumpla con las especificaciones establecidas para el mismo y que funciona según lo estipulado durante su diseño. Al realizar estas pruebas, ya la traducción del producto debería ser la definitiva. En esta etapa, se llevan a cabo varios tipos de pruebas para verificar las características y el comportamiento del programa. En esta etapa se puede evaluar la interfaz del usuario, las API, la administración de las bases de datos, la seguridad, el proceso de instalación, entre otros aspectos. Finalmente, se pueden desarrollar dentro de esta etapa de evaluación pruebas de integración, de desempeño, de regresión y de aceptación.

Finalmente el testeo de liberación o pruebas de liberación utilizan una versión final del programa en un sistema operativo localizado. La idea es verificar la funcionalidad básica  del producto a distribuir y verificar que todas las instrucciones se llevaron a cabo y que todas las actualizaciones se implementaron y, finalmente, que el producto cumple con las especificaciones para las que fue diseñado.

4.- ¿Cuáles son los tipos de defectos que nos podemos encontrar a la hora de testear o evaluar un software?

En parte, el nombre de los defectos está relacionado con el tipo de prueba que se vaya a llevar a cabo. Entre los distintos defectos están los defectos de requisitos y los de usabilidad, además de los defectos funcionales, cosméticos, de diseño y de localización.

Los defectos de requisitos se encuentran al comparar el software con los requisitos establecidos por escrito y encontrar que existe una desviación entre lo establecido y lo desarrollado. 

Los defectos de usabilidad están relacionados con los que afectan la habilidad del usuario para interactuar con el software.

Los defectos funcionales son los defectos que más se encuentran en el software y pueden ir desde un simple error de funcionamiento, hasta errores que impiden el procesamiento adecuado de la información

Los defectos cosméticos son aquellos defectos visuales que son molestos a la vista del usuario, entre ellos, podemos tener texto truncado, mala alineación, sobreposición de los elementos debido a un tamaño inadecuado de los cuadros de diálogo o de los botones, etc.

Los defectos de diseño son defectos que se encuentran a nivel del usuario y son los que impiden que no se cumpla el flujo de trabajo para el cual se diseñó el software.

Por último, los defectos de localización consisten en los distintos errores que uno puede encontrar al efectuar las pruebas de localización, sean a nivel lingüístico o cosmético.

5.- ¿Cómo puedo llevar un control de los defectos que voy encontrando en el software?

Los defectos o errores encontrados durante las distintas etapas de pruebas se pueden registrar en los distintos informes de defectos o problemas diseñados para tal fin. La gestión y el mantenimiento de este tipo de informes lo llevan a cabo los ingenieros de pruebas y de localización. Las pruebas, además, las llevan a cabo ingenieros de software, para el caso de las pruebas de internacionalización o lingüístas o traductores, para el caso de las pruebas funcionales y cosméticas.

Idealmente, un informe de registro de errores debería contener la siguiente información: el número del problema, la fecha de cuándo se informó sobre el problema, el nombre de quien informó inicialmente el problema, el producto, su versión, la serie, el idioma en el que se encontró el error, plataforma y versión de la plataforma, el nombre del archivo, la ubicación, la causa del problema o área del producto o componente, la ubicación exacta del problema en el archivo o aplicación, la descripción del problema, los pasos necesarios para reproducir el problema, el grado de gravedad, la configuración de la máquina, la solución, quién corrigió el problema y el estado del problema.

Existen bases de datos de errores que permiten que los usuarios también incluyan capturas de pantalla de las ventanas en donde está ocurriendo el error. Algo importante que acotar es que el error se debe reproducir más de una vez, si sólo ocurre una vez, entonces no se debe informar al respecto.

6.- ¿Existen programas para llevar a cabo todas estas pruebas?

Sí, de hecho, existen muchísimos programas para ejecutar pruebas. Los hay de software libre y de licenciamiento tradicional y en la nube, pero este tópico,  seguro lo desarrollo en otra entrada. De todos modos, aquí les dejo un enlace relacionado con el tema (pulsar aquí). Sin embargo, nos debe quedar claro el hecho de que para realizar pruebas de software se deberá configurar el equipo con el que se desarrollarán las mismas, sobretodo en cuanto al sistema operativo localizado a emplear.

Quedó por fuera una gran cantidad de aspectos. Sin embargo, saber qué es una prueba o testeo de software, qué tipos de prueba existen, cuáles son los defectos que se pueden encontrar y cómo se debería informar de dichos errores al jefe de aseguramiento de calidad son los aspectos iniciales más importantes para ubicarse en un mundo bastante complejo, pero interesante.

¿Nunca te habías preguntado si hacer pruebas lingüísticas y funcionales podría ser una salida laboral para un  traductor? ¿Qué piensas ahora que has leído esta pequeña publicación sobre el tema?

¡Un saludo para todos!

 

La gestión terminológica en el mundo de la localización de software

Sigo con la serie de artículos sobre el  mundo de la localización de software. Esta vez, quiero centrarme en la gestión terminológica. Para ello, nuevamente he recurrido a Bert Esselink y su libro A Practical Guide to Localization, para conocer los aspectos claves a tomar en cuenta a la hora de gestionar la terminología que se utilizará en un proyecto de localización de software. Sigo, además, con la dinámica de plantearme preguntas y buscar las respuestas en el libro.

1.- ¿Por qué es importante la gestión terminológica en los proyectos de localización de software?

La gestión terminológica se debe tomar en cuenta para mantener la consistencia de la terminología no sólo en un producto, sino a través de las distintas versiones y lanzamientos del mismo. Si se utilizan distintos proveedores de servicios lingüísticos, será clave gestionar la terminología, para garantizar la consistencia de la misma. Por supuesto, una gestión terminológica óptima puede reducir los tiempos de entrega de las traducciones.

2.- ¿Cómo es el proceso ideal de gestión terminológica en los proyectos de localización de software?

En una etapa inicial del proyecto de localización, se debe realizar una lista de los términos claves que se deberán traducir. Posteriormente, se crean sus equivalentes en los idiomas a los que se localiza el producto. Luego, las listas se adaptan para utilizarse con sistemas de traducción asistida por computadora y de localización de software. De esta forma, se garantiza que las búsquedas sean automatizadas. Existe una etapa de revisión, en donde se verifica la precisión y consistencia de la terminología de las traducciones, tomando en cuenta lo indicado en la etapa inicial.

3.-¿Qué debe hacer el equipo responsable de la gestión terminológica de un proyecto?

El equipo encargado de la gestión terminológica de los proyectos de localización debe: revisar y aprobar la terminología genérica y específica de un producto, efectuar el mantenimiento de las bases de datos terminológicos, para garantizar calidad y consistencia, realizar búsquedas que le ayuden a tomar decisiones sobre cuál sería el mejor equivalente en un idioma, sea porque no existe un equivalente disponible o porque hay demasiados, establecer los lineamientos del uso de la terminología, para que se utilicen y alimenten los glosarios que ya se han creado y, por último, evaluar, adaptar y controlar la terminología, a través de las distintas herramientas de gestión terminológica que haya seleccionado para el proyecto.

4.- ¿Qué se gana a la hora de gestionar la terminología, tomando en cuenta que hay tantas cosas de las que hay que estar pendientes en un proyecto de localización?

Una óptima gestión terminológica ayuda a que se tenga una documentación técnica libre de ambigüedades, que sea fácil tanto de traducir como de leer por los distintos usuarios a los que va dirigido el producto. Además, permite que exista un vocabulario normalizado que facilite la comunicación corporativa interna y externa y ayude a la imagen de las empresas que desarrollan y comercializan el software. Por supuesto, no se puede olvidar que una gestión terminológica permite reducir el tiempo de traducción del producto, sobretodo a la hora de trabajar con sistemas de traducción asistida por computadora. Por último, le gestión terminológica reduce los costos en la medida en la que la misma es más eficiente.

5.- ¿Qué perspectiva se utiliza en la gestión terminológica de proyectos de localización: onomasiológica o semasiológica?

En los proyectos de localización de software, al igual que en la mayoría de los proyectos en los que se tiene que traducir documentación técnica, la perspectiva que se utiliza en la gestión terminológica es la onomasiológica, en la que hay un concepto y se presentan sus equivalentes en distintos idiomas. Los programas de gestión terminológica, tales como SDL Multiterm, han sido diseñados, tomando en cuenta esta perspectiva.

6.- ¿Cuáles son los recursos a partir de los cuales el encargado de la gestión terminológica debería empezar a crear la lista de términos?

Se pueden recurrir a distintos recursos a la hora de crear una lista de términos, entre ellos están los posibles glosarios explicativos de términos del producto original que se lanza al mercado, para que se establezca la definición de términos; las palabras claves de las ayudas en línea, la documentación técnica en el idioma original del producto de la compañía que lo desarrolla, los términos claves de la interfaz del usuario, entre otros aspectos.

7.- ¿ Se desarrolla un solo glosario para el proyecto de localización?

Cada empresa maneja la gestión terminológica según sus necesidades. Sin embargo, Bert Esselink indica que las agencias de localización desarrollan idealmente tres tipos de glosario que son el glosario del entorno operativo, el glosario del cliente y el glosario del proyecto, este último incluye los glosarios de la interfaz de trabajo y del software en general.

El glosario del proyecto debería incluir la terminología específica de la industria, los equivalentes de las palabras claves adecuadas para el producto (tanto sustantivos como verbos), los nombres del producto que no se deben traducir, las palabras y frases repetidas, los nombres de los conceptos y características y los nombres de los manuales y de los archivos de ayuda. Este tipo de glosario se crea en caso de que no exista una versión traducida previamente del producto y sería como un glosario terminológico en el idioma original del producto.

El glosario del entorno operativo (el entorno operativo puede ser Linux, MS Windows o OS Mac) permite mantener la consistencia de la terminología que se utiliza para un sistema operativo específico.

El glosario multilingüe del cliente sería el glosario con la terminología específica que utiliza el cliente y que puede contener términos genéricos del producto a localizar y términos publicitarios o nombres y características del producto.

8.- ¿Cuáles son los recursos a los que debería tener acceso un traductor que participa en un proyecto de localización?

El traductor debería tener acceso a los glosarios del proyecto, del entorno operativo y del cliente. Además, deberá tener acceso a diccionarios especializados en el área en la que se ha desarrollado la aplicación y, por supuesto, a la World Wide Web.

9.- ¿En qué formatos se debería intercambiar la información terminológica?

Según Bert Esselink, los formatos que se pueden utilizar para el intercambio de la información terminológica son Martif (MAchine-Readable Terminology Interchange Format); permite el intercambio de información terminológica entre sistemas de gestión terminológica onomasiológicos (orientados al concepto), Olif (Open Lexicon Interchange Format); permite el intercambio de información de diccionarios de traducción automática y TBX (TermBase Exchange); el formato que debería ser el formato normalizado de intercambio de información terminológica entre sistemas de traducción asistida por computadora y de localización de software.

Sin embargo, tal y como lo indico en mi entrada sobre los formatos de intercambio de información terminológica entre sistemas de traducción asistida, al parecer, el formato que mejor funciona es el formato CSV. También, en estos momentos, seguramente se están desarrollando otros formatos de intercambio de información terminológica; es cuestión de que la industria del desarrollo de software de traducción y de localización se ponga de acuerdo de una buena vez por todas al respecto.

Concluyo esta entrada señalando que detrás de la excelente localización y traducción de un software existe una excelente gestión terminológica. ¿Qué piensan ustedes?

Un saludos para todos.