Con este artículo quiero terminar, de momento, con la serie dedicada a la traducción de hojas de cálculo de Excel. Ahora vamos a ver cómo traducir el contenido incrustado que puede aparecer en una hoja de Excel.
¿Empezamos?
Índice
Lo primero es lo primero: seguramente te estás preguntando qué es eso del «contenido incrustado»…
Si he acertado, no tengo poderes adivinatorios; es una pregunta muy normal a estas alturas del artículo y empezaremos despejando esa duda:
¿Qué es el contenido incrustado?
Antes de explicar qué es el contenido incrustado, quizás debería quedar claro qué es un contenido «normal»:
Los seres vivos pueden ser unicelulares o pluricelulares.
Pues bien, el contenido incrustado sería contenido con un formato foráneo que da información adicional, por ejemplo, relativa al formato, a los enlaces a propiedades del documento, etc.
Un ejemplo de contenido incrustado sería:
<h1>Los seres vivos</h1>
Los <i>seres vivos</i> pueden ser <b>unicelulares</b> o <b>pluricelulares</b>.
<br>Las plantas se dividen en:
<ol>
<li>Briofitas</li>
<li>Pteridófitas</li>
<li>Gimnospermas</li>
</ol>
El @@Anopheles@ es vector del paludismo, mientras que el @@Aedes albopictus@ lo es del dengue.
No es solo texto corrido, sino también metainformación o metadatos sobre el texto que vas a traducir. En el ejemplo anterior, los metadatos son las etiquetas XML <h1>, </h1>, <b>, </b>, <i>, </i>, <br>, <ol>, </ol> y <li>, </li> que indicarán en un proceso posterior cómo mostrar el contenido, por ejemplo, de esta forma:
Sé que es una explicación muy para andar por casa de lo que es el contenido incrustado, pero creo que te puede valer…
⁂
¿Qué hace el contenido incrustado en una hoja de Excel?
Muy buena pregunta…
Desde hace mucho tiempo, las etiquetas de la sección anterior son habituales en las páginas HTML o en los archivos XML. Pero ¿qué hacen en Excel?
Seguramente tienen su origen en los sistemas modernos de gestión de contenidos (CMS), que empezaron a exportar los contenidos de páginas web y documentación a formato CSV o Excel. Al extenderse el uso de estos CMS, cada vez es más habitual encontrarse con contenido incrustado en Excel a la hora de traducir.
⁂
Planteamiento del problema
Entramos ya en materia…
Puede que te haya pasado: tu cliente te envía esta hoja de Excel:
Como ves, es un documento con texto y con contenido incrustado.
El cliente sugiere tener mucho cuidado con las etiquetas, so pena de que te devuelva tu traducción porque su sistema no puede importar tu traducción.
Por supuesto, este texto se puede traducir. Por ejemplo, si abres este archivo en Trados Studio, tendrás todas las cadenas en el Editor:
Pero el pánico se apodera de un traducir consumado: sabes que en cualquier momento puedes borrar sin querer algo de una etiqueta en esta maraña de palabras que hay que traducir y etiquetas que no hay que tocar.
Por ejemplo, puedes borrar sin querer un signo menor que (<) o mayor que (>), como aquí:
Los <i>seres vivos</i> pueden ser <b>unicelulares/b> o <b>pluricelulares</b>.
¿Adivinas dónde está la etiqueta incorrecta?
Difícil de encontrar, ¿verdad?
La idea de borrar algo sin querer, no darte cuenta en ese momento y tener después que arreglar el desaguisado te parece más insufrible que buscar una aguja en un pajar.
¡Pero no te preocupes!
Porque si trabajas con una herramienta de traducción asistida como SDL Trados Studio tienes una solución muy sencilla, que es la que vamos a ver a continuación.
Nota: Si bien Trados Studio siempre dispuso de filtros para procesar el contenido incrustado de archivos HTML y XML, formatos ya maduros, las primeras versiones de SDL Trados Studio no incluían la posibilidad de procesar el contenido incrustado en hojas de Excel; solo la tienen las últimas versiones, desde la 2014, cuando se hizo patente que cada vez había más contenido incrustado en Excel.
⁂
Solución: Procesar el contenido incrustado en Trados Studio
Desde la versión 2014 de SDL Trados Studio se introdujo una nueva función en los filtros de archivo de Excel, que es justamente, la de poder procesar el contenido incrustado.
Esta función de procesar el contenido incrustado está un poco escondida, es la verdad. La tienes en cualquiera de estas dos rutas de Trados Studio:
- Menú Archivo > Opciones > Tipos de archivo > Microsoft Excel 2007-201x > Procesamiento de contenido incrustado
- Configuración del proyecto > Tipos de archivo > Microsoft Excel 2007-201x > Procesamiento de contenido incrustado (en la figura)
Elige una u otra ruta según lo que quieras conseguir:
Nota: también tienes esta función en el tipo de archivo Microsoft Excel 2000-2003, ya sabes, las hojas de Excel de la extensión más antigua XLS, en vez de la más moderna, XLSX. Son exactamente los mismos ajustes que para la extensión XLSX.
Nota: Aunque aquí te muestro Trados Studio, estoy convencido de que cualquier herramienta TAO que se precie tendrá una buena solución al problema.
⁂
Configurando el procesamiento de contenido incrustado
Como te podrás suponer, hay que configurar Trados Studio para que procese correctamente todas y cada una de las etiquetas. Como vimos antes, si no haces nadas especial, Trados Studio tomará las etiquetas como texto normal, y eso no es lo que queremos.
¡Queremos que Trados Studio trate las etiquetas como etiquetas!
Sigue el siguiente procedimiento para añadir la primera etiqueta:
- Marcar la casilla del panel derecho Activar procesamiento de contenido incrustado.
- Pulsa el botón Agregar de la sección Información de estructura del documento.
- Selecciona Celda como información de estructura.
Es lógico porque tienes abierta una hoja de Excel y la celda es el elemento que debe mirar Trados Studio para reconocer la estructura. - Pulsa el botón Aceptar.
En la lista Información de estructura del documento te aparecerá sdl::cell.
Te pongo estos primeros pasos en una imagen animada:
Ahora hay que incluir en esta misma ventana cada una de las etiquetas de nuestro documento para traducir y decirle a Trados Studio cómo las tiene que procesar.
Lo veremos despacito:
Segmento 1: procesar una par de etiquetas
Por ejemplo, siguiendo el orden del documento, la primera etiqueta con que nos encontramos es <h1>, que se cierra con </h1>:
<h1>Los seres vivos</h1>
Cuando hay una etiqueta de apertura y otra de cierre, la llamaremos par de etiquetas.
Para incluir este par de etiquetas, en la anterior pantalla de ajuste de Procesamiento de contenido incrustado pulsa el botón Agregar de la sección Reglas de definición de etiquetas, en Tipo de celda selecciona Par de etiquetas. En regla de Apertura escribe <h1> y en la de Cierre </h1>. De momento, dejamos el resto de ajustes sin cambiar; sobre todo, asegúrate de que es Traducible:
Si vuelves al Editor, verás todo exactamente igual. Pero si preparas de nuevo la hoja de Excel en Trados Studio, tendrás lo siguiente en el Editor:
Como ves, han desaparecido las etiquetas <h1> y </h1> del segmento 1, que era lo que queríamos para poder traducir con un texto más limpio.
¡Pero aún lo podemos mejorar más!
Si quieres traducir aún más cómodo, puedes cambiar el formato de todos los textos h1 del documento. Para ello:
- Selecciona la etiqueta h1 en la lista Reglas de definición de etiquetas.
- Pulsa el botón Editar.
- Pulsa el botón Editar en el cuadro de diálogo Agregar/Editar regla de línea.
- Especifica un tamaño de 16 y activa el estilo negrita.
- Acepta todo.
Esto te lo cuento en esta imagen animada:
Con esta configuración, si preparas de nuevo el documento en Trados Studio, verás algo así en el Editor:
Ves la diferencia, ¿verdad?
Ahora, mientras traduces apreciarás mucho mejor que se trata de un encabezado h1 y tendrás más contexto.
Ya tenemos la primera etiqueta, de modo que, vamos al 2.º segmento…
Segmento 2: procesar otros pares de etiquetas
El segmento 2 tiene este texto:
Los <i>seres vivos</i> pueden ser <b>unicelulares</b> o <b>pluricelulares</b>.
Aquí ya sabes que tienes que incluir como pares de etiquetas <i>-</i> y <b>-</b>. Al hacerlo, tendrás esto en la configuración del Procesamiento de contenido incrustado:
Y estos segmentos en el Editor, después de preparar de nuevo el documento en Trados Studio:
Como puedes ver, los pares de etiquetas <i> y <b> aparecen ahora con el color magenta típico de las etiquetas de Trados Studio. Como siempre, puedes mover las etiquetas de sitio en tu traducción, las puedes copiar del origen al destino y si las borraras sin querer, tienes herramientas automáticas para avisarte y así podrás corregirlas.
En fin, es mucho lo que ganas con esta pequeña configuración de Trados Studio.
Por si no te has dado cuenta, hemos hecho aún más: el texto dentro de la etiqueta <i> está en cursiva, mientras que el texto dentro de las etiquetas <b> está en negrita. Este efecto se consigue de una manera similar a como hicimos con la etiqueta <h1>: activamos la cursiva para la etiqueta <i> y la negrita para la etiqueta <b>.
Fíjate bien: hasta ahora, lo único que hemos hecho ha sido cambiar la visualización dentro del Editor de Trados Studio para poder traducir mejor. Las etiquetas se ven diferentes, o no se ven en absoluto, pero nada cambiará lo más mínimo el documento que se entrega al cliente (aparte de los textos traducidos, claro está).
¿Entendido hasta aquí?
Segmentos 3 a 8: procesar una etiqueta sencilla
<br>Las plantas se dividen en:
<ol>
<li>Briofitas</li>
<li>Pteridófitas</li>
<li>Gimnospermas</li>
</ol>
Bueno, pues de un plumazo vamos a meter la etiqueta <br> como marcador de posición y, de paso, los pares de etiquetas <ol>-</ol> y <li>-</li>.
Por ejemplo, para la etiqueta <br> tendrás:
Cuando termines, en la ventana de Procesamiento de contenido incrustado tendrás:
Y en el Editor de Trados Studio, cuando prepares de nuevo la hoja de Excel:
Se ve mucho mejor así, ¿verdad?
Fíjate bien lo que ha pasado:
- En el segmento 3 ha desparecido la etiqueta <br>. El motivo es que en el cuadro de diálogo Agregar/Editar regla de línea he pulsado el botón Avanzada y he elegido Excluir en la lista Comportamiento del marcador de posición:
Fíjate que es lógico definir la etiqueta <br> como excluida del Editor, porque <br> solo indica un salto de línea. - Han desparecido dos segmentos, los correspondientes al par de etiquetas <ol>-</ol>. El motivo es el mismo que para la etiqueta <br>: he decidido excluir estas etiquetas del Editor de Trados Studio y, como en esos dos segmentos no hay nada más que traducir, Trados Studio decide automáticamente eliminarlos. Tiene sentido, ¿verdad?
- En los segmentos 4 a 6 han desparecido los pares de etiquetas <li>-</li>. El motivo es el mismo que para la etiqueta <br> y <ol>-</ol>: las he excluido del Editor de Trados Studio.
Además, he elegido un color azul para el texto de la etiqueta <li>-</li>. De esa forma, durante la traducción podré identificar mejor que se trata de una lista.
Antes de terminar, vamos a ver el último tipo de contenido incrustado que había en la hoja de Excel de prueba:
Segmento 9: no todo es HTML…
Hemos visto ya unas cuantas etiquetas, y si me has seguido hasta aquí, todas «huelen» a HTML: encabezados, negritas, cursivas, viñetas, etc.
Lo cierto es que no tiene que ser siempre tan evidente…
Como ejemplo de esto último, el segmento 9 original tiene una estructura que te haría pensar que es completamente diferente:
El @@Anopheles@ es vector del paludismo, mientras que el @@Aedes albopictus@ lo es del dengue.
No te amilanes con esas arrobas (@): ¡Trados Studio también las puede procesar!
Es más, lo veremos de dos formas distintas:
- con un par de etiquetas
- con una expresión regular
En el primer caso, añade una nueva regla en línea, un par de etiquetas, escribe @@ en regla de Apertura y @ en la de Cierre, y define que no es traducible:
Acepta todo y vuelve a preparar la hoja en Trados Studio para conseguir este segmento con las etiquetas procesadas:
Chulo, ¿verdad?
Que no se te olvide: no todas las etiquetas tienen que tener signos mayor y menor que…
Segmento 9: de otra forma (regex)
Veremos otra forma de procesar el segmento 9.
Puedes comprobar que puedes borrar la regla añadida en la primera forma y sustituirla por esta otra:
En esta nueva forma hay que incluir una nueva regla en línea, esta vez como marcador de posición, y escribir @@.+?@ en regla de Apertura (ver imagen).
Aquí se ha empleado una expresión regular @@.+?@ que, analizada paso a paso, significa lo siguiente:
- @@ busca dos arrobas consecutivas
- seguido de cualquier cosa (.+?)
- hasta encontrar la siguiente arroba (@)
y marca lo que encuentre como una etiqueta no traducible en el Editor y Trados Studio seguirá procesando bien estas etiquetas con arrobas:
En el Editor de Trados Studio ves una cosa similar al primer caso, pero prefiero esta segunda forma, que no tiene etiquetas con candados…
Notas:
- Si entiendes la expresión regular empleada, te recomiendo que eches un vistazo a los artículos de expresiones regulares de este mismo blog.
- Para este ejemplo tan sencillo, admito que emplear una expresión regular quizás sea el método más complicado, pero habrá situaciones en la que la versatilidad de las expresiones regulares te sacará del apuro. ¡No las descartes aún!
Como ves, hemos incluido en la configuración de Procesamiento de contenido incrustado todas las etiquetas que había en el documento. Por supuesto, en la vida profesional puede llegarte un documento con más etiquetas y más complicadas. Pero con lo visto en el artículo, puedes estar seguro de que sabrás empezar a limpiar el documento de etiquetas para así facilitar tu tarea de traducción, que es la importante.
Lo ideal es añadir todas las etiquetas del documento. Puede que sean muchas y se te escape alguna… En este caso, no te preocupes, que no se acabará el mundo: siempre podrás añadir una etiqueta o modificarla a posteriori.
⁂
Conclusiones
Entonces… ¿cómo traducir el contenido incrustado en una hoja de Microsoft Excel?
El procesamiento del contenido incrustado se configura en el menú Procesamiento de contenido incrustado dentro del tipo de archivo que tengas (XLSX o XLS).
Hemos visto cómo añadir las etiquetas (en pares o no) y cómo cambiar el formato en que aparecen en el Editor de Trados Studio.
Las reglas incluidas son:
El triple objetivo es traducir en Trados Studio:
- Más cómodamente: es más fácil controlar 1 etiqueta que los 3 caracteres como mínimo de la etiqueta en formato texto. Además, las etiquetas de color magenta se identifican mejor.
- Con más contexto, ya que podemos dar formato de cursiva a etiquetas más conocidas, como <b> y <i>, por ejemplo.
- Sin temor a equivocarse por borrar etiquetas sin querer, ya que en Trados Studio puedes verificar automáticamente que no te falta ninguna.
Los segmentos con el contenido incrustado procesado son:
Compáralo con los segmentos que tenías al principio, con el contenido incrustado sin procesar:
¿Cuál prefieres?
Procesando el contenido incrustado, ¿verdad?
¡Pues ahora ya sabes cómo hacerlo!
⁂
Si no te quieres perder ningún artículo de Gonduana, suscríbete al boletín del blog, o sígueme en LinkedIn, Facebook o Twitter (@jssprt). De esta manera, serás el primero en enterarte de las siguientes publicaciones.
Si quieres leer otros artículos sobre Excel de Gonduana. Los tienes todos si filtras por «Excel» en la nube de etiquetas (columna derecha del blog).