Ya vimos esta entrada lo útiles que pueden ser las expresiones regulares para buscar y reemplazar en Trados Studio. Pusimos un caso práctico, casi imposible de resolver sin la ayuda de expresiones regulares, pero en este artículo haremos lo mismo en Microsoft Word, una aplicación a la que quizás estamos todos más acostumbrados.
Aunque Word no tiene expresiones regulares, solo comodines, en este artículo verás que el procedimiento para resolver el mismo caso práctico es muy parecido.
Por eso, conocer la sintaxis de los comodines de Word te ayudará a avanzar con las expresiones regulares, y viceversa…
Planteamos el problema, el mismo que en este artículo. Si ya te lo conoces y no necesitas refrescarlo, puedes saltarte esta sección…
Imagina que tu mejor cliente te envía hoy un documento para traducir; un documento muy «especial», porque tiene muchas líneas de este estilo:
Lorem Ipsum dolor 20150217
sit amet, consectetuer adipiscingelit 20141130
Duis tellus. Donec ante dolor 20141202
La traducción no presenta ningún problema para ti, pero el cliente te pide que le cambies ligeramente los números. En el idioma original, cada número, va en este orden: año (4 primeras cifras), mes (2 cifras siguientes) y día (2 últimas cifras), pero tu cliente quiere que la traducción sea día-mes-año.
Por ejemplo, el texto original «20150217» debería traducirse por «17022015». Se entiende, ¿verdad?
Horrorizado, ves que el documento está plagado de estos segmentos, estimas que son centenares y centenares de segmentos que tendrás que cambiar a mano, uno a uno. Te imaginas una labor ingrata y eterna, ¿verdad? Además, te empieza a corroer la duda de si no vas a cometer ningún error mientras cambias los números…
Aquí es cuando dices eso de:
¡Odio mi trabajo!
🙂
Yo te diría entonces que no te vengas abajo, ¡y menos cuando ya está llegando el séptimo de caballería!, porque… los comodines de Word vienen en tu ayuda.
¿Empezamos ya en serio?
Los comodines de Word en tu ayuda
Igual que en el artículo anterior atacamos el problema en Studio, lo haremos ahora con Microsoft Word, por si tienes que traducir el mismo documento «especial» en Word.
En Word no hay expresiones regulares, sino comodines, pero nos servirán para solucionar el problema.
Como en Word, el comodín [0-9] significa un número decimal del 0 al 9, la primera idea que nos viene a la cabeza, es el siguiente patrón de búsqueda en Word:
[0-9][0-9][0-9][0-9][0-9][0-9][0-9][0-9]
Es decir, 8 números decimales seguidos,
Este mismo patrón es equivalente a:
[0-9]{8}
Es un patrón más simple: el número entre llaves indica el número de veces (8) que se tiene que repetir lo que antecede a las llaves (un número entre el 0 y 9).
Este patrón, efectivamente, encontrará la cadena 20150217, pero necesitamos diferenciar años, meses y días, así que tenemos que separar así el patrón:
[0-9]{4}[0-9]{2}[0-9]{2}
Y ahora agrupamos con los paréntesis:
([0-9]{4})([0-9]{2})([0-9]{2})
De esta forma, tenemos:
- un primer grupo ([0-9]{4}) para las 4 primeras cifras, el año 2015;
- un segundo grupo ([0-9]{2}) para las 2 cifras siguientes, el mes 02;
- y un tercer grupo ([0-9]{2}) para las 2 últimas cifras, el día 17.
Cada grupo va con sus paréntesis, enseguida veremos porqué.
Este es el patrón de búsqueda definitivo que nos interesa en Word, y que escribimos este patrón en el cuadro de texto Buscar dentro del cuadro de diálogo Reemplazar de Word:
Vamos ahora con la segunda parte: el patrón de sustitución.
El patrón de sustitución que nos interesa con los comodines de Word es:
\3\2\1
El patrón de sustitución \1 se corresponde con el primer grupo de paréntesis que hay en el cuadro de texto Buscar; de igual forma, el patrón \2 lo hará con el segundo grupo de paréntesis, y \3 con el tercer grupo.
En este orden, el patrón \3\2\1 cambiará año-mes-día a lo que queremos: día-mes-año.
Escribimos este patrón en el cuadro de texto Reemplazar con.
Para que estos patrones te funcionen en Word, no olvides marcar la casilla Usar caracteres comodín (es posible que tengas que pulsar el botón Más para hacer más grande el cuadro de diálogo):
Al usar los comodines para estos reemplazos, tendrás la seguridad de que no cometes fallos en tu traducción. Si hicieras los cambios manualmente y el número de cambios fuera grande, seguro que cometerías algún fallo.
Si pulsar el botón Reemplazar, Word irá reemplazando correctamente cada grupo de 8 cifras decimales.
Como siempre, mucho cuidadito con el botón Reemplazar todos…
Comparativa de comodines de Word y expresiones regulares
En esta minicomparativa, vamos a comparar estos patrones de búsqueda y sustitución (comodines de Word) con los empleados en este otro artículo (expresiones regulares en Studio), que también cambiaban el formato año-mes-día al formato día-mes-año.
a) Comparación del patrón de búsqueda
- ([0-9]{4})([0-9]{2})([0-9]{2}) es un patrón a base de comodines de Word, sí, pero que nos hubiera servido perfectamente como expresión regular en Studio.
- En regex, el patrón [0-9] es equivalente a \d. Compruébalo en el artículo dedicado a expresiones regulares en Studio.
- Desgraciadamente, en Word, el patrón abreviado \d no funciona, y hay que seguir usando [0-9].
b) Comparación del patrón de sustitución
- El comodín de Word \3\2\1 tiene una sintaxis ligeramente distinta al de regex, $3$2$1, puedes verlo en el artículo anterior, pero la idea es la misma: símbolos de dólar en vez de antibarras.
c) Conclusiones de la comparativa
Como puedes ver, el funcionamiento de los comodines es similar a las expresiones regulares. Si ya usabas comodines de Word, las expresiones regulares no te van a ser un campo completamente nuevo. De hecho, los comodines de Word son un subconjunto de las expresiones regulares.
Por sacar un punto negativo, diría que puedes llegar a confundir ambas sintaxis, y perder tiempo mientras diseñas el patrón con comodines, si tienes frescas las expresiones regulares; y viceversa, si tienes destreza con los comodines de Word, puedes llegar a confundirte con las expresiones regulares. Lo digo por experiencia vivida en carne propia…
Nomenclatura de colores
Recordamos la nomenclatura empleada en este y otros artículos sobre comodines de Word y expresiones regulares:
- los patrones de búsqueda irán sobre fondo rojo, por ejemplo, (Gond[uw]ana);
- cada patrón buscará una cadena, por ejemplo Gonduana, sobre fondo de color azul;
- el patrón de sustitución, por ejemplo Blog \1, irá sobre fondo amarillo;
- la cadena final sustituida será Blog Gonduana, e irá sobre fondo de color verde.
Ejercicios
Para comprobar que comprendes las expresiones regulares para la tarea de reemplazar cadenas de texto en un documento de Microsoft Word, te propongo que diseñes los patrones de búsqueda y de sustitución que encuentran y reemplazan:
- Un número seguido de espacio y seguido de una letra, por ejemplo 5 W. El motivo es que vas a sustituir este espacio por un espacio duro.
- «USB» seguido de un espacio, un número, un punto y un número, por ejemplo USB 3.0. El motivo es que vas a sustituir el espacio por un espacio duro.
- Nombres de protocolos, como RS232 o RS485 y los reemplace por «RS» seguido de un guión y el número de tres cifras que corresponda, como RS-232 o RS-485.
- Fechas en formato corto, como 2/febrero/2015, y las sustituye por la versión en formato largo: 2 de febrero de 2015.
Como ves, estos son patrones más de la vida real, tan reales que uso algunos como parte del proceso de QA.
En fin, si quieres participar, dando los patrones de búsqueda y de sustitución en Word, solo tienes que escribir tus patrones en un comentario debajo, o en Twitter usando las etiquetas siguientes:
#comodinesWord1, #comodinesWord2, #comodinesWord3, #comodinesWord4 para los cuatro patrones en Word pedidos, respectivamente.
Si quieres proponer un problema, solo tienes que escribirlo abajo en los comentarios del blog o en Twitter (#comodinesWord5, #comodinesWord6, etc.).
Conclusiones de los comodines de Word para buscar y reemplazar
Tanto los comodines como las expresiones regulares pueden evitarte momentos miserables y hacer tareas aparentemente tediosas y en cuestión de segundos o pocos minutos.
Repite conmigo: ¡Me encantan los comodines para buscar y reemplazar cadenas de texto en Word!
Las sintaxis de los comodines y de las expresiones regulares se parecen, lo cual puede ayudarte a saltar de los comodines de Word a las expresiones regulares de tu herramienta de traducción asistida (o quizás confundirte algo si tiendes a trabajar más con un entorno que con otro).
* * * * *
Nada más, siéntete libre de comentar lo que quieras o de suscribirte a mi boletín para no perderte ninguno de estos artículos.
muy interesante este blog, te felicito. Me puedes ayudar con lo siguiente?
Tengo muchos datos en un documento word con tablas. Y requiero lo siguiente:
Ejemplo:
0,0
0,2
0,003
4,0
4,00
4,001
Necesito que los ceros después de la coma decimal desaparezcan, es decir números enteros, por lo tanto el resultado sería el siguiente:
0
0,2
0,003
4
4
4,001
Gracias de antemano
Hola, Héctor:
¿Qué comodines has probado y qué es lo consigues?
Saludos.
... Jesús Prieto ...
Buenos días.
Está muy bien la explicación.
Está muy bien lo del cambio del formato de fecha.
Pero qué sucede si la fecha viene con barras, por ejemplo 2017/01/27 en formato año/mes/día y queremos convertirla a fecha en formato día/mes/año
Cómo tenemos que introducir los operadores comodín?
Muchas gracias.
Un saludo.
Hola, Iván:
¿Qué patrón de búsqueda has probado? ¿Te funciona o te da un error?
¿Qué patrón de sustitución has probado? ¿Te funciona? ¿Cuál es el problema?
Saludos,
… Jesús Prieto …
Tengo un Diccionario de pronunciación figurada.
La palabra original en ingles esta en "negrita", a la que sigue la [pronunciación figurada] con letra normal.
En la segunda linea está la traducción al español.
¿Cómo cambio la [Pronunciación figurada] a letra a itálica o normal italica.?
Ejemplos:
a, [æ]
un, uno, una.
abaca, [abáka]
abacá.
aback, [abák]
detras, en facha.
abacus, [abákœs]
abaco; tabla aritmética; el tablero que corona el capitel de una columna.
abaft, [abáft]
a popa, en popa.
abandon, [abándon]
abandonar, dejar.
...
Lo quiero para hacerme un .PDF de tamaño adecuado para leerlo en mi lector electrónico.
Ya lo he hecho, pero me falta poner lo de "itálica"
Gracias.
Hola, Iván:
Es el típico problema que se resuelve en seguida con comodines de Word.
¿Qué patrón de búsqueda has probado? ¿Te funciona o te da un error?
¿Qué patrón de sustitución has probado? ¿Te funciona? ¿Cuál es el problema?
Saludos,
… Jesús Prieto …
Gracias... Sí lo he conseguido.
Mi problema ha sido el que no he visto ejemplos. Y, tal vez, la política de Microsoft que parece consistir en decir que se puede hacer de forma fácil, pero sin poner ejemplos de ello.
A mi me falta mucho por aprender todavía. Me falta saber hacer un Indice en un .docx y otras muchas cosas.
Mi problema principal era que los carácteres [ y ] son usados como "operadores" de los carácteres comodin.
Era y es un problema clásico en muchos libros de "Problemas de ingenio e inteligencia" desde los primeros tiempos de la informática.
He aquí lo que he hecho:
- Cambiar el carácter [ por "guion corto"
- Cambiar el carácter ] por "guion largo" (Ambos únicos y "no existentes" en el libro.)
Luego ya ha sido usar el signo * (Cero y demas carácteres)
Buscar: ^=*^+
Reeemplazar con: ^& (Texto buscado)
Luego he dado a: Reemplazar todos.
FIN
Ahora solo me falta quitar los puntos sobrantes, es un diccionario, y la coma después de la palabra en negrilla.
Para más información diré que el .docx esta convertido desde un .PDF del proyecto Gutenberg: Diccionario Ingles-Español-Tagalog.
Ha sido convertido previamente a .txt con el programa "Nitro Reader", el cual permite además extraer las fotos de los .PDF.
Gracias... Una palabra tuya ha valido para salvarme.
🙂
Ahhh... Se mo olvido poner lo de... Fuente Cursiva:
Luego ya ha sido usar el signo * (Cero y demas carácteres)
Buscar: ^=*^+
Reeemplazar con: ^& (Texto buscado)
........................... Fuente Cursiva
Hola, Aitor:
¡Bien hecho!
Otra forma, más directa, hubiera sido.
Buscar: \[*\]
Reemplazar con: Fuente Cursiva
Se trata de anteponer la barra invertida (\) a los caracteres especiales de Word, como los corchetes en este caso.
En este otro artículo tienes ejemplos de los comodines de Word:
https://www.gonduana.com/comodines-de-word-en-profundidad/
Suerte con los comodines y Word, en general. Estoy convencido de que el tiempo dedicado a conocerlo mejor está muy bien invertido.
Que la fuerza te acompañe…
Un saludo.
… Jesús Prieto …
En estas citas y similares podrías ayudarme con un ejemplo para eliminar el espacio situado tras la coma?
Sòlo en el caso de las citas entre paréntesis
(Ez 36, 5)...........................................................debiera quedar (Ez 36,5)
(Sal 76, 11).---------------------------------------------- "" (Sal 76,11)
(1Tim 1, 15). ..........................................................""................. (1Tim 1,15)
En las frases tipo : Bernardo, serm. 3 super Cantica:
( en este caso y similares que no se encuentren entre paréntesis no sería de aplicación el buscar y reemplazar: el espacio es correcto).
Hola, Inma:
Con lo que hay en este artículo creo que puedes resolver el problema con comodines. Nu olvides poner aquí la solución, porque puedes ayudar a otros con tu ejemplo.
Si de todas formas quieres que te ayude, puedo buscarte la solución por 20 euros (pago por PayPal).
Un abrazo.
… Jesús Prieto …
Excelente aportaciones, solo que mi mente no alcanza para poder realizar lo que quiero, soy estudiante, y estoy haciendo un vocabulario de inglés español para ayudarme con las palabras, pero tengo un problema no se como decirle a word que me ponga las palabras inglesas en negritas y las palabras en español que las deje normal.
Hola:
Quisiera sustituir en una listado bibliográfico la fechas que aparecen entre puntos, por ej., .2001. por el formato APA: .(2001).
¿Me puedes ayudar. Gracias
Hola, Raúl:
Con este artículo y con este otro:
https://www.gonduana.com/comodines-de-word-en-profundidad/
no deberías tener problemas en conseguir lo que quieres con los comodines de Word.
Un saludo,
… Jesús Prieto …
eres un grande, justo lo que buscaba. GRACIAS por hacer una guía para cosas así, que no son ni tan sencillas ni tan complejas
Gracias, Pachoclo.
Espero que te resulten útiles los artículos sobre comodines de Word. En los comentarios de estos artículos también hay bastante «chicha».
Un abrazo,
… Jesús Prieto …
Hola! Gracias por tu blog!
En mi caso tengo un .docx y necesito buscar todos los nicknames ( @XXXXXXXXXX) de twitter que aparecen en el documento
El 90% aparecen iniciando linea justo después del símbolo —
Los demás no inician linea del documento y quiero evitar los @.com.
Podrías echarme un cable con esto en word
Una cuestión, tengo que cambiar todos los enlaces de una web. Tengo el texto en fichero .sql. Debo buscar esta expresión "" . Cuando uso comodines me selecciona más texto del que estoy buscando. ¿Cómo puedo hacer la búsqueda para que seleccione sólo una etiqueta que contenga ese CODIGO?
Hola, Carlos:
No dices el comodín que has intentado, aunque no te funcione.
Creo que este comodín sí te funcionará:
\
Sí es así, supongo que es porque usabas el comodín , pero los signos mayor que y menor que tienen un significado especial en los comodines de Word (inicio y fin de palabra).
Un saludo,
… Jesús Prieto …
Hola:
Estoy averiguando cómo sustituir enumeraciones, (a) > a) y he hecho está ecuación pero me busca (a) en el texto y no en la enumeración, buscar: \(([a-z0-9]{1;2})([/)])
Reemplazar: \1\2
Alguna idea?
Muchas gracias
Hola, Sara:
Las búsquedas en Word, con o sin comodines, no encuentran texto dentro de las viñetas (también llamadas bolos).
Solo puedes cambiar el estilo de las viñetas. Lo bueno es que al cambiar el estilo de una lista, toda ella se cambia a lo que quieres.
Un abrazo,
… Jesús Prieto …
Hola. El artículo ha sido muy útil, sin embargo, habitualmente debo eliminar la numeración de párrafos, con formato "[XXX]", las X siendo números, de mis documentos. He probado con la forma [0-9]{4}, pero me detecta todas las cadenas de números y nos siempre son numeración de párrafo. ¿Hay alguna forma de incorporar al patrón de búsqueda los corchetes? Es decir, que busque [xxx]" en vez de sólo números.
Hola, Estefanía:
Sí, se puede. En este otro artículo del blog puedes ver cómo meter los corchetes en os comodines:
Los comodines de Word a fondo: teoría y práctica.
¡Suerte!
… Jesús Prieto …
Muchas gracias, Jesús. Lo he logrado con el artículo que me comentas.
He estado en los Webinar de AutoHotKey de Trados, ¡muy útiles!
Estefanía:
Me alegro de que que encontraras el comodín de Word; siempre es una satisfacción encontrar la solución por uno mismo, ¿verdad?
Y me alegro también de que encontraras útiles los webinarios de AutoHotkey. Aquí en Gonduana hay bastante material también. Ya me dirás cómo va el progreso…
Un abrazo,
… Jesús Prieto …
Hola Jesús
Estoy agradecido con lo que publico, me ayudara, estoy aprendiendo a usar reemplazar y los comodines.
Hola, Abrahan:
Me alegro de que los comodines de Word te resulten útiles.
Un abrazo.
… Jesús Prieto …