Si tienes una lista de términos en la aplicación Microsoft Word, seguramente te gustará borrar los duplicados que pueda contener.
Aquí tienes un sencillo comodín de Word para conseguirlo.
¿Empezamos?
Índice
Planteamiento del problema
Tienes esta lista de términos en Word:
Como ves hay algunas líneas duplicadas:
Y quieres borrar todo lo que esté repetido.
La pregunta es: ¿Cómo borrar estas líneas duplicadas?
⁂
Solución al problema en Microsoft Word
La solución es un procedimiento de 2 pasos dentro de Microsoft Word:
- ordenar la lista (con el botón Ordenar)
- borrar duplicados (con comodines)
Los veremos más detenidamente:
1. Ordenar la lista (con el botón Ordenar)
Lo primero que habría que hacer es ordenar alfabéticamente la lista de términos.
Para ello, pulsa el botón Ordenar en la cinta Inicio de Microsoft Word:
Puedes aceptar los valores predeterminados que te ofrece el cuadro de diálogo Ordenar texto:
Así tendremos todos los duplicados de forma consecutiva:
¿Ves que ahora la lista está ordenada?
Este orden alfabético es vital para el siguiente paso.
2. Borrar duplicados (con comodines)
¡Ahora empieza lo bueno!
Antes de continuar, te aviso de que quizás te interese repasar este artículo que trata de los comodines de Word, que es la herramienta que vamos a emplear para borrar los duplicados:
Advertidos todos, recordamos ahora el objetivo: buscar un comodín de Word que encuentre y borre los duplicados.
El comodín con el patrón de búsqueda que buscamos es:
(^13*){2}^13
Mientras que el patrón de sustitución es:
\1^13
Es decir, que el cuadro de diálogo Buscar y reemplazar de Word debería ser:
Asegúrate de tener marcada la casilla Usar los caracteres comodín antes de pulsar el botón Reemplazar todos.
Ahora tendrás una lista nueva en la que se han borrado todos los duplicados:
¿Ves que los duplicados de «IBM» y «Microsoft han desaparecido de la lista?
¡Buen trabajo!
⁂
Los comodines de Word empleados
Ahora veremos detenidamente los patrones de búsqueda y de sustitución empleados, con un breve inciso para la nomenclatura empleada en los colores de textos del artículo).
0. Nomenclatura de colores
La nomenclatura de colores que estamos usando en estos artículos de la serie de comodines de Word es la siguiente:
- los patrones de búsqueda irán sobre fondo rojo, por ejemplo, (Gond[uw]ana);
- cada patrón encontrará una cadena, por ejemplo Gonduana, sobre fondo de color azul;
- el patrón de sustitución, por ejemplo Blog \1, irá sobre fondo amarillo;
- la cadena final sustituida será Blog Gonduana, e irá sobre fondo de color verde.
1. Patrón de búsqueda
Miramos primero el patrón de búsqueda, que, lo recordamos, es:
(^13*){2}^13
Empezamos poco a poco con el interior de los paréntesis…
^13 indica un retorno de carro en Word, ya sabes, esas marcas que aparecen en Word que se llamar calderones (¶).
El asterisco * indica que hay que buscar «cualquier cosa».
Por tanto, el comodín (^13*) buscará un retorno seguido de cualquier cosa.
¿Para qué sirven los paréntesis?
Los paréntesis no sirven para buscar algo directamente, sino para agrupar y guardar una referencia. En este caso, la llamaremos la referencia número 1 y la emplearemos en el patrón de sustitución (lo explicamos en breve).
Buscar un retorno y cualquier cosa no parece muy prometedor, ¿verdad?, pero te ruego un poco de paciencia…
¡No desesperes!
{2;}, la siguiente parte del patrón de búsqueda, significa buscar lo inmediatamente anterior repetido 1 vez más, en total 2 veces.
Por último, buscamos un último retorno más con el comodín ^13.
Resumiendo, el patrón de búsqueda completo (^13*){2}^13 buscará esquemáticamente esta cadena:
retorno + línea
retorno + línea idéntica consecutiva + retorno
Fíjate bien que es una forma rebuscadísima de definir una línea duplicada, pero es justo lo que se necesita para dar con el comodín adecuado en Word.
1. Patrón de sustitución
Recordamos el patrón de sustitución:
\1^13
Aquí, \1 significa lo encontrado en los paréntesis del patrón de búsqueda, es decir, una línea que hemos encontrado duplicada. El número 1 de \1 indica la referencia número 1 comentada antes o, lo que es lo mismo, el contenido encontrado por la primera pareja de paréntesis. En este patrón de sustitución solo hay una pareja de paréntesis, pero hay veces que hay que emplear \2 y \3, etc.
El retorno añadido con ^13 sirve para restituir el último retorno encontrado; de otra forma, se perdería y no es lo que queremos…
Por tanto, el patrón de sustitución sustituirá un retorno y 2 líneas consecutivas iguales por la primera línea, desapareciendo la línea duplicada.
De forma esquemática, el patrón de sustitución completo \1^13 sustituye las líneas encontradas antes por esta cadena:
retorno + línea + retorno
Si lo has entendido, ¡enhorabuena! Si no, ahora es un buen momento para consultar la teoría de comodines en los artículos mencionados arriba.
⁂
Notas sobre el proceso
Es posible que no te hayas dado cuenta, pero en este proceso se han dejado varias minas ocultas:
- La lista final está ordenada alfabéticamente y quizás no lo estaba al principio.
- En la lista final se han borrado también las líneas vacías.
El motivo es que el asterisco también encuentra líneas vacías (ningún carácter). - Este método no borra todos los duplicados de una sola pasada, por lo que deberás pulsar el botón Reemplazar todos hasta que tengas este mensaje de Word:
Por ejemplo, si tienes un término duplicado 20 veces, deberás pulsar 7 veces el botón Reemplazar todo.
Puedes probar con algún otro patrón de sustitución, como (^13*){2;}, pero ya te aviso de que este y todos los que he probado tienen algún fallo.
Pero si encuentras un patrón de búsqueda que borre todos los duplicados, no olvides compartirlo en la sección de comentarios del artículo. Todos te lo agradeceremos… - Este método no detecta como duplicada la segunda línea respecto de la primera del documento si no hay antes un retorno.
El motivo es que lo primero que se busca es un retorno.
Remedio casero: Añadir un retorno al inicio del documento después de ordenarlo, es decir:
- Este método distingue mayúsculas y minúsculas. Es decir, que «IBM» es diferente a «ibm».
El motivo radica en los comodines de Word, que distinguen las mayúsculas de las minúsculas.
Cualquiera de estas minas puede significar que este método no sea lo que buscas. Así que fíjate bien en lo que necesitas…
Si este método no es lo que buscas, quizás te puede servir alguno de estos otros métodos de borrar duplicados:
- Cómo borrar los duplicados de una lista
- Un ejemplo de comodines de Word y quitar los duplicados en Excel
⁂
Comodines extra
Con el sabor dulce de la victoria aún en los labios, ¿sabrías explicar por qué estos patrones también funcionan?:
- Patrón de búsqueda: (^13*)\1^13 (el anterior era (^13*){2}^13).
- Patrón de sustitución: \1^p (el anterior era \1^13).
¿Aceptas el desafío?
2 pequeñas pistas:
- Sí, las referencias \1, \2, \3… también funcionan en el patrón de búsqueda.
- No, los retornos ^p no funcionarían en el patrón de búsqueda.
⁂
Conclusiones del método para borrar duplicados en Word
Con este método hemos borrado todos los duplicados en un documento de Word.
Para ello, primero se ordena alfabéticamente la lista y luego se borran los duplicados aprovechando los comodines de Word.
⁂
Si no te quieres perder ningún artículo de Gonduana, suscríbete al boletín del blog con el siguiente formulario o sígueme en LinkedIn, Facebook o Twitter (@jssprt). De esta manera, serás el primero en enterarte de las siguientes publicaciones.
Si quieres leer otros artículos sobre comodines de Word de Gonduana, los tienes todos si filtras por «comodines» en la nube de etiquetas del blog.
⁂
La imagen del robot es cortesía de Proycontec, con licencia CC Attribution-Share Alike 4.0, sin cambios implementados en la misma y uso comercial permitido.
Muchas gracias, ¡brillante explicación y solución!
segui estos pasos pero.... no se borran los duplicados