
A veces las las palabras se repiten como por arte de brujería, ¿verdad verdad? Hoy veremos una forma de buscar palabras repetidas en Word. En vez de confiar en darnos cuenta en algún momento del error o en que el corrector integrado nos informe de la corrección corrección, emplearemos los comodines de Word.
Índice
Planteamiento básico del problema
El problema básico, que lo complicaremos al final, es que a veces escribiendo no nos damos cuenta de que hemos dejado una palabra repetida repetida.
Es muy posible que el corrector de Word nos indique esta repetición con un subrayado de color rojo, como:
Solo oigo eco eco.
Pero si no es el caso, porque tenemos el corrector de Word desactivado, si hacemos una revisión automática con comodines del documento, aún podremos detectar estas repeticiones muy fácilmente.
¿Cómo?
Pues sigue leyendo, mi querido lector.
⁂
Nomenclatura de colores
Antes de ver la solución, quiero que tengas a mano a nomenclatura de colores que estamos usando en estos artículos de la serie de comodines de Word, por si quieres consultarla en cualquier momento:
- los patrones de búsqueda irán sobre fondo rojo, por ejemplo, (Gond[uw]ana);
- cada patrón encontrará una cadena, por ejemplo Gonduana, sobre fondo de color azul;
- si un patrón NO encuentra una cadena, por ejemplo Pangea, se marcará sobre un fondo de color gris;
- el patrón de sustitución, por ejemplo Blog \1, irá sobre fondo amarillo;
- la cadena final sustituida será Blog Gonduana, e irá sobre fondo de color verde.
En este artículo, como ya habrás notado, cualquier palabra repetida repetida se marca con un subrayado curvilíneo de color rojo, similar al de Word.
⁂
La solución
La solución se basa en encontrar un comodín de Word para encontrar las palabras repetidas.
Nos basamos en la teoría de este artículo e iremos poco a poco, pero si te pierdes, te recomiendo ir a ese artículo y repasarlo antes de continuar.
Vamos a buscar palabras repetidas, ¿verdad?
Para buscar palabras repetidas, estarás de acuerdo en que primero hay que buscar una palabra.
Pues eso es lo que haremos: Buscar una palabra.
⁂
1. Comodín para buscar una palabra
¿Cuál es el patrón de búsqueda que encuentra una palabra completa en Word?
Para eso, antes hay que definir «palabra». No nos complicaremos mucho la vida y diremos que una palabra es una secuencia de letras, dejando de lado los números.
Pues si el comodín [a-z] es una letra minúscula, para considerar una letra minúscula o mayúscula habrá que empezar con el comodín [a-zA-Z] y de esta forma consideramos todas las letras del alfabeto, el intervalo completo de la a la z.
¿Estás seguro?
Vale, querido lector. Quería sembrar la duda en tu mente y quizás lo he conseguido…
Lo digo por si dudaste de si nuestras queridas eñe y vocales acentuadas estaban incluidas en ese intervalo.
La respuesta es un rotundo SÍ: el intervalo [a-z] incluye las letras á, é, í, ó, ú, ü y ñ.
Esto es solo el principio: Ya podemos encontrar una letra; pasemos a encontrar una palabra.
Una palabra puede decirse que es una secuencia de varias letras, ¿verdad?
Pues eso trasladado al mundo de los comodines de Word es:
[a-zA-Z]{1;}
Es decir, una letra cualquiera repetida 1 o varias veces, teniendo en cuenta las mayúsculas.
☛ En función de tu configuración de Windows, es posible que necesites cambiar el punto y coma ; del comodín por una coma ,. En el resto del artículo supondremos que es un punto y coma.
En Word, los comodines menor que y mayor que (< y >) resultan muy útiles para indicar el principio y el final de una palabra, respectivamente. Una palabra puede representarse por:
<[a-zA-Z]{1;}>
El anterior comodín funciona, pero al final vamos a utilizar este otro equivalente para encontrar una palabra dentro de Word:
<[a-zA-Z]{1;})
☛ Fíjate que hemos sustituido el símbolo mayor que > (final de palabra) y lo hemos sustituido por un espacio (el espacio que separa dos palabras consecutivas).
☛ Si quieres saber el motivo de usar el segundo comodín y no el primero, lo tienes en el anexo del artículo.
Que quede claro, nuestro comodín para buscar una palabra va a ser:
<[a-zA-Z]{1;}
Ya estamos más cerca…
Una vez que tenemos el comodín que encuentra una palabra, solo nos falta un comodín para buscar dos palabras repetidas. Algo que veremos en la siguiente sección.
⁂
2. Comodín para buscar palabras repetidas en Word
Si <[a-zA-Z]{1;} nos encuentra una palabra seguida por un espacio, ¿cómo encontrar la misma palabra repetida?
☛ Fíjate que el patrón de búsqueda <[a-zA-Z]{1;} [a-zA-Z]{1;}> no nos valdría, porque nos encontraría dos palabras seguidas cualesquiera, como hola adiós, que está claro que no es lo que buscamos.
No lo demoro más, porque si mantengo más la tensión, me vas a hacer vudú…
🙂
El comodín para encontrar dos palabras repetidas en Word es:
(<[a-zA-Z]{1;}) \1>
A continuación, analizaremos un poco este comodín:
En las tripas del comodín
Si recuerdas la teoría, los paréntesis ( y ) no cambian lo que se busca, sino que permiten crear una referencia.
☛ Si no lo recuerdas, ahora es el momento oportuno para repasar el artículo de comodines de Word.
Como se trata de la primera pareja de paréntesis del comodín, se trata de la primera referencia.
Si te das cuenta, dentro de los paréntesis está nuestra definición de palabra.
A continuación, sigue el espacio separador de palabras .
El patrón de búsqueda sigue con \1, que es una referencia al primer grupo de paréntesis, es decir, una palabra.
☛ Digo «primer grupo de paréntesis, aunque es el único, porque si hubiera más parejas de paréntesis, las siguientes referencias serían \2, \3, etc.
Por último, el signo mayor que > es el comodín para indicar el final de la segunda palabra, la repetida.
Si lo piensas bien, (<[a-zA-Z]{1;}) \1> encontrará eco eco, pero no eco ecografía. El motivo es que encuentra una palabra seguida de un espacio seguido por la misma palabra.
Una vez identificada las palabras repetidas, podremos borrar uno de los dos eco encontrados con la tecla SUPR.
Y asunto terminado, ¿verdad?
Nada lo impide… Pero ¿por qué no borrar automáticamente la palabra repetida!
¿Es posible?
Pues claro que sí. Es lo que veremos en la siguiente y última sección:
⁂
3. Comodín para borrar la palabra repetida
Con el mismo patrón de búsqueda, el siguiente patrón de sustitución:
\1
nos borrará:
- el espacio de separación (fíjate que el espacio está fuera de los paréntesis);
- y una de las dos palabras repetidas (de verdad borra la segunda palabra).
Es decir, que si el patrón de búsqueda (<[a-zA-Z]{1;}) \1> encuentra eco eco, el patrón de sustitución \1 reemplazará esa cadena encontrada (eco eco) por eco.
En Word deberías tener así el cuadro de diálogo Buscar y Reemplazar:

Sin olvidarte de marcar la casilla Usar caracteres comodín (o Word nunca te encontrará ninguna palabra repetida).
⁂
No es oro todo lo que reluce
Ahora quiero que busques fallos al anterior patrón de búsqueda.
Porque yo le he encontrado un fallito: NO encuentra el texto hola Hola.
El motivo es que Word toma esas dos palabras como distintas, ya que:
- una hache es minúscula en una palabra y mayúscula en la otra;
- y cuando se busca con comodines en Word, siempre se distingue entre mayúsculas y minúsculas.
Es curioso, porque a pesar de que Word marca automáticamente estos casos:
hola Hola
ya sabes que no podrás encontrarlos con los comodines. Lo siento…
⁂
Conclusiones
Cómo buscar palabras repetidas en Word:
- En Word, abre el cuadro de diálogo Buscar y Reemplazar.
El atajo de teclado es CTRL+B.
- En el cuadro de texto Buscar, escribe el siguiente comodín:
(<[a-zA-Z]{1;}) \1>
- Marca la casilla Usar caracteres comodín.
- Pulsa el botón Buscar siguiente.
No solo hemos encontrado el comodín para buscar palabras repetidas en Word , sino que hemos encontrado la forma de borrar la palabra repetida. Por supuesto, con otro comodín de Word.
Es un comodín que no cubre todos los casos, pero puede serte muy útil.
Lo más importante, aparte de conocer la potencia de los comodines de Word, es que puedes añadir un par de líneas a tu macro de Word con este comodín y revisar automáticamente muchos documentos de Word. Es lo que ya nos mostró nuestro compañero Diego Merino en su artículo Mis macros de Word para limpiar textos literarios.
⁂
Complicando el problema
Dejo para ti, querido lector, un par de problemas para casa:
1.er problema: ¿Cuál sería el comodín para encontrar esta cadena?
- eco eco
Es decir, dos eco separados por uno o varios espacios .
2.º problema: ¿Cuál sería el comodín para encontrar cualquiera de estas cadenas?
- eco. eco
- eco, eco
- eco; eco
- eco: eco
Es decir, dos eco separados por algún signo de puntuación (punto ., coma ,, punto y coma ; o dos puntos :) y un espacio .
¿Algún valiente con tiempo y ganas?
¡Se recompensará!
⁂
Anexo
Si has leído todo el artículo, recordarás que comentamos dos comodines de búsqueda para palabras repetidas consecutivas:
(<[a-zA-Z]{1;}>) \1 ✗ Comodín INCORRECTO
y
(<[a-zA-Z]{1;}) \1> ✔ Comodín CORRECTO
El motivo de usar el segundo comodín es que el primero encuentra cadenas de texto que no debería, como su sueño. Puedes comprobar el error del primer comodín por ti mismo.
☛ Muchas gracias a los comentarios de los lectores del blog, quienes me avisaron del error y pude corregir el comodín dado al publicar el artículo.
☛ Con fecha 22/oct./2019 corregí el artículo, pero si ves otro error, no dudes en comentarlo abajo.
☛ No sé el porqué no funciona el primer comodín (ya que encuentra su sueño). Si algún lector puede aclararlo, se lo agradecería eternamente.
⁂
Si no te quieres perder ningún artículo de Gonduana, suscríbete al boletín del blog con el siguiente formulario o sígueme en LinkedIn, Facebook o Twitter (@jssprt). De esta manera, serás el primero en enterarte de las siguientes publicaciones.
Si quieres leer otros artículos sobre comodines de Word de Gonduana, los tienes todos si filtras por «comodines» en la nube de etiquetas del blog.
Y si lo que quieres es: buscar, borrar o reemplazar no opalabras, sino signos de escritura como ( $ @
GRACIAS..
Pues entonces recomendaría leer el artículo enlazado sobre comodines de Word, donde se explican y dan ejemplos.
Hola. Parece arriesgado reemplazar para borrar la palabra repetida cuando la secuencia de búsqueda encuentra casos como "que quedan" y si se suprime la palabra repetida quedaría "que dan". ¿Cómo podríamos resolverlo usando un comodín que busque que la segunda palabra repetida sea una palabra completa? Muchas gracias.
Hola, Sofía:
Creo que el comodín hace lo que quieres. ¿No te funciona?
Saludos,
… Jesús Prieto …
Hola, Jesús:
Creo que lo que quiere decir Sofía es que el comodín no solamente encuentra palabras repetidas, sino casos como "que quedan", "y yo", "vi vino" o "su sueño". A mí me ocurre lo mismo.
Parece que, por algún motivo, el comodín "\1" no recoge los valores "". Es decir, no busca que tras una palabra haya otra idéntica, sino la misma secuencia de letras. Espero haberme explicado bien.
En cualquier caso, muchas gracias por el artículo; como corrector, este blog me facilita mucho el trabajo.
Saludos
Benjamí
Tienes razón, Benjamí:
El comodín no funciona en los casos que comentas. Lo miro de nuevo y corregiré el artículo.
Gracias por avisar.
Un abrazo,
… Jesús Prieto …
Hola, Benjamí:
He actualizado el artículo con el comodín que creo que, ahora sí, es correcto.
¡Un abrazo!,
… Jesús Prieto …
En efecto, ¡ya funciona! Muchas gracias por arreglarlo.
Tienes razón, Sofía:
El comodín no funciona en los casos que comentas. Lo miro de nuevo y corregiré el artículo.
Pero voy a probarlo más antes de publicarlo.
Gracias y un saludo,
… Jesús Prieto …
Hola, Sofía:
He actualizado el artículo con el comodín que creo que, ahora sí, es correcto.
¡Un abrazo!,
… Jesús Prieto …
Buenas noches:
Muchas gracias por todos estos aportes.
Tengo una incidencia con el resultado de la búsqueda de palabras repetidas en Word.
He usado el comodín: (<[a-zA-Z]{1;}) \1, pero también coge los inicios de la siguiente palabra, es decir, la primera sílaba.
No sé si estoy haciendo algo mal.
Lo que busco es poder eliminar todas las palabras repetidas de un texto de una sola vez, sin tener que ir eliminando de una en una con la función de corrección "eliminar palabra repetida" de Word.
Ejemplo de lo que me ocurre:
la laguna... considera la y la (de laguna) dos palabras repetidas. O, de derribo... de de... y así todas en la que coincide una palabra con la primera sílaba de la siguiente.
Muchas gracias.
José Luis
Hola de nuevo, Jesús.
He visto que a otra persona le ha ocurrido lo mismo. Lo acabo de leer.
El comodín que has puesto sustituyendo al otro a mí no me funciona. (
¿Sabes algo?
Gracias.
José Luis
Hola, José Luis:
Por algún motivo, se cuela un espacio en mi comentario después del signo «menor que», no así en el artículo, que aparece correcto y de deja copiar bien.
Copia entonces el comodín del artículo.
☛ He borrado los comodines de mis comentarios para no liar más. Gracias por avisar, no me había dado cuenta.
Un saludo,
… Jesús Prieto …
Buenos días, Jesús:
Disculpa, pero me sigue pasando lo mismo. Localiza muy bien las palabras repetidas, pero también sigue encontrando las que la primera sílaba coincide con la anterior palabra. "ha habido", "que querrás"...
Este es el que uso: (<[a-zA-Z]{1;}) \1
Muchas gracias.
José Luis
Buenos días, Jesús:
Disculpa, pero me sigue pasando lo mismo. Localiza muy bien las palabras repetidas, pero también sigue encontrando las que la primera sílaba coincide con la anterior palabra. "ha habido", "que querrás"...
Este es el que uso: (<[a-zA-Z]{1;}) \1
Muchas gracias.
José Luis
Discúlpame, Luis, porque en su día probé varios comodines y publiqué el que no era.
Ahora sí, el comodín está comprobado y corregido.
Un saludo,
… Jesús Prieto …
Hola de nuevo, Jesús:
Siento marearte con el tema.
El código ( funciona, pero le falta diferenciar entre minúsculas y mayúsculas.
Por ejemplo, me Me... no lo reconoce como repetida.
¿Se podría conseguir?
Mil gracias.
José Luis
Hola, José Luis:
Ese es una de las excepciones reconocidas del comodín.
Con toda seguridad, no se puede pedir más a esta vía de los comodines de Word.
Si estás interesado, podría desarrollar una macro a medida para ti que sí lo haría.
Un saludo,
… Jesús Prieto …
Hola, Jesús:
Sí que estaría interesado.
Me gustaría hablar contigo sobre el tema para explicarte lo que necesito, y así me asesores y desarrolles algo a medida. Después me pasas presupuesto y te confirmo.
Gracias.
De acuerdo, José Luis:
Te contacto por privado y hablamos.
Un saludo,
… Jesús Prieto …
Buenas tardes: tengo una situación que no encuentro que hacer...en la versión 2003 de Word la opción de resaltado de lectura aplica color a la palabra buscada y mantiene este resaltado aun cuando realice cambios una por una a estas palabras, en versiones posteriores hago el resaltado de lectura y si borro solo una letra a una de esas palabras, me borra el resaltado....qué estoy haciendo mal????
Buenas noches, Jesús:
En esta ocasión te escribo porque estaba intentando eliminar los puntos en las cifras y sustituirlos por espacios finos. He probado estos comodines:
1. Buscar: ([0-9]).\1
Reemplazar con: \1 \1
2. Buscar: ([0-9]).([0-9])
Reemplazar con: \1 \2
Sin embargo, no consigo que funcionen. Reemplaza «250.000» con «2500 00» (el espacio es fino, pero no aparece donde debería). ¿Se te ocurre algún motivo por el que pase esto?
Muchas gracias por tu atención.
Un abrazo,
Benjamí
Hola, Benjamí:
Para separar ceros, el primer comodín funcionaría bien, pero no para «123.456».
En general, tu segundo comodín es correcto; si no te funciona, ¿puede ser porque tienes el espacio mal colocado y se ve mal en pantallas de mucha resolución?
☛ El comodín en Word del espacio de no separación es ^s. El patrón de sustitución sería \1^s\2; es otra forma de de hacerlo y ver más claro el espacio.
Saludos,
… Jesús Prieto …
Hola de nuevo:
Gracias por responder con tanta rapidez. No parece que el espacio esté mal colocado, he probado con el comodín que me has dicho (^s) y sigue pasando lo mismo, coloca el espacio después de los dos números que le pido que busque.
Si busco ([0-9]).([0-9])([0-9])([0-9]) y lo reemplazo con \1^s\2\3\4 (para evitar que afecte a grupos como 1.3), coloca el espacio detrás de todos esos números.
Por cierto, lo que busco es un espacio fino de no separación, el comodín ^s es el del espacio normal de no separación. No sé si hay un comodín para lo que necesito, pero te agradezco mucho la ayuda.
Un saludo
Hola, Benjamí:
No me imagino lo que te está pasando. He probado todos tus patrones de búsqueda y me funcionan como deberían.
☛ El espacio duro que tiene Word como comodín es ^s; no tiene otro, pero siempre se puede escribir el carácter que uno desea.
Solo te puedo desear suerte y, si llegas a una conclusión, me gustaría conocerla. Ya es curiosidad.
Saludos,
… Jesús Prieto …
Hola!
Necesito saber si hay sílabas repetidas en unos textos informáticos, y he logrado que lo encuentre como tu dices si están seguidas y sin coma, pero al tener coma no sé cual tendría que ser el código.
Te agradecería enormemente que me ayudaras.
Un saludo
Muchas gracias
Es tipo esto:
CBTLA, CBTLO, CBTLU, CBTLX, CBTLG, CBTLB, CZBU, CBMU, CBNU, CBTU, CBFU, CCCU, CCLU, CCBU, CZCU, CZXU, CFLU, CGRU, CMSU, COJU, CMAU, CPLU, CPEU, PTEU, CPJU, CPCU, CSBU, CZSU, CZEU, CSAU, CSPU, CSNU, CSTU, CTLU, CZLU, CZMTU, CDEA, CFLA, CGRA, CLTA, CMSA, CMDA, CZMA, COJA, CMAA, CPLA, CPEA, PTEA, CPJA, CPCA, CZSA, CZEA, CSAA, CSPA, CSNA, CSTA, CTLA, CZLA, CZPTA, CZMTA, CZBO, CBMO, CBTO, CBFO, CCCO, CCLO, CCBO, CZCO, CZXO, CFLO, CGRO, CMSO, COJO, CMAO, CPLO, CPEO, PTEO, CPJO, CPCO, CZSO, CZEO, CSAO, CSPO, CSNO, CSTO, CTLO, CZLO, CZPTO, CZMTO, ATL, ATS, ATT, ATB, AVC, AVS, AVT, ACC, ACS, ACT, ALL, ALS, ALT, APL, APC, APF, APR, APV, AFL, AFC, AKL, AKC AKC, AKS, AKT, AEN, ATS, AHL, AHC, AHS, AHT, AWL, AWS, AWT, AXL, AXC, AXS, AXT, AML, AMC, AMS, AMT, ADL, ADC, ADH, ADF, ADR, ADV, AAL, AAC, AIL AIL, AIC, AIS, AIT, AHK, APM, AQL, AJL, ARC, ARS, ART, AYC, AYS, AYT, ALK, ATE, AQB, ABZ, ABL, ABS, AOL, AOC, AOS, AOT, AGL, AGQ, AGE, AGH, ATM, ASL, ACLC, ACCC, ACSC, ACTC, ALLC, ALCC, ALSC, ALTC, OTL, OTC, OTS, OTT, OTB, OCL, OCC, OCS, OCT, OLL, OLS, OLT, OPL, OPC, OPH, OPF, OPR, OPV, OKL, OKC, OKS, OKT, OEN, OHL, OHC, OHS, OHT, OXL, OXC, OXS, OXT, OML, OMC, OMS, OMT, ODL, ODC, ODH, ODF, ODR, OIL, OIC, OIS, OIT, OPM, OQL, OJL, OYL, OYC, OYS, OYT, OLK, OBZ, OBL, OOL, OOC, OOS, OOT, OGL, OGQ, OGE, OGH, OTM, OSL, OCLC, OCCC, OCSC, OCTC, OLLC, OLCC, OLSC, OLTC, AÑT, AÑÑ, AÑI, AÑG, APS, OÑV, OÑB, OÑP, OBS, OPS, CZBA, CBMA, CBNA, CBTA, CCCA, CCLA, CCBA, CZCA, CZXA, UTL, UTC, UTS, UTT, UCL, UCC, UCS, UCT, ULL, ULT, UPL, UPC, UPH, UPF, UPV, UPR, UKL, UKC, UKS, UKT, UTK, UZL, UZC, UZS, UZT, UHL, UHC, UHS, UHT, UXL, UXC, UXS, UXT, UML, UMC, UMS, UMT, UDL, UDC, UDH, UDF, UDR, UDV, UIL, UIC, UIS, UIT, UHK,
Hola, Alejandra:
Si es solo cuestión de la coma, habría que incluir la coma en el comodín de búsqueda. Sigue lo que hay en el artículo y es muy fácil.
Si además hay que tener en cuenta que las sílabas no están ordenadas, encontrar los duplicados ya sería más complicado, pero no imposible.
¡Suerte!
… Jesús Prieto …
¡Gracias, gracias, miles de gracias por estas aclaraciones! Me han resultado utilísimas. Cuando no se saben utilizar estos parámetros, se ignora hasta para qué sirven. Siempre había visto ese cuadro de los "comodines" en el menú de búsqueda de Word, pero no tenía ni la menor idea de para qué servían ni de cómo utilizarlos.
Nunca dejamos de aprender.
Un saludo muy cordial,
Margarita.
Me alegro de que te resultaran útiles para entender los comodines de Word.
Supongo que lo sabes, tienes otros muchos artículos de comodines.
Un abrazo, Margarita
… Jesús Prieto …