IBM Content Collector, Versión 2.2.+          

Ejemplos de expresiones regulares

Los ejemplos de expresiones regulares comunes muestran cómo construir expresiones regulares para buscar patrones de texto o buscar patrones y sustituir partes de las series devueltas. Utilice estos ejemplos de patrones adaptándolos a sus necesidades.

Expresiones regulares de coincidencia

La tabla siguiente contiene ejemplos de expresiones regulares que pueden utilizarse en modalidad de coincidencia.
Tabla 1. Ejemplos de expresiones regulares de coincidencia
Finalidad Expresión regular Texto de ejemplo Coincidencia de ejemplo
Devolver una serie de números de longitud fija. \d{3} Contrato número 12-345 AB12 345
Devolver una serie de cualquier carácter de una longitud específica. La serie puede contener los caracteres de "a" a "z" y los dígitos de 0 a 9. \w{8} Contrato número 12-345 AB12 Contrato
Devolver una serie de cualquier carácter de una longitud específica al inicio. La serie puede contener los caracteres de "a" a "z" y los dígitos de 0 a 9. ^\w{6} Contrato número 12-345 AB12 Contra
Devolver una serie de dos caracteres cualquiera de longitud fija seguida de dos dígitos. \w{2}\d{2} Contrato número 12-345 AB12 AB12
Devolver una palabra que sea de longitud fija con la asunción de que a la palabra le sigue un espacio. \w{8}\s Contrato número 12-345 AB12 Contrato
Devolver una serie de números de longitud fija que además contiene caracteres específicos, por ejemplo, un número de contrato formado por seis caracteres con un guión después del segundo número. \d{2}-\d{3} Contrato número 12-345 AB12 12-345
Devolver una serie de, al menos, tres números. \d{3,} Contrato número 12-345 AB12 345
Devolver la primera carpeta de una vía de acceso. ^([[:word:]]|\s)*(\\|\/) Carpeta 1\Carpeta 2\Carpeta 3\Carpeta 4 Carpeta 1

Expresiones regulares de sustitución

La tabla siguiente contiene ejemplos de expresiones regulares que pueden utilizarse en modalidad de sustitución.
Tabla 2. Ejemplos de expresiones regulares de sustitución
Finalidad Expresión regular Serie de sustitución Texto de ejemplo Resultado de ejemplo
Obtener una vía de acceso a la carpeta sin una letra de unidad. ^[^\\]* $1 C:\carpeta 1\carpeta 2 \carpeta 1\carpeta 2
Obtener una letra de unidad desde una vía de acceso a la carpeta. (\\.*)   C:\carpeta 1\carpeta 2 C:
Obtener una carpeta específica en una vía de acceso con una letra de unidad.

Para cada sección de una vía de acceso con una letra de unidad, repita la expresión:([^\\]*)\\? con el valor: .* al final de la expresión.

Utilice $<número de sección> para obtener el nivel específico necesario, donde la sección uno es la letra de unidad, la sección dos es la primera carpeta de la vía de acceso, la sección tres es la segunda carpeta de la vía de acceso, etc.

([^\\]*)\\?.* $1 C:\uno\dos\tres C:
([^\\]*)\\?([^\\]*)\\?.* $2 C:\uno\dos\tres uno
([^\\]*)\\?([^\\]*)\\?([^\\]*)\\?.* $3 C:\uno\dos\tres dos
Obtener la segunda carpeta de una vía de acceso. ^[\\/]?[^\\/]+[\\/]([^\\/]+)([\\/][^\\/]+)* $1 Carpeta 1\Carpeta 2\Carpeta 3\Carpeta 4 Carpeta 2
Obtener las últimas dos carpetas de una vía de acceso. ((\\|\/)([[:word:]]|\s*)*){2}$ $1 Carpeta 1\Carpeta 2\Carpeta 3\Carpeta 4 Carpeta 3\Carpeta 4
Obtener todo el correo electrónico que tenga un número de expediente que coincida con el patrón "ocho dígitos seguidos de un guión seguido de tres letras mayúsculas". Sustituir el número de expediente por la frase Reclamación de automóvil. (.*)(\d{8}-[A-Z]{3})(.*) $1Reclamación de automóvil$3 98765432-DEF, su correo electrónico de fecha 17 de agosto de 2008 Reclamación de automóvil, su correo electrónico de fecha 17 de agosto de 2008
Obtener todo el correo electrónico que tenga direcciones de remitente específicas y añadir el nombre de la empresa respectiva. (.?\Q@ejemplo.\E)(com|org|net) $1$2 (Empresa de ejemplo) Mensaje enviado por X@ejemplo.org Mensaje enviado por X@ejemplo.org (Empresa de ejemplo)
Buscar los ID que empiezan por AB y sustituirlos por el nombre del departamento Control. AB\w{2,4}@ejemplo\.com Control Enviado por AB12@ejemplo.com Enviado por Control
Eliminar las series que coincidan con el patrón "cuatro o más dígitos entre paréntesis". \(\d{4,}\)   Número de elemento (12345) 6789 Número de elemento 6789
Suprimir el prefijo de reenvío Fw: o el prefijo de respuesta Re: del asunto. ^(Fw:|Re:)(.*) $2 Fw: Correo electrónico referente al número de expediente 98765432-DEF, de fecha 17 de agosto de 2008 Correo electrónico referente al número de expediente 98765432-DEF, de fecha 17 de agosto de 2008
Truncar el valor de la propiedad seleccionada a 80 caracteres, por ejemplo, el asunto de un correo electrónico. ^(.{0,80}).*$ $1 Mantenimiento de red - Servicio interrumpido el miércoles 6 de febrero de 2008 - Interrupción servicio mensual en febrero Mantenimiento de red - Servicio interrumpido el miércoles 6 de febrero de 2008 - Servicio mensual


Comentarios

Última actualización: Diciembre de 2010


© Copyright IBM Corp. 2010.