La Expresión Regular (RegEx) es una cadena de texto especial que se puede usar para buscar patrones. Como cualquier cadena se puede convertir en un RegExp, un RegExp puede realizar funciones de coincidencia de patrones y “buscar y reemplazar” en el texto.
Puede obtener algunos conceptos básicos de Expresión regular aquí.
Ese tutorial ayudarte a limpiar tus datos.
¿Qué es la herramienta de expresión regular de Octoparse?
La herramienta Octoparse RegEx es una herramienta integrada que ofrece una forma práctica de generar expresiones regulares automáticamente mediante la configuración de varios criterios. Si saber poco acerca de cómo crear una sintaxis de expresión regular, la herramienta Octoparse RegEx sería especialmente útil.
En Octoparse, hay dos entradas para usar RegEx:
Entrada 1:
En la zona de vista previa
Clic Reformatear Datos
Clic Agregar Paso
Entrada 2:
En la barra lateral
Introducción de Regular Expression
Hay 4 partes en la interfaz de la herramienta de RegEx.
1. Texto Original
Si usas la herramienta RegEx con Entrada 1,los datos originales en la vista previa se presenta aquí directamente. Cuidado, si en la vista previa, los datos no terminan de cargarse, no se presentarán.
2. Generar/Referencia/Muestra
Hay 3 pestañas en esta partes.
“Generar”, hay varias opciones. Puedes ingresar algunos parámetros para que Octoparse genere automáticamente la expresión regular que necesites.Esa función te permite a filtrar la forma necesitas de los datos
“Referencia” y “Muestra” disponibles muy pronto
3. Expresión regular
La Expresión Regular se generará automáticamente en esa parte“Expresión regular” después de filtrar en Generar y completar los parámetros.
Clic “Coincidir todos” si desea tener todas las coincidencias. Luego haz clic en el botón “Match” para verificar que la expresión.
4. Match(Coincidir)
Una vez que haya generado una expresión, la primera coincidencia se mostrará en el cuadro Coincidencias.
Si ha marcado “Coincidir con todo”, todas las coincidencias se mostrarán ordenadamente en el cuadro.
Conocimiento de RegEx
Simplemente, haz clic en 3 botones en orden (Generar-Match-Aplicar) y podríamos obtener fácilmente el resultado que necesitamos.
Paso 1:
Verifica las Opciones y completa la forma necesitas como Marcado 1 luego clic generar Marcado 2
“Empezar/Terminar con”:Fijar caracteres que comienza o termina con, pero excluir los caracteres que ingresa en la casilla.
“Incluir inicio / final”:Esta opción solo se puede usar junto con “Iniciar/Terminar con”. Una vez que selecciones “Incluir inicio/final”, el resultado incluirá caracteres que has ingresado.
“Contener sí mismo”:Fijar caracteres que contengan caracteres que has ingresado.
Paso 2:
Haz clic en el botón Match (Coincidir) Marcado 4 - “Coincidir con todos” es para todos caracteres que satisfacen tus condiciones.
Paso 3:
Haz clic en el botón “Aplicar” para aplicar el resultado