Ir al contenido principal

¿Cómo puedo guardar los duplicados en la ejecución en la Nube?

Actualizado hace más de un año

Cuando ejecutas una tarea varias veces, es posible que veas que Octoparse muestra duplicados en el Dashboard:

mceclip0.png

Esto se debe a que Octoparse almacenará los datos extraídos de todas las ejecuciones juntos y reconocerá los duplicados. Los duplicados se eliminarán automáticamente desde la Nube.

Los duplicados son líneas de datos que son iguales en todas las columnas. Si deseas conservar todas las líneas de datos de cada ejecución, puedes intentar agregar la fecha y hora actual como un campo en la tarea.

Ve a la Vista previa de datos, haz clic en el botón Agregar campo personalizado y elige Fecha y hora actual.

current_time.jpg

El campo se agregará de la siguiente manera:

mceclip1.png

El campo indica la fecha y la hora en que se extrajo esta fila de datos. Como cada fila se extrae en un momento diferente, ahora cada fila es diferente. No habrá duplicados.

¿Ha quedado contestada tu pregunta?