Cuando ejecutas una tarea varias veces, es posible que veas que Octoparse muestra duplicados en el Dashboard:
Esto se debe a que Octoparse almacenará los datos extraídos de todas las ejecuciones juntos y reconocerá los duplicados. Los duplicados se eliminarán automáticamente desde la Nube.
Los duplicados son líneas de datos que son iguales en todas las columnas. Si deseas conservar todas las líneas de datos de cada ejecución, puedes intentar agregar la fecha y hora actual como un campo en la tarea.
Ve a la Vista previa de datos, haz clic en el botón Agregar campo personalizado y elige Fecha y hora actual.
El campo se agregará de la siguiente manera:
El campo indica la fecha y la hora en que se extrajo esta fila de datos. Como cada fila se extrae en un momento diferente, ahora cada fila es diferente. No habrá duplicados.