Octoparse ofrece una potente plataforma en la nube para que los usuarios premium (Estándar & Profesional) ejecuten sus tareas 24/7.
Cuando ejecutas en la nube, Octoparse asigna nodos en la nube a raspar con diferente IPs. Puedes apagar la app o tu computadora mientras se ejecuta la tarea. Los datos extraídos se guardarán en la nube y se podrá acceder a ellos en cualquier momento.
Puedes programar autoejecutar y autoexportar en cuanto a ejecutar en la nube.
1.Ejecutar en la nube
Cuando termines de diseñar la tarea, haz clic en "Ejecutar" y selecciona "Ejecutar en la nube" para arrancar una ejecución en la nube.
El estado se cambiará al “Ejecutando” en el Dashboard.
2.Ejecutar tareas por lotes en la nube
Selecciona las tareas y haz clic Ejecutar en la nube
3.Configuración de ejecutar en la nube
Ejecutar en la nube permite ejecutar múltiples tareas o subtareas simultáneamente. Como unas tareas pueden dividirse en varias subtareas.
El plan estándar, puedes ejecutar 6 tareas simultáneas en la nube (6 nodos en la nube disponibles)
El plan profesional, puedes ejecutar 20 tareas simultáneas (20 nodos en la nube disponibles).
Puedes establecer un límite para aplicar en una tarea.
Nota:
Octoparse asigna los nodos según orden de ejecutar. Si tarea A ejecutas primero y es una tarea divisible, Octoaprse va a asignar los nodos a ejecutar las subtareas de tarea A. Si tarea A no ocupa los nodos, puedes ejecutas otras tareas. Pero tarea A ocupa todos los nodos y no termina, otras tareas están en espera.
4. Programar autoejecutar y autoexportar en la nube
Ejecutas en la nube y configuras la automatización.
Selecciona la frecuencia con la que deseas ejecutarla:
En el Dashboard aparece la hora en "Siguiente ejecución".
Y si deseas cancelar el temporizador, puedes ir Más, Ejecución Nube y Cancelar.
O puedes cancelar así,
Claro, puedes programar por un grupo de tareas:
Nota:
La zona horaria para automatización según tu sistema operativo) de forma predeterminada. Sin embargo, si has creado la tarea para extraer la "fecha y hora actuales" en la nube, la hora y la fecha extraídas estarán en UTC ± 00: 00 independientemente de tu ubicación real.
Pero puedes cambiar el horario de ese campo
5. Datos duplicados en la ejecución en la nube
Octoparse almacenará los datos extraídos de todas las ejecuciones nube juntas y reconocerá los duplicados. Los duplicados se eliminarán automáticamente de la nube.
Por ejemplo, Octoparse raspa 100 líneas para la primera ejecución, sin duplicados. Cuando revisas todos los datos de la tarea, habrá 100 líneas.
Si el sitio web añade 5 nuevas líneas de datos, cuando la tarea se ejecuta por segunda vez, la tarea raspará 105 líneas con 100 duplicados, y solo se guardarán las 5 nuevas líneas. Las 100 líneas duplicadas se borrarán.
Cuando revisas todos los datos (de la primera y segunda ejecución) de la tarea, verás 105 líneas de datos en total. Si revisas los datos del segundo lote en ejecución, solo encontrará 5 líneas.
Si quieres guardar los duplicados puedes consultar aquí.