Ir al contenido principal

¿Por qué no se extrae los datos que presentan en la vista previa?

Actualizado hace más de un año

En ocasiones, nuestro flujo de trabajo parece estar perfectamente configurado, pero la tarea tiene poco éxito extrayendo los datos que deseamos. ¿Cómo puede suceder esto? ¿Por qué veo datos en la pestaña de vista previa pero no puedo extraerlos cuando ejecuto la tarea? Si este problema le preocupa, tómese unos minutos para revisar el siguiente artículo con soluciones comprobadas.


Razón 1: El tiempo de espera para la acción "Ir a la página web" no es lo suficientemente largo.

Si Octoparse deja de extraer datos incluso antes de que la página web se cargue por completo, es muy probable que los datos de la página que necesita no se carguen antes de que Octoparse pase a la siguiente acción.

Solución: Establece un tiempo de espera más largo para la acción "Ir a la página web" para asegurarse de que la página se cargue por completo antes del siguiente paso.

  • Haz clic en la acción "Ir a la página web" en el flujo de trabajo y establece un tiempo de espera más largo en la pestaña "General" de esta acción.

1.jpg


Razón 2: El sitio web de destino tiene un retraso en la carga.

Si el sitio web de destino se carga por completo, pero Octoparse aún se detiene y no extrae nada, considere la posibilidad de un retraso en la carga de los datos de la página que necesita. Muchos sitios web utilizan JSON para actualizar las páginas web, lo que provoca un retraso en la carga de los elementos de la página.

Solución: Establece un tiempo de espera para la siguiente acción después de la acción "Ir a la página web".

  • Haz clic en la acción siguiente a "Ir a la página web" en el flujo de trabajo y establezca un tiempo de espera antes de la acción en la pestaña "Opciones". (Consulte este artículo para leer la guía completa sobre cómo configurar un tiempo de espera).

2.jpg

Razón 3: El sitio web utiliza la carga diferida (lazy loading) para mejorar la velocidad de carga de la página.

Si el sitio web de destino no carga datos que no sean los que ve antes de desplazarse, eso significa que ha optado por una estrategia de carga perezosa. Debemos indicar a Octoparse que haga scroll hacia abajo en la página después de que se haya cargado.

Solución: Haga scroll hacia abajo en la página después de que se haya cargado

  • Haz clic en su acción "Ir a la página web" en el flujo de trabajo y marque la opción "Hacer scroll hacia abajo en la página después de que se haya cargado" en la pestaña "Opciones". Modifique la configuración detallada según sus necesidades.

3.jpg


Razón 4: El tiempo de espera de AJAX que configuramos no es lo suficientemente largo.

Si tu flujo de trabajo tiene una acción de "clic en elemento" para tratar con datos ocultos bajo un botón de "mostrar más" o "cargar más", asegúrate de configurar un tiempo de espera de carga de AJAX lo suficientemente largo para que los datos se actualicen por completo.

Solución: Configura un tiempo de espera de AJAX más largo para su acción de "clic en elemento"

  • Haz clic en la acción de "Clic en elemento" en su flujo de trabajo, marque "Cargar con AJAX" y configure un tiempo de espera más largo.

¿Ha quedado contestada tu pregunta?