Si Octoparse tarda mucho en pasar a la siguiente acción en el flujo de trabajo o si alguna vez te quedas atascado al hacer clic en un botón de "Página siguiente", esto probablemente se deba a la técnica AJAX (Asynchronous JavaScript and XML) utilizada para el botón "Página siguiente". En este tutorial, te explicaré cómo resolver este problema para que puedas obtener datos de manera eficiente y más rápida.
¿Por qué "Carga AJAX" ralentiza el proceso?
Antes de que Octoparse proceda a ejecutar acciones como "Hacer clic en elemento" y "Hacer clic en paginar", necesita confirmar que la página se ha cargado por completo. Para hacer esto, Octoparse toma la recarga de la página como la señal de que la página web está lista para la siguiente acción en el flujo de trabajo. Sin embargo, en el caso de una página web que se carga con AJAX, el nuevo contenido generalmente se actualiza sin recargar la página; en este caso, Octoparse no recibiría la señal para continuar. Como resultado, es posible que obtengas cero o muchos menos datos de los esperados.
Para resolver este problema, podemos configurar un tiempo de espera de carga AJAX para la acción "Hacer clic en elemento". Cuando se alcanza el tiempo de espera, Octoparse procederá a la siguiente acción, independientemente de si se detecta la recarga de la página.
¿Dónde configurar la carga AJAX?
Haz clic en la acción "Hacer clic en elemento" o "Hacer clic en paginar".
Marca la casilla "Cargar con AJAX" en la pestaña "Opciones" en la parte inferior del flujo de trabajo.
Selecciona el tiempo de espera de AJAX según la rapidez con la que se carga tu página y haz clic en "Aplicar" para guardar la configuración.
Nota: Asegúrate de configurar un tiempo de espera lo suficientemente largo para que la página o la información objetivo se carguen. En la mayoría de los casos, Octoparse detecta AJAX y configura automáticamente el tiempo de espera, pero es posible que aún necesites ampliar el tiempo de espera de AJAX para las páginas que tardan más en cargar. Obtén más información sobre AJAX en el manejo de AJAX.