Ir al contenido principal

¿Qué debo hacer cuando mi tarea corre muy lento?

Actualizado hace más de un año

Puede ser un gran desafío para los usuarios encontrar formas de acelerar sus tareas, especialmente cuando se trata de algunas tareas complicadas. Este artículo está diseñado para ayudarte a solucionar problemas de una tarea que se ejecuta con baja velocidad. Específicamente, analizará todos los factores posibles para determinar si es más probable que el problema sea causado por el entorno local, la estructura del sitio web o simplemente la configuración de tu tarea.

Situación 1: Hay demasiados pasos en el flujo de trabajo.

Resolución:

  • Simplifica tu tarea

A veces, el flujo de trabajo puede ser demasiado complicado con muchos pasos para llegar a la página de destino, por lo que es muy importante que simplifiques tu flujo de trabajo eliminando algunos pasos innecesarios, como las acciones de clic. Deberías utilizar la URL de la capa más cercana para que tu tarea sea mucho más sencilla y directa.

Por ejemplo, si deseas extraer gafas 3D de Amazon. Deberías evitar la siguiente situación de hacer clic en los elementos capa por capa para llegar a la página del producto de vidrio 3D.

99.png

Deberías usar directamente la URL de la página del producto de vidrio 3D para comenzar tu tarea.

98.png
  • Divide tu tarea

Cuando en tu tarea se necesita hacer clic en una lista de elementos para obtener datos, puedes intentar dividir la tarea en dos.

Tarea 1: Obtener la lista de URL para cada entrada de la página de lista

Tarea 2: Usar la lista de URLs obtenidas en el primer paso para configurar una nueva tarea para extraer datos de la página de detalles.

Puede consultar este caso de ejemplo como referencia: Scraping product information from Target.com

Situación 2: El sitio web aplica AJAX pero no lo has configurado.

Resolución:

  • Establecer un tiempo de AJAX adecuado

Muchos sitios web utilizan la técnica AJAX para actualizar la información sin tener que volver a cargar la página web completa una y otra vez. Cuando una página está cargada con AJAX, pero te has olvidado de configurarla, la tarea puede atascarse y funcionar muy lentamente. Un tiempo AJAX apropiado permitirá que el proceso de extracción se desarrolle sin problemas.

Nota:

Para obtener más detalles sobre la configuración de AJAX, consulta Tratar AJAX

Situación 3: El entorno local no es bueno (ejecuciones locales).

Resolución:

  • Mejorar el entorno local

Si la extracción local es bastante lenta, puede ser problema del entorno local, como el sistema operativo, la capacidad del hardware, la dirección IP, el ancho de banda de la red, el rendimiento de la CPU, etc. Deberias verificar manualmente el estado actual de todos los factores relacionados enumerados anteriormente.

  • Ejecutar tareas en la nube (solo disponible para usuarios premium)

Sin embargo, es bastante comprensible que ese tipo de problemas sea menos probable que se resuelvan o se solucionen. Sin embargo, ejecutar tareas en la nube será más efectivo y factible para que puedas disfrutar de una extracción de datos más rápida con Octoparse.

Conocerás cómo acelerar las tareas siguiendo este tutorial: Raspar más en la nube.

Notas:

Puedes echar un vistazo a "Ejecutar tarea en la nube? " para obtener más detalles sobre la extracción en la nube.

Situación 4: El contenido del sitio web puede tardar más en cargarse por completo

Cuando un sitio web contiene demasiados elementos como imágenes o videos, la velocidad de carga general de las páginas web se ralentizará. Este también será otro factor principal que ralentizará la velocidad de ejecución general de ciertas tareas.

Resolución: Deshabilitar la carga de imágenes

Podemos optar por no cargar las imágenes en las páginas web para acortar el tiempo de carga de la página.

  • Abrir la configuración de una tarea

  • Marca "Desactivar la carga de imágenes" y haz clic en "Guardar"

* Ten en cuenta que "Desactivar la carga de imágenes" a veces puede provocar un error en la carga de la página. Si encuentras que la tarea no funciona correctamente después de seleccionarla, cancela esta opción.

¿Ha quedado contestada tu pregunta?