Octoparse actualizamos a la versión 8.6.8, vamos a explorar qué funciones agregamos.
1. Las auto-exportaciones a Google Sheets ya no requieren que Octoparse permanezca abierto
2. Compartir tareas personalizadas mediante enlaces
3. Convertir la hora relativa en formatos de fecha absoluta
4. Uso de IPs proxy al configurar tareas
En la barra arriba Proxy. Con esa función puedes navegar libremente sin límite de regiones. La ventaja es que puedes acceder a sitios restringidos localmente y puede recogerlos con Octoparse. Este paso puede verificar si se puede scrapear con Octoparse.
Antes solo se activa en el proceso de ejecución, no en el proceso de diseñar el flujo.
El tipo de proxy es nivel residencial, se necesita Octoparse crédito.
5. Resolver reCAPTCHA v3
Además de reCAPTCHA V2, hCatpcha y CAPTCHA de imagen, Octoparse soporta ahora la resolución automática de reCAPTCHA v3. Este tipo de CAPTCHA solía ser un obstáculo para el raspado de datos, ahora Octoparse supera este desafío sin problemas con la nueva capacidad de resolución integrada.
6. Configurar auto-exportaciones por lotes
Seleccionar
7. Cambiar las preferencias de idioma de asistencia en Configuración
8. Configuración de Plantillas
Ahora puedes automatizar las plantillas.
También puedes configurar por aquí
9. Navegar hacia adelante/atrás en el Modo Navegar
En la edición de la tarea si activas modo de navegar, puedes ahora Volver
10. Configurar el inicio de sesión automático con cookies
Haz auto-login una vez. Para la próxima ejecución el flujo salta directamente ese paso.
Nota:
Es posible que algunos sitios web no le permitan iniciar sesión mediante cookies. En este caso, simplemente configura los pasos de inicio de sesión en tu flujo de trabajo y estarás listo. Echa un vistazo a este útil tutorial sobre cómo configurar los pasos de inicio de sesión.
11. Añadida una opción para maximizar el navegador automáticamente para las ejecuciones de tareas locales
Si el navegador Octoparse no está maximizado después de iniciar sus tareas, es posible que ciertos sitios web no carguen todo su contenido. Esto podría hacer que el raspador no recopilara los datos. Si desea que el navegador Octoparse se maximice automáticamente para evitar fallos en las tareas o que se pierdan datos, solo tiene que ir a Configuración y marcar la opción correspondiente.