Ir al contenido principal

Cómo solucionar el error "¿No es la página web correcta?" después de la detección automática

Actualizado hace más de un año

Si los datos que necesitas no son visibles después de haber seleccionado la opción de detección automática de datos de la página web, obtendrás el mensaje "No es la página web correcta" después de que la detección automática haya terminado. Luego puedes hacer clic en las opciones proporcionadas para continuar con la configuración de la tarea.

mceclip0.png

1.Inicia sesión en el sitio web

Al hacer clic, Octoparse activará el Modo de Navegación para que puedas ingresar las credenciales de inicio de sesión. Luego, puedes escribir el nombre de usuario y la contraseña de la misma manera que se hace en un navegador normal. Una vez que hayas iniciado sesión correctamente en la cuenta, haz clic en "Hecho".

mceclip2.png

Las cookies se guardan automáticamente en la tarea y se utilizan para futuros accesos. Ten en cuenta que Octoparse no guarda ni almacena tus credenciales de inicio de sesión, y en este caso, no se generarán ni se agregarán pasos de inicio de sesión al flujo de trabajo.

Ahora que has iniciado sesión en la cuenta, puedes continuar con la extracción manual de los datos que deseas o ejecutar una detección automática nuevamente.

2.Cierra la ventana emergente

Algunos sitios web pueden mostrar una ventana emergente(POP-UP) cuando los abres en Octoparse. Aunque las ventanas emergentes no necesariamente afectarán la extracción, pueden dificultar la configuración de la tarea. Sigue los pasos a continuación para cerrarla.

  • Selecciona la opción "Cerrar una ventana emergente".

  • Haz clic en el botón "Cerrar" en la ventana emergente o en cualquier otro elemento que realice la misma acción. En el ejemplo de abajo, haz clic en el botón "ACEPTAR" para continuar.

  • Haz clic en Confirmar

mceclip0.png
mceclip3.png

Octoparse te preguntará si deseas ajustar el tiempo de espera para AJAX. (ver más en Tratar con AJAX). Sigue las instrucciones en el panel de Configuración de AJAX si es necesario.

3.Buscar con palabra(s) clave

Si estás extrayendo datos de cualquier tipo de sitio web de directorio, es probable que necesites realizar una búsqueda con palabra(s) clave para acceder a la información que necesitas. Sigue las instrucciones a continuación para realizar una búsqueda antes de extraer los datos.

  • Selecciona la opción de "Buscar con palabra(s) clave".

  • Haz clic en "Configuración" (1) para agregar un cuadro de búsqueda y luego haz clic en el cuadro de búsqueda en la página web y confirmar.

  • Haz clic en el botón de editar (2) para agregar palabra(s) clave de búsqueda.

  • Ingresa una palabra clave por línea y luego confirmar.

mceclip5.png
mceclip8.png
  • Dependiendo de si hay un botón de "búsqueda" en la página, puedes elegir "Presionar la tecla Enter/Retorno cuando termines de ingresar" o "Hacer clic en el botón de búsqueda cuando termines de ingresar". Para la última opción, asegúrate de haber hecho clic en "Configuración" y seleccionado el botón de "Búsqueda" correcto.

  • Confirma para continuar.

mceclip9.png

Nota: Aprende más sobre cómo lidiar con la entrada de texto/palabras clave:

4.Cambiar de pestaña

Para extraer datos desde dentro de una pestaña, sigue las instrucciones a continuación.

mceclip10.png

Tomando la captura de pantalla de arriba como ejemplo, así es cómo obtener los datos bajo la pestaña "ESPECIFICACIONES".

  • Selecciona la opción de Cambiar de pestaña

  • Sigue la guía en el panel de Consejos para hacer clic en la pestaña y mostrar los datos

  • Confirma para continuar

mceclip11.png
¿Ha quedado contestada tu pregunta?