Ir al contenido principal

Extraer datos en la pestaña

Actualizado hace más de un año

Si alguna vez has intentado hacer scraping en un sitio web de comercio electrónico, es posible que estés familiarizado con la extracción de datos desde pestañas. Cuando una página web necesita mostrar mucha información en una sola página, a menudo utiliza pestañas para organizarla mejor, y solo cuando haces clic en una pestaña específica se muestra la información correspondiente.

Tomemos esta página web como ejemplo:

En esta página web, si deseas ver los datos de la pestaña "Envío y devoluciones" y la pestaña "Guía de tallas", necesitarás hacer clic en las pestañas respectivas.

2021-09-23_14-45-06.png

Ahora, si deseamos extraer los datos de la pestaña "Envío y Devoluciones", ¿cómo se puede hacer? Hay dos formas de obtener los datos desde dentro de una pestaña.


1. Extraer datos desde una pestaña haciendo clic en la pestaña primera

Obviamente, puedes indicar a Octoparse que haga clic en las pestañas y extraiga el contenido desde dentro de las pestañas respectivamente.

  • Haz clic en la pestaña "Envío y Devoluciones".

  • Selecciona "Hacer clic en el elemento" en el panel de consejos.

  • Configura AJAX. Puedes ajustar el tiempo de espera de AJAX en función de la velocidad de tu red.

  • Luego, haz clic en los datos que deseas capturar y selecciona "Extraer el texto del elemento" en el panel de consejos.

_3.gif

Nota:

  • Para obtener más información sobre AJAX, consulta este tutorial.

  • En cuanto a la acción de hacer clic, asegúrate de que la opción "Abrir en una nueva pestaña" no esté marcada.

1.png

2. Extraer datos desde una pestaña directamente cuando el contenido se encuentra en el código fuente

Aunque la información esté organizada en diferentes pestañas, el contenido dentro de cada pestaña puede existir en el código fuente independientemente de si se ha hecho clic en la pestaña respectiva o no. En este caso, primero podemos revelar el contenido de la pestaña en el modo de navegación y luego proceder a extraer directamente la información deseada. De esta manera, no es necesario añadir ninguna acción de clic al flujo de trabajo.

  • Para comprobar si el contenido de la pestaña se encuentra en el código fuente, carga la página web en tu navegador habitual y presiona "F12" en el teclado.

  • Inspecciona el código fuente y verifica si el contenido deseado está presente. En esta página de ejemplo, podemos ver que, incluso si no hemos hecho clic en la pestaña "Envío y Devoluciones", todavía podemos encontrar los datos correspondientes en el código fuente. De esta manera, sabemos que es posible extraer directamente el contenido de la pestaña sin necesidad de hacer clic en la pestaña.

2.png
  • Ahora, regresa a Octoparse, activa el botón en la esquina superior derecha del navegador integrado para cambiar al modo de navegación.

  • Haz clic en la pestaña "Envío y Devoluciones" para revelar el contenido.

  • Luego, vuelve a activar el botón del modo de navegación y regresa al modo de flujo de trabajo.

  • Haz clic en los datos que deseas capturar y selecciona "Extraer el texto del elemento" en el panel de consejos.

  • De esta manera, habrás capturado directamente el contenido de la pestaña.

_4.gif
¿Ha quedado contestada tu pregunta?