Ir al contenido principal

Localizar y scrapear un elemento a través del texto cercano ("following-sibling" Xpath)

Actualizado hace más de 5 meses

Xpath following-sibling

Following-sibling es una herramienta útil en XPath que le permite seleccionar elementos que vienen después de un elemento específico. Esta función es especialmente beneficiosa cuando se desea extraer datos que no se encuentran en la misma posición en varias páginas.

Para utilizar la función hermano-siguiente, primero debe seleccionar el elemento que desea utilizar como punto de referencia. Esto puede hacerse utilizando cualquiera de los selectores CSS estándar, como los selectores de clase, id o elemento. Una vez seleccionado el elemento de referencia, puede utilizar la función «following-sibling» para seleccionar cualquier elemento que le siga.

Primero, veamos un ejemplo de cuándo esta técnica puede ser útil.

32626.png

Paso 1: Identificar el punto de referencia

En este ejemplo, utilizaremos el "Item Weight" como punto de referencia. Esto significa que no importa en qué parte de la página aparezcan los datos de «Peso del artículo», podremos extraerlos.

Paso 2: Localizar los Datos de "Item Weight"

Una vez que haya identificado el punto de referencia, ahora puede localizar los datos de "Item Weight" en la página del producto.

Paso 3: Usar XPath para Extraer los Datos

Ahora que hemos localizado los datos de "Item Weight", podemos usar XPath para localizarlos. Para ello, acceda a la página web utilizando el navegador Chrome, haga clic con el botón derecho del ratón y seleccione la opción para inspeccionar los datos deseados.

95415626526.gif

Etiqueta <td> se ubica debajo de <th>;se ve que Item Weight incluye <th>

Así podemos escribir //th[contains(text(),'Item Weight')]/following-sibling::td[1] ese Xpath para ubicar Item Weight

262626.png

En conclusión, la extracción de datos de "Item Weight" de diferentes páginas de productos puede hacerse más fácil utilizando XPath. Al identificar un punto de referencia, puede extraer fácilmente estos datos sin importar en qué parte de la página aparezcan. Recuerde que probar y refinar su código para asegurar que funciona consistentemente en diferentes páginas de productos.

Cómo cambiar XPath?

Paso 1:

En Vista Previa y seleccionar la opción "Personalizar XPath".

Paso 2:

Entrar XPath nuevo en ese campo

¿Ha quedado contestada tu pregunta?