Ir al contenido principal

¿Por qué no puedo raspar URLs que son enlaces accesibles?

Actualizado hace más de un año

Octoparse te permite interactuar con las páginas web y seleccionar elementos con simples clics. Cuando hacemos clic en un elemento de la página, se abrirá un panel de Consejos con sugerencias de acciones prellenadas. Sin embargo, muchos usuarios se han encontrado con un problema en el que no hay una opción para raspar la URL cuando intentan seleccionar un enlace.

Imagina una tarea en la que queremos raspar auriculares con cancelación de ruido de Amazon. Después de abrir el sitio web en Octoparse, hacemos clic en el título de cierto producto pero no encontramos una opción para raspar la URL vinculada a ese artículo.

Esto se debe a que los hipervínculos suelen estar definidos con la etiqueta A. Sin embargo, en este caso, en lugar de la etiqueta A, Octoparse detecta la etiqueta span de ese elemento, que solo contiene el texto.

Nota: La etiqueta A define un hipervínculo, que se utiliza para enlazar una página con otra. El atributo más importante del elemento A es el atributo href, que indica el destino del enlace.

La solución no es complicada. Verifica la ruta de la etiqueta HTML en la parte inferior del panel de Consejos y haz clic en la etiqueta A para cambiar el elemento que seleccionamos.

1.jpg

Ten en cuenta que el panel de Consejos luego contendrá una opción para extraer la URL del enlace seleccionado después de hacer clic en la etiqueta A.

2.jpg
¿Ha quedado contestada tu pregunta?