Passer au contenu principal

Cliquer sur les éléments

Ce tutoriel va vous introduire comment configuer "cliquer sur les éléments" pendant le scraping.

Mis à jour il y a plus de 10 mois

"Cliquer sur les éléments" est une action assez fréquemment utilisée dans le flux de travail au cours de votre configuration d'une tâche de grattage. Octoparse peut exécuter automatiquement une action de clic chaque fois que vous cliquez sur un élément de page Web dans son navigateur intégré.

Elle a d'autres noms dans le flux de travail outre le nom "Cliquer sur les éléments".

  • "Cliquer sur les URL dans la liste": il apparaît lorsque la page Web contient des éléments liés à d'autres URL.

  • "Cliquer pour paginer": il est généré automatiquement lorsque vous configurez les étapes de pagination.

Comment ajouter une action "Cliquer sur les éléments" dans le workflow ?

1. Cliquer sur le(les) élément(s) de page Web pour générer une étape dans le flux de travail

Cette méthode est couramment utilisée dans les cas suivants:

  • Les données doivent être cliquées avant de s'afficher

  • Les sites Web nécessitent une connexion pour accéder

  • Bouton de recherche

  • Pagination

  • ......

Il vous suffit de cliquer directement sur un élément de page, puis choisir l'option liée au "Clic" dans le panneau Tips. Voici quelques exemples de captures d'écran.

2. Ajouter à partir du workflow

Parfois, vous devrez ajouter les actions de clic à partir du flux de travail. Déplacez simplement votre souris dans le flux de travail, puis cliquez sur l'icône pour ouvrir le menu déroulant.

Ensuite, vous pouvez choisir "Cliquer" pour ajouter une action de clic à un endroit que vous souhaitez.

3. Auto-detecter

Lorsque vous utilisez la fonctionnalité auto-détecter pour générer le flux de travail, Octoparse extraira d'abord les données de liste. Comment faire si vous devez cliquer sur les éléments de liste pour ouvrir respectivement leur page de détails ? Consultez ce tutoriel pour obtenir plus de détails : Cliquer sur chaque lien dans une liste pour récupérer les données des nouvelles pages

Paramètres d'action pour "Cliquer sur les éléments"

Parfois, vous devriez ajuster les paramètres de l'action "Cliquer sur l'élément". Vous pouvez double-cliquer sur l'étape pour ouvrir la page des paramètres. L'image ci-dessous montre des détails sur les paramètres de clic.

1. Modification de XPath

C'est ici que vous pouvez modifier le XPath de l'élément à cliquer. La balise et le Texte sur la même ligne indiquent aussi l'élément actuel à cliquer.

Parfois, l'action "cliquer sur les éléments" ne fonctionne pas bien pour exécuter des actions de clic. C'est probablement parce que le XPath prédéfini n'est plus valide à cause du changement de la mise en page de site Web. Dans ce cas-là, vous devrez réécrire/mettre à jour le XPath.

2. Options de clic

Vous pouvez ajouter un temps d'attente ou des conditions à respecter avant d'effectuer l'action de clic lorsque les sites web ont besoin d'un certain temps pour charger la page.

3. XPath relatif et absolu

Si vous vérifiez les paramètres d'un élément cliquable situé à l'intérieur d'un élément en boucle, vous remarquerez peut-être qu'il existe une option appelée XPath relatif et XPath absolu. Les deux options Xpath ne s'affichent que lorsque l'élément cliquable se trouve à l'intérieur d'une boucle. Si vous devez cliquer sur chaque élément de la boucle, n'oubliez pas de cocher l'option XPath relatif. Vérifiez la différence entre les deux options XPath ici.

4. Reessayer

Vous pouvez laisser Octoparse recharger la page web en fonction de certaines conditions. Pour en savoir plus sur ce paramètre, cliquez ici : retry actions.

Avez-vous trouvé la réponse à votre question ?