"Cliquer sur les éléments" est une action assez fréquemment utilisée dans le flux de travail au cours de votre configuration d'une tâche de grattage. Octoparse peut exécuter automatiquement une action de clic chaque fois que vous cliquez sur un élément de page Web dans son navigateur intégré.
Elle a d'autres noms dans le flux de travail outre le nom "Cliquer sur les éléments".
"Cliquer sur les URL dans la liste": il apparaît lorsque la page Web contient des éléments liés à d'autres URL.
"Cliquer pour paginer": il est généré automatiquement lorsque vous configurez les étapes de pagination.
Comment ajouter une action "Cliquer sur les éléments" dans le workflow ?
1. Cliquer sur le(les) élément(s) de page Web pour générer une étape dans le flux de travail
Cette méthode est couramment utilisée dans les cas suivants:
Les données doivent être cliquées avant de s'afficher
Les sites Web nécessitent une connexion pour accéder
Bouton de recherche
Pagination
......
Il vous suffit de cliquer directement sur un élément de page, puis choisir l'option liée au "Clic" dans le panneau Tips. Voici quelques exemples de captures d'écran.
2. Ajouter à partir du workflow
Parfois, vous devrez ajouter les actions de clic à partir du flux de travail. Déplacez simplement votre souris dans le flux de travail, puis cliquez sur l'icône pour ouvrir le menu déroulant.
Ensuite, vous pouvez choisir "Cliquer" pour ajouter une action de clic à un endroit que vous souhaitez.
3. Auto-detecter
Lorsque vous utilisez la fonctionnalité auto-détecter pour générer le flux de travail, Octoparse extraira d'abord les données de liste. Comment faire si vous devez cliquer sur les éléments de liste pour ouvrir respectivement leur page de détails ? Consultez ce tutoriel pour obtenir plus de détails : Cliquer sur chaque lien dans une liste pour récupérer les données des nouvelles pages
Paramètres d'action pour "Cliquer sur les éléments"
Parfois, vous devriez ajuster les paramètres de l'action "Cliquer sur l'élément". Vous pouvez double-cliquer sur l'étape pour ouvrir la page des paramètres. L'image ci-dessous montre des détails sur les paramètres de clic.
1. Modification de XPath
C'est ici que vous pouvez modifier le XPath de l'élément à cliquer. La balise et le Texte sur la même ligne indiquent aussi l'élément actuel à cliquer.
Parfois, l'action "cliquer sur les éléments" ne fonctionne pas bien pour exécuter des actions de clic. C'est probablement parce que le XPath prédéfini n'est plus valide à cause du changement de la mise en page de site Web. Dans ce cas-là, vous devrez réécrire/mettre à jour le XPath.
2. Options de clic
Vous pouvez ajouter un temps d'attente ou des conditions à respecter avant d'effectuer l'action de clic lorsque les sites web ont besoin d'un certain temps pour charger la page.
Ouvrir dans un nouvel onglet peut ouvrir la page dans un nouvel onglet comme le fait un navigateur.
Charger avec AJAXpermet de gérer le chargement AJAX de la page.
Faire défiler la page vers le bas après son chargement pour simuler le défilement de la page après avoir cliqué sur ouvrir la page.
3. XPath relatif et absolu
Si vous vérifiez les paramètres d'un élément cliquable situé à l'intérieur d'un élément en boucle, vous remarquerez peut-être qu'il existe une option appelée XPath relatif et XPath absolu. Les deux options Xpath ne s'affichent que lorsque l'élément cliquable se trouve à l'intérieur d'une boucle. Si vous devez cliquer sur chaque élément de la boucle, n'oubliez pas de cocher l'option XPath relatif. Vérifiez la différence entre les deux options XPath ici.
4. Reessayer
Vous pouvez laisser Octoparse recharger la page web en fonction de certaines conditions. Pour en savoir plus sur ce paramètre, cliquez ici : retry actions.