Parfois, vous pouvez vous retrouver dans une situation où il est nécessaire de cliquer sur certains éléments pour afficher les informations cachées derrière.
Par exemple, certains numéros de téléphone peuvent être masqués derrière un bouton Appeler, ou certaines informations peuvent se trouver dans des onglets différents.
Comment peut-on collecter ce type de données ?
Prenons ce site web comme exemple : https://www.cclcomponents.com/solaredge-h1300-power-optimizer-15809
Sur ce site, si vous souhaitez consulter la description détaillée, vous devez d’abord cliquer sur l’onglet Description pour l’afficher.
Supposons que nous voulions extraire le numéro de téléphone à partir de cette page.
Voici deux méthodes pour vous aider à y parvenir :
1. Ajouter une étape de clic – Indiquez à Octoparse de cliquer sur l’onglet Description pour l’ouvrir
Cliquez sur l’onglet Description
Sélectionnez Cliquer sur l’URL (cela peut aussi être Cliquer sur l’élément ou Cliquer sur le bouton)
Ouvrir les paramètres de clic
Allez dans l’onglet Options
Décochez Ouvrir dans un nouvel onglet
Configurez le chargement AJAX entre 2 et 5 secondes
Cliquez sur Appliquer pour enregistrer
Une fois que le texte de la description est affiché, nous pouvons le récupérer.
2. Si les données se trouvent dans le code source de la page web, vous pouvez les extraire directement
Cliquez manuellement sur l’onglet Description pour l’ouvrir
Désactivez le mode Navigation
Récupérez le texte de la description comme pour n’importe quelle autre information textuelle
Attention : Cette méthode ne fonctionne que si les données sont présentes dans le code source, que l’onglet soit ouvert ou non.
Si les informations ne s’affichent qu’après un clic, il faut alors utiliser la première méthode.