Passer au contenu principal

Comment extraire davantage d'informations qui nécessitent un clic pour s'afficher ?

Mis à jour il y a plus de 2 mois

Parfois, vous pouvez vous retrouver dans une situation où il est nécessaire de cliquer sur certains éléments pour afficher les informations cachées derrière.
Par exemple, certains numéros de téléphone peuvent être masqués derrière un bouton Appeler, ou certaines informations peuvent se trouver dans des onglets différents.
Comment peut-on collecter ce type de données ?

Sur ce site, si vous souhaitez consulter la description détaillée, vous devez d’abord cliquer sur l’onglet Description pour l’afficher.

Supposons que nous voulions extraire le numéro de téléphone à partir de cette page.

scrape_description.png

Voici deux méthodes pour vous aider à y parvenir :


1. Ajouter une étape de clic – Indiquez à Octoparse de cliquer sur l’onglet Description pour l’ouvrir

  • Cliquez sur l’onglet Description

  • Sélectionnez Cliquer sur l’URL (cela peut aussi être Cliquer sur l’élément ou Cliquer sur le bouton)

  • Ouvrir les paramètres de clic

  • Allez dans l’onglet Options

  • Décochez Ouvrir dans un nouvel onglet

  • Configurez le chargement AJAX entre 2 et 5 secondes

  • Cliquez sur Appliquer pour enregistrer

Une fois que le texte de la description est affiché, nous pouvons le récupérer.


2. Si les données se trouvent dans le code source de la page web, vous pouvez les extraire directement

  • Activez le mode Navigation

  • Cliquez manuellement sur l’onglet Description pour l’ouvrir

  • Désactivez le mode Navigation

  • Récupérez le texte de la description comme pour n’importe quelle autre information textuelle

Attention : Cette méthode ne fonctionne que si les données sont présentes dans le code source, que l’onglet soit ouvert ou non.

Si les informations ne s’affichent qu’après un clic, il faut alors utiliser la première méthode.

Avez-vous trouvé la réponse à votre question ?