Passer au contenu principal

Comment gérer la pagination avec un bouton « Charger plus » dans Octoparse

Mis à jour il y a plus de 3 mois

De nombreux sites web utilisent le bouton « Charger plus » ou « Afficher plus » pour charger le contenu de manière continue.
Cette technique est très couramment utilisée afin d’offrir une meilleure expérience utilisateur.

Contrairement à la pagination classique avec un bouton « Suivant », le bouton « Charger plus » ajoute du contenu sur une seule et même page, ce qui rend l’extraction des données un peu plus complexe.
Dans cet article, je vais vous montrer comment gérer un bouton « Charger plus » dans Octoparse.

Vous pourriez avoir besoin de ce lien d’exemple pour suivre les étapes :
https://www.crutchfield.com/shopsearch/TV.html?&fa=1&pg=1#&nvpair=FFCategory|[rank260050]TVs


1. Utilisez la détection automatique pour gérer le bouton « Charger plus ».

La détection automatique des données proposée par Octoparse est particulièrement efficace pour extraire les contenus des sites utilisant un bouton « Charger plus ».

  • Cliquez sur «Auto-détection des données de la page web  et attendez la fin du processus.

Vous verrez une option Cliquer sur un bouton « Charger plus » dans le panneau des conseils.

  • Cliquez sur Vérifier pour voir si le bouton « Charger plus » a été correctement détecté. Sinon, cliquez sur Editer pour choisir le bon bouton.

  • Cliquez sur Editer pour définir le nombre de clics, c’est-à-dire le nombre de fois que vous souhaitez cliquer sur le bouton « Charger plus ».

  • Cliquez sur Créer le flux de travail.

Le flux de travail devrait ressembler à l’image ci-dessous :


2. Créer manuellement une action de pagination

Si la détection automatique ne parvient pas à identifier le bouton « Charger plus », vous pouvez essayer de créer l’étape de pagination manuellement.

  • Sélectionnez le bouton « Charger plus » sur la page web, puis choisissez Boucle de clics.

  • Définissez un délai AJAX approprié (qu’est-ce qu’AJAX ?)

Une étape de pagination sera créée dans le flux de travail, et vous pourrez ensuite ajouter d’autres étapes pour extraire les données.

Conseil :

1. Si vous souhaitez cliquer sur le bouton « Charger plus » uniquement X fois, cliquez sur la boîte Pagination, cochez Répétition, puis définissez le nombre de répétitions sur X.

2. Si vous constatez que la tâche récupère de nombreuses données en double lors de l’extraction, vous pouvez faire glisser l’élément Boucle en dehors de la Pagination, afin qu’Octoparse commence l’extraction seulement après avoir chargé tous les éléments.

Avez-vous trouvé la réponse à votre question ?