Passer au contenu principal

Comment surveiller les prix de vos concurrents avec Octoparse — exemple avec Boulanger

Vous souhaitez suivre l'évolution des prix de vos concurrents sans vérifier manuellement chaque fiche produit ? Avec Octoparse, vous pouvez extraire automatiquement les prix, disponibilités et promotions depuis un site e-commerce — et mettre à jour vos données aussi souvent que nécessaire.

Dans ce tutoriel, nous prenons Boulanger.com comme exemple, l'une des principales enseignes françaises de produits électroniques et électroménagers.


Ce que vous allez extraire

  • Nom du produit

  • Prix actuel

  • Prix de référence (prix barré)

  • Taux de réduction (ex : -33%)

  • Disponibilité (retrait en magasin / livraison à domicile)

  • ...


Prérequis


Étape 1 : Saisir l'URL cible

Ouvrez Octoparse et collez l'URL de la catégorie produit souhaitée dans la barre de recherche, puis cliquez sur Démarrer.

💡 Vous pouvez remplacer cette URL par n'importe quelle catégorie produit de Boulanger, ou adapter la méthode à un autre site e-commerce de structure similaire.


Étape 2 : Gérer le pop-up

Boulanger affiche un pop-up au chargement de la page (bandeau de cookies, offre promotionnelle, etc.). Il est recommandé de le fermer avant de lancer l'Auto-détection pour avoir une vue dégagée sur la page.

Deux solutions sont possibles :

Solution 1 — Fermer le pop-up via le panneau de conseils

Cliquez sur le bouton de fermeture du pop-up (croix, « Refuser », « Accepter », etc.) dans le navigateur intégré, puis sélectionnez Cliquez sur l'élément dans le panneau de conseils.

Solution 2 — Utiliser le mode navigation

Activez le mode navigation, fermez le pop-up comme dans un navigateur classique, puis désactivez ce mode pour reprendre la configuration du workflow.

💡 Si vous êtes déjà familier avec Octoparse, notez que ce pop-up n'affecte pas le workflow en lui-même — il gêne uniquement la visibilité à l'écran. Dans certains cas, cette étape peut être ignorée.


Étape 3 : Lancer l'Auto-détection

Une fois la page chargée et le pop-up fermé, cliquez sur Auto-détection.

Octoparse analyse automatiquement la structure de la page et identifie les champs extractibles : nom du produit, prix, description, etc.

Une fois la détection terminée, cliquez sur Créer un flux de travail dans le panneau de conseils.


Étape 4 : Configurer la pagination

La page de résultats de Boulanger affiche les produits sur plusieurs pages. Suivez les instructions du panneau de conseils pour configurer la pagination :

1. Cliquez sur Bouton page suivante dans le panneau de conseils

2. Sélectionnez le bouton de pagination dans le navigateur intégré, puis confirmez

Octoparse génère alors automatiquement deux actions dans votre flux de travail :

  • Pagination : une boucle qui localise le bouton de page suivante à chaque itération (via XPath)

  • Cliquer pour paginer : une action de clic qui charge la page suivante

L'extraction des données de la liste est ainsi intégrée dans cette boucle : Octoparse extrait les produits de la première page, clique sur « Page suivante », extrait la deuxième page, et répète l'opération jusqu'à la dernière page.


Étape 5 : Vérifier et ajuster les champs détectés

Dans l'Aperçu de données, vérifiez les champs détectés. Supprimez les champs non pertinents en cliquant sur l'icône de suppression à côté de chaque champ inutile.

Vous pouvez également renommer les champs en double-cliquant sur leur nom.


Étape 6 : Exécuter la tâche

Une fois le workflow finalisé, cliquez sur Exécuter et sélectionnez votre mode d'exécution.

Pour une première exécution, il est recommandé de choisir le mode local (sur votre ordinateur). Ce mode affiche le navigateur intégré en temps réel, ce qui vous permet de vérifier le bon déroulement de la collecte et de consulter les journaux en cas d'erreur.


Étape 7 : Exporter vos données

Une fois la collecte terminée, cliquez sur Exporter les données et choisissez votre format préféré : Excel ou CSV.

Vos données sont prêtes à être analysées et comparées avec vos propres tarifs.


Résultat attendu

À l'issue de la collecte, vous obtenez un fichier structuré de ce type :


Aller plus loin : extraire les données des fiches produit

Les pages de liste fournissent les informations essentielles (prix, titre, promotions). Si vous souhaitez également récupérer des données plus détaillées présentes uniquement sur les fiches produit (disponibilité, caractéristiques techniques, avis clients, etc.), deux méthodes sont disponibles.


Méthode 1 : Créer une nouvelle tâche dédiée aux pages de détail

1. Cliquez sur Tâche personnalisée pour créer une nouvelle tâche

2. Importez les URLs des pages de détail en lot — soit depuis le fichier obtenu lors de l'extraction de la liste, soit en les copiant-collant directement dans le champ prévu.

Cliquez sur Enregistrer : une boucle d'URLs est ainsi créée

3. Fermez le pop-up si nécessaire

4. Cliquez successivement sur les champs souhaités dans le navigateur intégré, puis sélectionnez Tous les champs de données dans le panneau de conseils pour les ajouter à l'aperçu

5. Si besoin, ajoutez un champ URL d'entrée pour identifier l'origine de chaque ligne de données

6. À l'étape Extraire des données, configurez un temps d'attente pour garantir le chargement complet de la page avant l'extraction

7. Cliquez sur Exécutez et choissiez le mode d'exécution.

💡 Si vous disposez d'une version payante ou d'un essai gratuit, il est fortement recommandé d'exécuter cette tâche en mode Boost : les URLs sont traitées en parallèle, ce qui accélère considérablement la vitesse de collecte.


Méthode 2 : Étendre le workflow existant

Cette méthode permet d'extraire les données de liste et de détail dans un seul et même workflow, sans créer de tâche supplémentaire.

1. À la suite de l'étape Extraire des données de la liste, cliquez sur le titre du premier produit dans le navigateur intégré, et puis sélectionnez Cliquez sur l'élément dans le panneau de conseils pour ouvrir la page de détail

2. Sélectionnez les champs souhaités sur la page de détail — en particulier ceux qui ne sont pas disponibles sur la page de liste

3. Le workflow finalisé se présente comme suit :


Pour aller plus loin

Vous souhaitez automatiser cette surveillance et recevoir des données fraîches chaque jour sans intervention manuelle ? Les versions payantes d'Octoparse permettent de planifier vos tâches automatiquement et d'exécuter vos collectes directement dans le cloud — sans avoir besoin de laisser votre ordinateur allumé.

Vous rencontrez des difficultés sur votre propre tâche ? N'hésitez pas à nous contacter à support@octoparse.com, nous serons ravis de vous aider.

Avez-vous trouvé la réponse à votre question ?