Passer au contenu principal

Comment surveiller les prix de vos concurrents avec Octoparse — exemple avec Boulanger

Vous souhaitez suivre l'évolution des prix de vos concurrents sans vérifier manuellement chaque fiche produit ? Avec Octoparse, vous pouvez extraire automatiquement les prix, disponibilités et promotions depuis un site e-commerce — et mettre à jour vos données aussi souvent que nécessaire.

Dans ce tutoriel, nous prenons Boulanger.com comme exemple, l'un des principaux retailers français de produits électroniques et électroménagers.


Ce que vous allez extraire

  • Nom du produit

  • Prix actuel

  • Prix de référence (prix barré)

  • Taux de réduction (ex : -33%)

  • Disponibilité (retrait en magasin / livraison à domicile)

  • ...


Prérequis


Étape 1 : Saisir l'URL cible

Ouvrez Octoparse et collez l'URL de la catégorie produit souhaitée dans la barre de recherche, puis cliquez sur Démarrer.

💡 Vous pouvez remplacer cette URL par n'importe quelle catégorie produit de Boulanger, ou adapter la méthode à un autre site e-commerce de structure similaire.


Étape 2 : Résoudre le pop-up

Solution 1 : cliquez le bouton pour fermer le pop-up (comme accepter le cookie, refuser, un bouton de croix etc) dans le navigateur intégré et puis choisissez Cliquez sur l'élément dans le panneau de conseils.

Solution 2 : activez le mode navigation et puis fermer le pop-up comme dans un navigateur réel, ensuit désactivez ce mode pour continuer la configuration du workflow.

Note : Ce pop-up n'affecte pas la configuration du workflow, pourtant, il nous empêche la vue sur l'écran. Si vous êtes avez familer avec le logiciel, cet étape de pop-up peut parfois être négligé.


Étape 3 : Lancer l'Auto-détection

Une fois la page chargée dans Octoparse, et pop-up fermé, cliquez sur Auto-détection.

Octoparse analyse automatiquement la structure de la page et identifie les champs extractibles : nom du produit, prix, description, etc.

Une fois la détection terminée, cliquez sur Créer un flux de travail dans le panneau de conseils.

On peut constater en bas de la page qu'il y a plusieurs pages à extraire, donc il faut suivre le conseil de panneau de cpnseils et cliquez sur Bouton pages suivante.

Choisissez dans le navigateur intégré le bouton de pagination pour configurer l'étape de pagination et confirmez.

L'action de pagination se compose de deux étapes.

  1. Pagination, il s'agit en effet une étape de boucle (mode de boucle : élément unique), c'est à dire, chaque fois, on va localiser ce bouton (via XPath)

  2. Cliquer pour paginer, il s'agit une étape de clic, une fois on aurait localiser le bouton, on effectue l'action de clic pour paginer.

Cela s'explique pourquoi l'extraction des données de la liste s'est mis dans la boucle de pagination. on doit finir d'abord l'extraction d'une première page et puis cliquer le bouton de pigination ensuite, passer à l'extraction de la deuxième page, et puis paginer, et répéter comme ça, jusqu'à la fin.


Étape 3 : Vérifier et ajuster les champs détectés

Dans le panneau de conseils, vérifiez les champs détectés. Supprimez les champs non pertinents en cliquant sur l'icône de suppression à côté de chaque champ inutile.

Vous pouvez également renommer les champs en doubles-clic le nom.


Étape 6 : Exécuter la tâche

Une fois le workflow finalisé, cliquez sur Exécuter et sélectionnez votre mode d'exécution.

Pour une première exécution, il est recommandé de choisir le mode local (sur votre ordinateur). Ce mode affiche le navigateur intégré en temps réel, ce qui vous permet de vérifier le bon déroulement de la collecte et de consulter les journaux en cas d'erreur.


Étape 7 : Exporter vos données

Une fois la collecte terminée, cliquez sur Exporter les données et choisissez votre format préféré : Excel ou CSV.

Vos données sont prêtes à être analysées et comparées avec vos propres tarifs.


Résultat attendu

À l'issue de la collecte, vous obtenez un fichier structuré de ce type :

Nom du produit

Prix

Disponibilité

Promotion

Samsung TV 55" QLED

799 €

En stock

-15%

LG OLED 65"

1 299 €

En stock

Sony Bravia 50"

649 €

Rupture de stock


Si vous ne vous contentez pas d'informations comme prix dans la page de liste, et voulez aussi les informations détaillés dans la page de détail.

On a des démarches.

Il vous suffit de continuer à la base des étapes ci-dessus.

Méthode 1 : Créer une nouvelle tâche pour les infos de détails.

Cliquez sur Tâche personnalisée pour commencer une nouvelle tâche.

Importer l'URL de la page de détail en lot (ceux que vous avez obtenu par l'extraction des données de la liste), vous pouvez soit importer ces URL directement depuis le fichier obtenu, soit les copier-coller dans la case.

Une fois Sauvegarder, une boucle de URL est ainsi créée.

Ensuite, fermer le pop-up, et puis extraire les champs que vous voulez dans la page de détail.

Cliquez successivement les champs désirés dans le navigateur intégré et puis, cliquez sur le panneau de conseil Tous les champs de données. les données seront ainsi choisies et présentes dans l'aperçu de donnée.

Vous pouvez aussi ajouter une champ comme URL entrée pour savoir les données provenant de quel URL.

Il est recommandé à l'étape de Extraire des données, de configurer des temps d'attente afin d'assurer que la page de détail soit bien chargé avant l'étape d'extraction de données.

Ensuite Cliquez sur Exécutez et choissiez le mode d'exécution.

Si vous êtez en version payante ou un essai gratuit, il est fortement recommandé d'exécution la tâche en mode Boost, ainsi des URL vont s'effectent en parallèle et la vitesse de scraping vont s'augmente considérablement.

Méthode 2 :

Vous pouvez continuer l'extraction de détail sur la base de l'ancien workflow.

A la suite de l'étape Extraire des données, vous cliquez le premier titre du produit et choisissez Cliquez sur l'élément sur le panneau de conseil, pour ouvrir la page de détail.

Lorques vous entrez dans la page de détail, faitez comme la méthode 1, fermez le pop-up si il y en a, et choisissez les champs désirés dans la page de détail, surtout ces non disponibles dans la page de liste.

Un flux de travail finalisé comme indiqué dans la photo suivante :

Pour aller plus loin

Vous souhaitez automatiser cette surveillance et recevoir des données fraîches chaque jour sans intervention manuelle ? Les versions payantes d'Octoparse permettent de planifier vos tâches automatiquement et de stocker vos données directement dans le cloud.

Vous rencontrez des difficultés sur votre propre tâche ? N'hésitez pas à nous contacter à support@octoparse.com, nous serons ravis de vous aider.

Avez-vous trouvé la réponse à votre question ?