Amazon est l'un des sites de e-commerce les plus populaires au monde. De nombreux utilisateurs essaient de le récupérer pour collecter des informations sur les produits. Dans ce tutoriel, nous allons vous montrer comment récupérer les détails d'un produit sur Amazon.
Vous pouvez également cliquer sur " Modèles de tâches " dans la page Octoparse et utiliser directement les modèles Amazon prêts à l'emploi pour gagner du temps. Octoparse propose plusieurs modèles Amazon conçus pour différents pays tels que l'Allemagne, la France, les États-Unis, l'Espagne et l'Inde. Grâce à cette fonctionnalité, vous n'avez pas besoin de configurer les tâches de scraping. Pour plus de détails, vous pouvez consulter cette page : Modèles de tâches
Si vous souhaitez savoir comment construire la tâche à partir de zéro, vous pouvez continuer à lire le tutoriel suivant ou regarder la vidéo ci-dessous.
Pour le suivi, vous pouvez utiliser cette URL dans ce tutoriel :
Voici les étapes principales de ce tutoriel : [Télécharger le fichier de tâches ici]
1.Aller à la page Web - ouvrir la page Web
Entrez l'URL de la page d'accueil et cliquez sur " Commencer "
2.Auto-détection de la page Web - création du flux de travail
Cliquez sur Auto-détection des données des pages Web et attendez que la détection soit terminée.
Supprimez les champs inutiles ou renommez les champs si nécessaire dans l'aperçu des données.
Décochez le bouton Ajouter une page de défilement
Cliquez sur Créer un flux de travail
Une pagination et un élément de boucle seront générés automatiquement dans le flux de travail.
3.Cliquez sur chaque lien de produit pour extraire plus d'informations
Choisissez Cliquez sur les liens pour extraire les pages liées dans le panneau "Conseils".
Sélectionnez Cliquer sur un champ de données extrait et sélectionnez le champ sur lequel vous voulez cliquer dans le menu déroulant (vous pouvez confirmer s'il s'agit du bon lien dans l'aperçu des données).
Cliquez sur Confirmer
Octoparse passera automatiquement à la première page du produit.
4.Extraire les données - extraire les données sur les pages détaillées
Sélectionnez des informations sur la page Web
Choisissez Extraire le texte de l'élément sélectionné
Répétez les étapes ci-dessus pour extraire toutes les données dont vous avez besoin.
5.Configurez le délai d'attente AJAX pour le " Cliquez pour paginer "
Cliquez sur l'ouverture des paramètres d'action de Cliquez pour paginer.
Cochez Charger avec AJAX et sélectionnez 10s comme délai d'attente AJAX.
6.Démarrer l'extraction - exécuter la tâche et obtenir les données
Cliquez sur Enregistrer
Cliquez sur Exécuter dans la colonne supérieure gauche
Sélectionnez "Exécuter sur votre appareil" pour exécuter la tâche sur votre ordinateur, ou sélectionnez "Exécuter la tâche dans le Cloud" (pour les utilisateurs Premium uniquement).
Voici l'exemple de résultat: