Connaissances avancées
XPath, pagination, nettoyage des données, anti-blocage, API, et plus encore
56 articles
Qu'est-ce que XPath et comment l'utiliser dans Octoparse ?
Utiliser XPath relatif pour localiser des données en dehors d'un élément de boucle
Utilisez XPath pour localiser les adresses e-mail dans les liens "mailto" de n'importe quel site web
Corriger les erreurs de champs (champs manquants, vides ou déplacés)
Personnaliser l'élément XPath
Localiser et collecter un élément par le biais du texte à côté
Exclure les éléments de publicité non désirés d'une boucle à l'aide de XPath
Configurer un XPath alternatif
Scraper et télécharger des fichiers depuis des sites web
Ajouter un champ de données personnalisé
Obtenir des données au niveau de la page (métadonnées, URL, titre & HTML)
Ajouter l'URL d'origine (avant la redirection) avec les données collectées
Supprimer les duplications
Regrouper plusieurs lignes de données en une seule
Importer et exporter la configuration d'un champ de données
Options anti-blocage
Configurer les proxies IP
Basculer entre des pools d’IP pour vos exécutions dans le cloud
Résoudre le Captcha
Qu'est-ce que la vérification Cloudflare et comment le résoudre ?
Comment gérer manuellement les vérifications de Cloudflare ?
Ajouter un Agent Utilisateur personnalisé
Réessayer les actions
Comment supprimer un groupe de tâches
Trouvez votre ID de tâche
Comment importer et exporter une tâche ?
Organiser les tâches en utilisant des filtres
Groupes de tâches
Exécuter la tâche localement avec Octoparse 8.5
Partager votre tâche via un lien
Programmer les exécutions de tâches
Recevoir une notification lorsqu'une tâche se termine
Alertes personnalisées (v8.7.4 et plus)