La vitesse d’extraction d’un crawler est affectée par la vitesse de chargement des pages. Si de nombreuses publicités inattendues apparaissent sur la page Web, comme des bannières ou des fenêtres pop-up, la page se chargera lentement et vous fera perdre du temps. Le blocage des publicités peut réduire vos requêtes de page et ainsi optimiser le temps de chargement.
Alors, comment bloquer les publicités dans Octoparse ? Suivons ce tutoriel qui propose deux solutions pour résoudre ce problème.
Solution 1 : Bloquer les publicités dans le flux de travail
Cliquez sur Aller à la page Web > Option
Cochez la case Bloquer les pop-ups (éventuellement les publicités)
Cliquez sur Appliquer pour enregistrer la modification
Solution 2 : Bloquer les publicités dans les paramètres des tâches
Allez dans paramètres d’Exécution
Cochez Bloquer les publicités
Cliquez sur Sauvegarder
Remarques :
L’utilisation de la technique de blocage des publicités peut modifier la structure de certaines pages web. Dans ce cas, veuillez ajuster le XPath afin de relocaliser les éléments. (Pour en savoir plus sur le XPath, consultez Qu’est-ce que le XPath et comment l’utiliser dans Octoparse ?)
Le blocage des publicités peut parfois provoquer des problèmes de chargement des pages. Si vous constatez que la page ne se charge pas correctement — par exemple, qu’elle ne se charge pas du tout — veuillez ne pas activer l’option de blocage des publicités.