Octoparse

Lorsque nous créons une liste d'éléments pour un site web, cette liste peut parfois inclure plusieurs éléments "publicitaires" non désirés.

Prenons l'exemple de Yelp : la boucle générée automatiquement peut inclure tous les résultats sponsorisés dont nous n'avons pas besoin.

Que faire alors si vous ne voulez scraper que les éléments qui ne sont pas des publicités ?

Une façon pratique de le faire est de supprimer les lignes de données indésirables en cliquant sur l'icône de la corbeille sous la colonne Action.

Cependant, pour que cela fonctionne pour chaque élément dont nous n'avons pas besoin, nous devons modifier l'XPath pour l'élément de la boucle afin qu'il ne localise que les éléments non publicitaires.

Vérifiez le code source des éléments dans les DevTools de Chrome, vous verrez qu'il n'y a pas de différences majeures entre les éléments publicitaires et non publicitaires.

Nous devons donc restreindre notre sélection à l'aide de XPath. Il est temps de faire un quiz sur XPath !

Vous pouvez utiliser le lien suivant pour suivre : <a href="https://www.yelp.com/search?find_desc=restaurant&amp;find_loc=Los+Angeles%2C+CA+90001&amp;ns=1" rel="nofollow noopener noreferrer" target="_blank">https://www.yelp.com/search?find_desc=restaurant&amp;find_loc=Los+Angeles%2C+CA+90001&amp;ns=1</a>

Un moyen simple de restreindre votre sélection est d'ajouter des conditions à votre XPath :

(1) Les données dont nous avons besoin sont répertoriées dans la section "Tous les résultats", c'est donc là que nous commençons notre sélection.

Chaque page ne contient que dix résultats, nous devons donc terminer notre sélection après avoir obtenu les dix premiers résultats.

//h2[text()='Tous les résultats']/ancestor::li/following::li[position()&lt;11]

Exclure les éléments de publicité non désirés d'une boucle à l'aide de XPath

Go to Octoparse.com

Octoparse DE

Octoparse FR

Octoparse ES

Octoparse JP

Télécharger

Blog

API Docs

Trouvez réponse à vos questions et obtenez de l’aide auprès des experts de la communauté Intercom

Les conversations que vous avez lancées via le Messenger apparaîtront ici.

Aucune conversation créée par vous

Essayez d’utiliser d’autres mots-clés ou vérifiez s’il n’y a pas de fautes de frappe.

Essayez d’utiliser d’autres mots-clés ou filtres.

Aucune conversation n’a été trouvée

Titre

Ce site utilise des cookies et d’autres technologies que nous et nos fournisseurs tiers utilisons pour surveiller et enregistrer les informations personnelles vous concernant, ainsi que vos interactions avec le site (y compris le contenu consulté, les mouvements du curseur, les enregistrements d’écran et le contenu des chats) aux fins décrites dans notre Politique en matière de cookies. En poursuivant la visite de notre site, vous acceptez nos {websiteTermsLink}, {privacyPolicyLink} et {cookiePolicyLink}.

Ce site utilise des cookies et des technologies similaires (« cookies ») qui sont strictement nécessaires au fonctionnement du site. Nos partenaires et nous-mêmes souhaitons également installer des cookies supplémentaires pour permettre l’analyse des performances du site, la fonctionnalité, la publicité et les fonctions de réseaux sociaux. Consultez notre {cookiePolicyLink} pour en savoir plus. Vous pouvez modifier vos préférences en matière de cookies dans nos Paramètres des cookies.

Nous utilisons des cookies pour faire fonctionner notre site, ainsi qu’à des fins d’analyse et de publicité. Vous pouvez activer ou désactiver les cookies facultatifs si vous le souhaitez. Consultez notre {cookiePolicyLink} pour en savoir plus.

Les cookies publicitaires sont installés par nos partenaires publicitaires pour recueillir des informations sur votre utilisation du site, de nos communications et d’autres services en ligne au fil du temps et avec différents navigateurs et appareils. Ils utilisent ces informations pour vous montrer des publicités en ligne qui, selon eux, vous intéresseront, ainsi que pour mesurer les performances des publicités. Les cookies des réseaux sociaux sont installés par les plateformes de réseaux sociaux pour vous permettre de partager du contenu sur ces plateformes. Ils peuvent suivre des informations relatives à votre activité sur d’autres services en ligne, afin de les utiliser comme décrit dans leurs politiques de confidentialité.

Ces cookies permettent au site Web de proposer de meilleures fonctionnalités et une meilleure personnalisation. Ils peuvent être installés par nous ou par des prestataires tiers dont nous avons intégré les services à nos pages. Si vous n’autorisez pas ces cookies, tous ces services ou une partie d’entre eux risquent de ne pas fonctionner correctement.

Ces cookies sont nécessaires au bon fonctionnement du site Web et ne peuvent pas être désactivés dans nos systèmes.

Ces cookies nous permettent de compter les visites et les sources de trafic afin de mesurer et d’améliorer les performances de notre site. Ils nous aident à savoir quelles pages sont les plus et les moins populaires, et à voir comment les visiteurs naviguent sur le site.

Vous avez le droit de vous opposer à la vente de vos informations personnelles. Consultez notre {cookiePolicyLink} pour plus de détails sur la façon dont nous utilisons vos données.

Vos choix en matière de confidentialité

Nous utilisons des cookies pour améliorer votre expérience. Vous pouvez personnaliser vos préférences en matière de cookies ci-dessous. Consultez notre {cookiePolicyLink} pour en savoir plus.

Paramètres des cookies

Le centre d’aide est vide

Désolé, cette page n’existe pas.

Accueil

Rechercher dans les résultats

Déception

Neutre

Smiley

Je réfléchis...

Recherche dans les sources...

Analyse en cours...

Les tickets soumis par le biais de la messagerie ou par un agent du service d’assistance dans votre conversation apparaîtront ici.

Aucun ticket créé par vous

Aucun ticket trouvé

Suivez l’avancement de tous les tickets et conversations liés à votre entreprise.

Portail client.

Suivez l’avancement des tickets liés à votre entreprise.

Portail Tickets

{assigneeName} étudiera bientôt ce dossier

{assigneeName} a besoin de plus d’informations de votre part

Nous avons besoin de plus d’informations de votre part

Tickets

Pas d’accès au portail des tickets

Rechercher

Ignorez la recherche. Décrivez ce que vous essayez de faire et obtenez une réponse concrète.

Parcourez les articles et les guides de ce sujet.

Créez votre espace de travail et invitez les personnes avec lesquelles vous travaillez.

Configurer votre compte

Créez votre premier workflow et regardez-le s’exécuter de bout en bout.

Envoyer quelque chose

Connectez les outils que votre équipe utilise déjà pour importer des données.

Connectez votre infrastructure technique

Une présentation rapide du produit pour vous montrer où chaque élément se trouve.

{appName} en 60 secondes

Ce prototype de démonstration sait que vous êtes en train de lire « {title} ». Il peut vous rediriger vers l’article actuel, mais un contrat Fin tenant compte des articles en production reste un travail de suivi.

Prototype de réponse tenant compte des articles

Comme vous avez déjà posé des questions sur les invitations, ce prototype de démonstration peut ajouter le suivi : utiliser le sélecteur de rôle avant d’envoyer chaque invitation afin de limiter l’accès aux responsabilités des collègues.

Prototype de suivi limitant les rôles

Ce prototype de démonstration suggère de commencer par votre profil d’espace de travail, d’inviter les membres de l’équipe qui ont besoin d’un accès, puis de connecter les intégrations que vous utilisez.

Prototype de réponse prise en main

Dans ce prototype de démonstration, les intégrations sont configurées à partir des paramètres de l’espace de travail. Choisissez l’intégration, connectez le compte et vérifiez les autorisations activées.

Prototype de réponse intégrations

Dans ce prototype de démonstration, invitez des collègues depuis les paramètres de l’espace de travail, puis choisissez l’accès dont chaque collègue a besoin avant d’envoyer l’invitation.

Prototype de réponse inviter l’équipe

Ce prototype de démonstration n’a pas encore de réponse prédéfinie à cette question. Essayez de demander comment inviter votre équipe ou ouvrir un article source. Aucune API Fin en production n’a été appelée.

Réponse du prototype non disponible

J’ai cette page qui est ouverte. Posez-moi n’importe quelle question à ce sujet et je répondrai en puisant dans les documents.