De nombreux sites de leads affichent des informations importantes comme le numéro de téléphone, l’e-mail et le site web de l’entreprise. Cependant, toutes les annonces ne mentionnent pas directement l’adresse e-mail ; il est souvent nécessaire de visiter le site web correspondant pour la trouver. Alors, comment récupérer efficacement ces e-mails ? Ce tutoriel vous présente la méthode en utilisant le modèle Contact Details Scraper pour y parvenir.
Obtenez les liens des entreprises :
Utilisez un modèle de scraping de leads d’Octoparse pour récupérer les URLs des entreprises.
Étape1 : Cherchez un modèle prêt-à-emploi.
Étape 2 : Récupérez les URLs de site Web avec le modèle.
Prenons Pagesjaunes comme un exemple, vous pouvez utiliser directement notre modèle prédéfini pour ce site, soit Pagesjaunes Business Info Scraper.
Saississez les deux paramètres nécessaires (mots-clés et adresse) et puis cliquez Exécuter
Remarque : Vous pouvez entrer une fois une liste de mots-clés, chacun une ligne.
Exporter les données extraites lorsque l'extraction est finie.
Remarque : Les étapes pour obtenir les sites webs s'adaptent également aux d'autres modèles de leads. tels que Europage, Googlemaps etc.
Essayez les modèles en cliquant ces liens :
Utilisez le modèle Contact Details Scraper :
Entrez les paramètres nécessaires pour extraire les adresses e-mail.
Comprendre les paramètres du modèle pour l'extraction de donnée :
En entrant l’URL du site de l’entreprise, le modèle Contact Details Scraper ouvre le site dans le navigateur intégré et extraire les informations affichées, telles que les numéros de téléphone, e-mails et liens vers les réseaux sociaux (Twitter, Youtube, Facebook etc.).
Vous pouvez configurer le modèle pour qu'il explore les liens internes du site, jusqu’à 5 niveaux de profondeur.
Le paramètre nombre maximum de pages détermine le nombre maximal de liens internes que le modèle explorera après avoir chargé une URL.
Le paramètre Rester sur les mêmes domaines permet de spécifier si vous souhaitez que le modèle ne suive que les liens appartenant au même domaine que le site de départ.
Solution en cas de l'échec
Lorsque'il y a des chiffres comme données extraites, mais sans données réellement extraites, et qu'il affiche failed to start task due to website restriction. Il se peut que le lien n'arrive pas se charger normalement, vous pouvez fermer cette page et réessayer.
Si le problème persiste, il se peut que le site prend des mesures de protection anti-scraping, vous pouvez tout simplement nous contacter pour rapporter ce problème.