Vous êtes en train de parcourir un guide de tutoriel pour la dernière version d'Octoparse. Si vous utilisez une version plus ancienne d'Octoparse, nous vous recommandons fortement de la mettre à jour car elle est plus rapide, plus facile et plus robuste ! Téléchargez et mettez à jour ici si vous ne l'avez pas encore fait !
Lorsque vous effectuez une recherche sur un site web, par exemple Google.com, vous pouvez soit cliquer sur le bouton de recherche après avoir saisi un mot clé, soit appuyer directement sur la touche Entrée de votre clavier pour accéder à la page des résultats de la recherche. Octoparse peut facilement simuler l'action de cliquer, mais que se passe-t-il si le site web n'a pas de bouton de recherche à cliquer ?
Cet article va illustrer comment Octoparse traite le dilemme avec la fonction "appuyer sur Entrée" lorsqu'il n'y a pas de bouton de soumission disponible.
Vous aurez besoin de l'URL ci-dessous comme exemple à suivre.
Il existe deux options pour contourner les limitations de fonctionnalité lorsque vous rencontrez des problèmes.
1.Utiliser la fonction "Appuyer sur la touche Entrée" dans les paramètres de saisie du texte
Lorsque vous ouvrez la page web de Mazda, il est évident qu'il n'y a pas de bouton de soumission disponible pour effectuer la recherche après avoir saisi vos mots-clés.
Vous devrez paramétrer la fonction "appuyer sur entrée" pour permettre au système d'appuyer automatiquement sur la touche "entrée" pour effectuer une recherche lors de l'exécution du flux de travail.
Cliquez sur le champ de recherche pour saisir un mot-clé
Vous verrez qu'une action Saisir le texte a été créée dans le flux de travail.
Cliquez sur l'action Entrer un texte
Sélectionner Appuyer sur la touche Entrée/Retour à la fin de la saisie
Définir le délai d'attente approprié
Définir des délais d'attente AJAX lorsque le site web utilise la technique AJAX
Définir des délais de défilement lorsque le site web actuel nécessite un défilement avant d'être entièrement chargé.
2.Utiliser le mot-clé de recherche comme paramètre pour générer une nouvelle URL
Certains sites web utilisent le mot-clé recherché comme paramètre de l'URL pour construire de nouvelles URL. Par exemple, le domaine d'origine d'un site web, https://www.allaboutincontinence.co.uk/
Si vous recherchez le mot-clé suivant : id-for-men-level-3, l'URL du résultat de la recherche par mot-clé est la suivante :https://www.allaboutincontinence.co.uk/id-for-men-level-3
Vous pourrez utiliser l'URL ci-dessus comme point de départ pour configurer votre flux de travail afin d'éviter qu'il n'y ait pas de bouton de soumission sur la page d'accueil. Cela permet également d'économiser du temps de scraping puisque nous n'avons pas besoin d'entrer du texte et de cliquer sur le bouton de recherche.