Nous vous proposons de télécharger la nouvelle version pour découvrir les fonctions les plus puissantes. Obtenir un code promo pour votre première commande en contactant lea@octoparse.com ou support@octoparse.com.
Dans ce tutoriel, nous allons vous montrer comment extraire les réponses à un tweet sur Twitter.
Pour suivre le tutoriel, vous pouvez utiliser l'URL ci-dessous :
Voici les principales étapes de ce tutoriel : Télécharger le fichier de tâches ici
Créer une page web - pour ouvrir le site web cible
Auto-détection de la page web - pour créer un flux de travail
Modifier les paramètres du défilement de la page - pour améliorer le défilement de la page et le chargement complet des données
Modifier le XPath de la boucle - pour localiser le(s) champ(s) de données plus précisément.
Exécuter la tâche - pour obtenir les données souhaitées
1.Créer une page web - pour ouvrir le site web cible
Saisissez l'URL cible dans la barre de recherche de l'écran d'accueil et cliquez sur Démarrer.
2.Auto-détection de la page web - pour créer un flux de travail
La fonction d'auto-détection d'Octoparse peut vous aider à créer rapidement un flux de travail en fonction du design du site web cible.
Cliquez sur Auto-détection des données des pages web dans Astuces et attendez que la détection soit terminée.
Vérifiez les champs de données dans l'aperçu des données et supprimez les champs non désirés ou renommez-les si nécessaire.
Décochez la case Cliquer sur un bouton "Charger plus".
Cliquez sur Créer un flux de travail
3.Modifier les paramètres du défilement de la page - pour améliorer le défilement de la page et le chargement complet des données
Cliquer sur Faire défiler la page
Cochez Défiler pour une page
Définir le temps d'attente : 2 à 3 secondes recommandées
Cochez Capturer les données lorsque la page défile dynamiquement (éventuellement en double) - Important !
Cliquez sur Appliquer pour enregistrer la modification
4.Modifier le XPath de la boucle - pour localiser le(s) champ(s) de données plus précisément.
Cliquez sur Boucle de l'élément dans le flux de travail
Saisissez le XPath de correspondance sous la forme suivante : //article[@tabindex] : //article[@tabindex]
Cliquez sur Appliquer pour enregistrer la modification
5.Exécuter la tâche - pour obtenir les données souhaitées
Cliquez sur Enregistrer en haut à droite pour enregistrer votre tâche.
Cliquez sur Exécuter à côté de la tâche et attendez que la fenêtre Exécuter la tâche s'affiche.
Sélectionnez Exécuter sur votre appareil pour exécuter la tâche sur votre appareil local.
Attendez que la tâche soit terminée
Voici un exemple de résultat d'une exécution locale :