Passer au contenu principal

Scraper les réponses d'un Tweet

Mis à jour il y a plus de 2 ans

Nous vous proposons de télécharger la nouvelle version pour découvrir les fonctions les plus puissantes. Obtenir un code promo pour votre première commande en contactant lea@octoparse.com ou support@octoparse.com.

Dans ce tutoriel, nous allons vous montrer comment extraire les réponses à un tweet sur Twitter.

tweet_1.jpg

Pour suivre le tutoriel, vous pouvez utiliser l'URL ci-dessous :

Voici les principales étapes de ce tutoriel : Télécharger le fichier de tâches ici

  • Créer une page web - pour ouvrir le site web cible

  • Auto-détection de la page web - pour créer un flux de travail

  • Modifier les paramètres du défilement de la page - pour améliorer le défilement de la page et le chargement complet des données

  • Modifier le XPath de la boucle - pour localiser le(s) champ(s) de données plus précisément.

  • Exécuter la tâche - pour obtenir les données souhaitées


1.Créer une page web - pour ouvrir le site web cible

  • Saisissez l'URL cible dans la barre de recherche de l'écran d'accueil et cliquez sur Démarrer.

tweet_7.jpg

2.Auto-détection de la page web - pour créer un flux de travail

La fonction d'auto-détection d'Octoparse peut vous aider à créer rapidement un flux de travail en fonction du design du site web cible.

  • Cliquez sur Auto-détection des données des pages web dans Astuces et attendez que la détection soit terminée.

tweet_6.jpg
  • Vérifiez les champs de données dans l'aperçu des données et supprimez les champs non désirés ou renommez-les si nécessaire.

tweet_5.jpg
  • Décochez la case Cliquer sur un bouton "Charger plus".

  • Cliquez sur Créer un flux de travail

create.jpg


3.Modifier les paramètres du défilement de la page - pour améliorer le défilement de la page et le chargement complet des données

  • Cliquer sur Faire défiler la page

  • Cochez Défiler pour une page

  • Définir le temps d'attente : 2 à 3 secondes recommandées

  • Cochez Capturer les données lorsque la page défile dynamiquement (éventuellement en double) - Important !

  • Cliquez sur Appliquer pour enregistrer la modification

scrolldown.jpg

4.Modifier le XPath de la boucle - pour localiser le(s) champ(s) de données plus précisément.

  • Cliquez sur Boucle de l'élément dans le flux de travail

  • Saisissez le XPath de correspondance sous la forme suivante : //article[@tabindex] : //article[@tabindex]

  • Cliquez sur Appliquer pour enregistrer la modification

tweet_3.jpg

5.Exécuter la tâche - pour obtenir les données souhaitées

  • Cliquez sur Enregistrer en haut à droite pour enregistrer votre tâche.

  • Cliquez sur Exécuter à côté de la tâche et attendez que la fenêtre Exécuter la tâche s'affiche.

  • Sélectionnez Exécuter sur votre appareil pour exécuter la tâche sur votre appareil local.

  • Attendez que la tâche soit terminée


Voici un exemple de résultat d'une exécution locale :

result.jpg
Avez-vous trouvé la réponse à votre question ?