Passer au contenu principal

Exécuter la tâche localement avec Octoparse 8.5

Mis à jour il y a plus de 2 ans

Vous naviguez dans un guide de tutoriel pour la dernière version d'Octoparse. Si vous utilisez une version plus ancienne d'Octoparse, nous vous recommandons fortement de la mettre à jour car elle est plus rapide, plus facile et plus robuste ! Téléchargez et mettez à jour ici si vous ne l'avez pas encore fait !

Le point fort de cette mise à jour 8.5 est la refonte de presque tout ce qui concerne les exécutions locales et l'inclusion de nombreuses fonctionnalités innovantes. Cela s'est accompagné d'une interface utilisateur plus efficace, avec une mise en page plus ciblée. Nous allons vous guider dans cet article pour vous familiariser avec l'interface.

Lorsque vous avez terminé la construction d'une tâche, vous pouvez cliquer sur le bouton d'exécution en haut à droite comme vous le faites normalement pour exécuter votre tâche.

run_your_task.jpg

Si votre tâche n'est pas fractionnable, le bouton Mode Boost sera désactivé.


Spécifiquement, il y a trois types de modes de boucles divisibles dans Octoparse. Vérifiez votre tâche et voyez si elle contient les trois types de boucles ci-dessous :

  • Liste d'URL

  • Liste de texte

  • Liste fixe

Si c'est le cas, vous pouvez l'exécuter en mode Boost, où Octoparse divise la tâche entière en plusieurs sous-tâches (100 maximum) en fonction de la tâche réelle. Contrairement au fractionnement des tâches dans le cloud, Octoparse n'exécutera que trois sous-tâches simultanées localement. Ainsi, le mode Boost sera environ 3 fois plus rapide que le mode Standard pour les exécutions de données locales. Nous fixons la valeur à 3 et limitons le nombre d'exécutions locales simultanées au cas où Octoparse pousserait votre appareil local au-delà de ses limites.


Fenêtre d'exécution des données locales

1. Mode standard

Lancez n'importe quelle tâche existante en mode standard et une nouvelle fenêtre d'exécution des données locales s'ouvrira.

standard_mode.jpg
  • Informations sur l'exécution de la tâche : La zone grise supérieure affiche désormais le statut de la tâche, le nombre de données extraites, le nombre de doublons, la durée d'exécution, la vitesse moyenne, etc.

  • Pause/reprise : En regardant plus à droite, en plus de l'option pour arrêter complètement la tâche, il y a un bouton pour mettre en pause/reprendre une tâche exécutée localement. Lorsque votre site web cible vous demande de résoudre un CAPTCHA occasionnel ou de remplir quelques informations, vous pouvez mettre la tâche en pause, ouvrir la fenêtre du navigateur pour l'exécution locale et la traiter manuellement. Veuillez noter qu'Octoparse NE PEUT PAS reprendre une tâche si vous fermez le logiciel.

  • Afficher le navigateur : Si vous cliquez sur la fenêtre de l'icône Afficher le navigateur, la zone grise supérieure passera à la vue Web, où vous pouvez voir comment les pages Web sont chargées et surveiller le processus d'exécution de votre tâche.

  • Modification de la tâche : en cliquant sur l'icône de modification de la tâche, vous retournerez à l'interface de modification de la tâche.

La zone blanche inférieure affiche les détails de la tâche dans quatre onglets commutables, à savoir Aperçu, Données extraites, Journal et Historique.

  • Aperçu : Cet onglet donne un aperçu d'un cycle de données particulier. Il indique l'heure de début, l'heure de fin, le nombre de données en excluant les doublons, ainsi que les CAPTCHAs résolus (bientôt) et les proxies (bientôt) utilisés localement au cours de la série de données.

overview.jpg
  • Données extraites : Cet onglet répertorie toutes les données extraites de ce cycle de données particulier.

  • Log (Journal) : Cet onglet répertorie tous les événements du journal d'un cycle de données particulier : Cet onglet répertorie tous les événements du journal d'un cycle de données spécifique. Vous pouvez soit répertorier tous les événements du journal, soit filtrer uniquement les journaux d'erreurs. Les journaux d'erreurs seront extrêmement utiles pour les tâches de dépannage. Vous pouvez exporter les journaux sous forme de fichier texte.

log_tab.jpg
  • Historique : Cet onglet affiche l'historique de chaque exécution de données locales. Vous trouverez en bas à droite une option de sauvegarde automatique de vos données locales vers le cloud après l'arrêt ou l'achèvement d'une tâche (disponible pour les plans Pro et supérieurs). Vous pouvez également choisir de sauvegarder/exporter manuellement les données d'un cycle de données particulier dans la colonne Options, ou de sauvegarder/exporter toutes les données en même temps.

history.jpg

2. Mode Boost

Si nous démarrons une tâche en mode Boost, l'affichage par défaut de la nouvelle fenêtre d'exécution des données locales sera légèrement différent de celui du mode standard.

Il y aura une icône de boost, un indicateur de pourcentage d'accélération, et un bouton Désactiver le Mode Boost à droite de l'état de la tâche. Si nous cliquons sur Désactiver le mode Boost, Octoparse terminera les trois sous-tâches simultanées et exécutera ensuite les sous-tâches restantes une par une. Notez qu'une fois désactivé, le mode Boost ne peut pas être repris pour l'exécution en cours.

boosting.jpg

La zone blanche inférieure affiche toujours les détails de la tâche dans quatre onglets commutables, à savoir Vue d'ensemble, Données extraites, État de la sous-tâche et Historique. Les onglets Vue d'ensemble, Données extraites et Historique restent les mêmes qu'en mode Standard, nous allons donc les sauter et nous concentrer sur la présentation de l'onglet État de la sous-tâche.

  • Statut de la sous-tâche

Cet onglet est affiché pour les tâches exécutées en mode Boost. Vous pouvez vérifier l'heure de création, l'heure de début, l'heure de fin, la durée d'exécution, le nombre de données et l'état de toutes les sous-tâches sous forme de tableau.

Lorsqu'une sous-tâche est marquée comme terminée, vous pouvez survoler cette ligne de données et cliquer sur journaux pour afficher ses journaux d'événements.

subtask_log.jpg
  • Si une sous-tâche est marquée comme étant en pause/en cours d'exécution, vous pouvez la mettre en pause/reprendre ou cliquer sur détails pour accéder à la page de détails. Une nouvelle fenêtre s'ouvre alors avec les onglets Données extraites et Journal.

details.jpg

CONSEIL : Vous pouvez accéder rapidement aux détails d'une sous-tâche en mode Boost en cliquant sur l'icône Afficher le navigateur. Un menu déroulant apparaît alors pour vous permettre de choisir parmi les sous-tâches simultanées.

show_browser.jpg
Avez-vous trouvé la réponse à votre question ?