Bienvenue sur Octoparse ! Nous proposons des services principalement de web scraping. Avec notre logiciel, vous pouvez extraire des données de différentes formes présentes sur la page web, tels que texte, chiffres, dates, liens, images et PDF etc.
Pour une meilleure expérience, il est recommandé de télécharger Octoparse sur votre ordinateur et de demander un essai gratuit du plan premium afin de découvrir les fonctions les plus puissantes.
1. L'interface
Dès que vous vous connectez à Octoparse, vous trouverez deux sections principales : la page d'accueil et la barre latérale.
1.1 La page d'accueil
Une barre de recherche située en haut de la page vous permet de saisir l'URL de la page web cible pour commencer à créer une tâche.
Vous pouvez également saisir le mot clé d'un modèle (comme Amazon ou Google map) pour rechercher un modèle de scraping prédéfini.
Vous pouvez en même temps accéder à certains des modèles les plus populaires sur la page d'accueil.
Il y a un bouton d'assistance dans le coin inférieur droit. Vous pouvez rechercher un tutoriel ou démarrer une échange rapide avec l'équipe de support d'Octoparse pour toute assistance nécessaire.
1.2 Le menu de la barre latérale
Le menu de la barre latérale à gauche contient tout ce dont vous avez besoin pour naviguer dans Octoparse.
Nouveau : créer / importer une nouvelle tâche ou créer de nouveaux groupes de tâches.
Tableau de bord : visualiser toutes vos tâches de scraping ici. Modifiez, supprimez, renommez et organisez toutes les tâches de votre compte. Vous pouvez facilement lancer, arrêter ou programmer des tâches.
Modèles de web scraping : c'est par ici que vous pouvez trouver tous les modèles disponibles.
1.3 L'espace de Travail
L'espace de travail est l'endroit où vous créez votre tâche. Il se compose de 5 parties principales, chaque partie a son rôle.
Le navigateur intégré : Une fois que vous avez saisi l'URL d'une page web cible, la page web sera chargée dans le navigateur intégré d'Octoparse. Vous pouvez parcourir le site web en mode Navigation ou cliquer pour extraire les données dont vous avez besoin en mode Sélection.
Panneau de Conseils : Octoparse utilise ce panneau pour vous donner des conseils tout au long du processus de création de tâche.
Flux de travail : A mesure que vous interagissez avec la page Web, comme en ouvrant une page Web et en cliquant sur un élément/bouton, l'ensemble du processus est défini automatiquement sous la forme d'un flux de travail.
Paramètres : Vous pouvez voir les options de paramètres pour chaque action une fois que vous sélectionnez une certaine action.
Aperçu des Données : Vous avez un aperçu de données ici. Vous pouvez renommer les champs de données ou supprimer ceux qui ne sont pas nécessaires.
2. Fonctionnalités Principales
2.1 Modèles de Web Scraping
Les modèles sont des tâches pré-construites qui permettent aux utilisateurs d'obtenir des données en entrant des paramètres simples tels que des URLs ou des mots-clés. Jusqu'à maintenant, plus de 400 modèles de Web scraping sont accessbiles sur Octoparse, couvrant la plupart des sites populaires et principles. Aucune configuration n'est nécessaire. Il vous suffit de :
trouvez le modèle par une recherche
checker l'exemple de données pour voir ce que vous pouvez obtenir
saisir les mots-clés ou URL
cliquer pour lancer la tâche
obenir des données souhaitées
Contrairement aux modèles prêts-à-l'emploi, le mode de personnalisation de tâches est beaucoup plus flexible et puissant qui vous permet de créer une tâche personnalisée selon vos besoin spécifiques. C'est assez robuste pour gérer les sites Web complexes, comme des pages avec JavaScript, AJAX ou tout autre site Web dynamique.
N'inquiétez pas ! Ce n'est pas difficile ni compliqué de créer votre propre tâche par vous-même. Equipé du tout nouvel algorithme de détection automatique, Octoparse détecte automatiquement les éléments sur une page et génère un flux de travail et d'autres paramètres de tâche, par exemple, pour extraire les données de la page de résultats et puis aller à la page de détail de chaque résultat.
Après que la détection automatique est terminée, vous pouvez modifier manuellement les paramètres de la tâche. Ou vous pouvez directement créer une tâche à partir de zéro en ignorant l'étape de détection automatique.
Une fois que vous êtes satisfait des données détectées automatiquement, vous cliquez simplement sur "Créer un flux de travail" et Octoparse générera automatiquement le workflow de la tâche. Vous pouvez ajouter des étapes supplémentaires au flux de travail ou modifier les actions manuellement si nécessaire.
2.3 Extraction Cloud
Octoparse propose une puissante plate-forme Cloud pour les utilisateurs premium (Standard et supérieur) pour exécuter les tâches 24/7. Quand vous exécutez une tâche sur Cloud, elle s'exécute dans le Cloud avec plusieurs serveurs en utilisant nos IP. Vous pouvez arrêter l'application ou votre ordinateur pendant l'exécution de la tâche. Plus de besoin de se soucier des limitations des matériels.
Les données extraites seront enregistrées dans le Cloud et accessibles à tout moment. Des fonctionnalités avancées telles que la rotation IP automatique, la programmation des tâches, le mode boost et l'API Octoparse font toutes partie du service Octoparse Cloud.
Ayant une première découverte de Octoparse, êtes-vous prêt à créer votre première tâche d'extraction de données ?
Passez à la Leçon 1 : Extraire les données automatiquement