Google Sheet est l'un des tableurs les plus populaires au monde. De nombreux utilisateurs d'Octoparse ont demandé s'ils pouvaient importer des URL à partir d'une feuille de calcul Google Sheet afin de pouvoir simplement mettre à jour les URL dans la feuille au lieu de modifier les paramètres dans Octoparse.
Pour l'instant, Octoparse ne supporte pas l'importation d'URLs directement depuis Google Sheets mais nous avons une solution de contournement. Nous pouvons publier la feuille de calcul sur le web et utiliser ce lien web comme URL de départ dans Octoparse.
1. Publier votre feuille de calcul Google Sheet sur le Web
Cliquez sur Fichier
Choisissez Partager et sélectionnez Publier sur le web
Vous obtiendrez un lien vers la feuille et assurez-vous que l'option "Republier automatiquement lorsque des modifications sont apportées" est cochée.
2. Démarrer une tâche avec l'URL de la Google Sheet
Copiez et collez les URL dans Octoparse pour commencer une nouvelle tâche.
3. Créez un élément de boucle pour cliquer sur chaque lien de cette feuille
Cliquez sur le premier lien de la feuille
Choisissez Sélectionner tout dans les conseils
Choisissez Cliquer en boucle sur chaque URL
Un élément de boucle sera créé pour ouvrir ce lien.
4. Configurer les étapes pour obtenir les données
Choisissez les informations à extraire
Choisissez Extraire le texte de l'élément sélectionné
Le flux de travail final sera le suivant :