Zum Hauptinhalt springen

Wie importiere ich die URLs aus Google Sheet?

Vor über einem Jahr aktualisiert

Google Sheet ist eines der beliebtesten Tabellenkalkulationsprogramme der Welt. Viele Octoparse-Benutzer haben gefragt, ob man URLs aus einem Google Sheet-Arbeitsblatt importieren kann, damit sie die URLs einfach im Blatt aktualisieren können, anstatt die Einstellungen in Octoparse zu ändern.

Im Moment unterstützt Octoparse den Import von URLs direkt aus Google Sheets nicht, aber wir haben eine Lösung dafür. Wir können das Arbeitsblatt im Internet veröffentlichen und diesen Weblink als Start-URL in Octoparse verwenden.


1. Veröffentlichen Sie Ihre Google Sheet-Tabelle im Internet

  • Klicken Sie auf „File“.

  • Wählen Sie „Share“ und selektieren SIe dann „Publish to web“.

Sie würden einen Link zum Blatt erhalten und stellen sicher, dass die Option „Automatically republish when changes are made“ aktiviert ist.


2. Starten Sie eine Aufgabe mit Google-Sheet-URL

Kopieren Sie die URLs und dann fügen Sie sie in Octoparse ein, um eine neue Aufgabe zu starten.


3. Erstellen Sie ein Schleifenelement zum Klick auf jeden Link im Blatt

  • Klicken Sie auf den ersten Link im Blatt.

  • Wählen Sie „Alle ähnlichen Elemente auswählen“ aus der Tipps-Platte.

  • Selektieren Sie „Schleife klicken“.

Ein Schleifenelement wird erstellt, um diesen Link zu öffnen.


4. Konfigurieren Sie die Schritte zur Datenerfassung

  • Wählen Sie beliebige Information, die Sie scrapen möchten.

  • Selektieren Sie die „Text“ unter „Daten extrahieren“.

Der endliche Workflow wird wie folgend angesehen:

Hat dies deine Frage beantwortet?