Zum Hauptinhalt springen

Warum kann Octoparse nur auf das erste Item klicken und dann stoppen?

5 effektive Lösungen zur Behebung des Problems, wenn Octoparse nur auf das erste Element klickt und nicht mit der Liste fortfährt.

Vor über 2 Wochen aktualisiert

Wenn Sie im Workflow eine Klickschleife erstellt haben, lädt Octoparse standardmäßig jeden einzelnen Link in einem neuen Tab. Während Octoparse also jeden Link in der Liste öffnet, geht der Tab mit der Listenseite nie verloren. Es gibt jedoch Sonderfälle, in denen die neue Seite nur direkt im aktuellen Tab geladen werden kann. In diesem Fall kann Octoparse das zweite Element in der Liste nicht laden, da es nicht mehr auf die ursprüngliche Liste zugreifen kann. Sie erhalten also eine Klickschleife, die nur auf das erste Element in der Schleife klickt, ohne zu den anderen Elementen in der Liste zu gelangen.


Wie kann ich wissen, ob mein Schleifen gut oder nicht funktionieren?

Sie können sehen, ob das Schleifenelement jetzt beim manuellen Klicken durch die Aktion im Workflow korrekt funktioniert.

  • Schritt 1: Klicken Sie auf „das Schleifenelement" nach dem Laden des Eintrages.

  • Schritt 2: Klicken Sie auf „Element" und warten auf die neue Seite geladen zu werden.

  • Schritt 3: Klicken Sie auf „das Schleifenelement" noch einmal, um es anzuschauen, ob Octoparse die Listeseite zeigt.

Wenn Sie die Listeseite sehen können, bedeutet es, dass Octoparse jetzt zu der Listeseite rückkehren kann und der Loop gut funktionieren soll. Außerdem müssen Sie sich selbst den Workflow modifizieren, um Ihr Schleifen gut funktionieren zu können. Folgend sind einige schnelle Lösungen, durch die Sie selbst Ihren Loop modifizieren können.


Lösung 1: Öffnen Sie die Detailseite in einem neuen Tab

Für Webseiten, die das Öffnen von Links in einem neuen Tab unterstützen, gehen Sie zu den Einstellungen des Click-Items (man klickt es und öffnet dann eine neue Seite). Überprüfen Sie es, ob „in einem neuen Tab öffnen“ getickt ist. Wenn nicht, einfach ticken die Option, was Ihnen es helfen kann, die Ausgabe wieder zu lösen.

Tipps!

Wenn Sie den Schritt „in einem neuen Tab öffnen“ nicht verstehen oder einige Fragen danach haben, können Sie dieses Tutirial „Daten Scraping aus einem Tab“ lernen.


Lösung 2: Fügen Sie eine Zurück-Schaltfläche hinzu

Wenn das Loop-Element auch dann nicht richtig funktioniert, wenn „ In neuem Tab öffnen“ ausgewählt ist, besteht die Möglichkeit, dass die neuen Seiten im neuen Tab nicht geladen werden können.

In diesem Fall überschreibt die neue Seite die Listenseite beim Laden, daher kann Octoparse nicht zur Listenseite zurückwechseln.

Um dieses Problem zu beheben, suchen Sie nach Schaltflächen, die Sie zurück zur Listenseite führen. Im folgenden Beispiel wäre dies die Schaltfläche „Geld & Versicherung“. Wenn eine solche Schaltfläche vorhanden ist, richten Sie eine Klickaktion mit der Schaltfläche „Geld & Versicherung“ ein. Auf diese Weise klickt Octoparse, wenn es mit dem Scraping der Daten auf der neuen Seite fertig ist, auf die Schaltfläche „Geld & Versicherung“, um zur ursprünglichen Liste zurückzukehren und die anderen Elemente in der Liste weiter zu durchlaufen.

  • Klicken Sie auf die Schaltfläche "Geld & Versicherung"

  • Wählen Sie im Bereich „Tipps“ die Option „URL klicken“ oder „Element anklicken“

  • Passen Sie das AJAX-Timeout so an, dass es lang genug ist, damit die Seite geladen werden kann


Lösung 3: Fügen Sie eine „zur Webseite“ hinzu

Auch wenn „In einem neuen Tab öffnen“ ausgewählt ist und keine Zurück-Schaltfläche verfügbar ist, können Sie noch einen weiteren Trick ausprobieren: Fügen Sie manuell eine Aktion „Zur Webseite“ hinzu, damit Octoparse zur ursprünglichen Listenseite zurückkehren kann.

Bewegen Sie den Cursor über den Workflow und fügen Sie als letzten Schritt im Schleifenelement den Schritt „Seite öffnen“ hinzu . Diese Aktion öffnet die Listenseite jedes Mal erneut, wenn Octoparse mit dem Scraping der aktuellen Artikelseite fertig ist.

So geht's:

  • Fügen Sie dem Workflow eine Aktion „Zur Webseite“ hinzu

  • Kopieren Sie die URL der Listing-Seite und fügen Sie sie ein.


Lösung 4: Fügen Sie ein Zurück zur vorherigen Seite" hinzu

Wenn die oben beschriebenen Methoden keine positiven Ergebnisse zu erzielen scheinen, sollten Sie die Option „Zur vorherigen Seite zurückkehren“ hinzufügen.

Klicken Sie einfach auf das „+“-Symbol und fügen Sie als letzten Schritt im Loop-Element „Zur vorherigen Seite zurückkehren“ hinzu. Mit dieser Funktion können Sie ganz einfach zur ursprünglichen Listenseite zurückkehren und auf andere Elemente in der Liste zugreifen.


Lösung 5: Teilen die Aufgabe in zwei Aufgaben

Schließlich können Sie es ständig versuchen, Ihre Aufgabe in zwei Aufgaben zu teilen. Gleichzeitig ist das unabhängig davon, wie lange Ihre Liste ist oder warum die Seite nicht in einem neuen Tab geladen werden kann. Eine der von zwei Aufgaben ist die in den Liste-Items eingebetteten URLs zu holen, der andere kann von jedem URL die spezielle Information extrahieren. Dieser Trick wirkt Wunder, denn er ist nicht nur zuverlässig, sondern macht den Scraping-Prozess auch viel effizienter, da man nicht zwischen den Tabs hin- und herwechseln muss.

Um den Scraping-Prozess weiter automatisch zu durchlaufen, können Sie die Aufgaben sogar durch dieses folgende Tutorial miteinander verknüpfen: Extraktion von Eingabe einer Stapel URLs.

Hat dies deine Frage beantwortet?