Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!
Als Höhepunkt dieses 8.5-Updates haben wir fast alles rund um lokale Läufe neu gestaltet und viele innovative Funktionen integriert. Damit einher ging eine effektivere Benutzeroberfläche mit einem zweckmäßigeren Layout. Wir werden Sie in diesem Artikel durch die Oberfläche führen, damit Sie sich mit ihr vertraut machen können.
Wenn Sie die Erstellung einer Aufgabe abgeschlossen haben, können Sie wie gewohnt oben rechts auf die Schaltfläche „Führen“ klicken, um Ihre Aufgabe auszuführen.
Wenn die Aufgabe eine teilbare Schleife enthält, erscheint ein Pop-Up-Fenster mit der Option, zwischen dem Boost-Modus und dem Standard-Modus zu wählen. Wenn Ihr lokales Gerät leistungsfähig genug ist, wird empfohlen, in den Dashboard-Einstellungen den Boost-Modus für lokale Läufe standardmäßig zu aktivieren.
Wenn Ihre Aufgabe nicht teilbar ist, wird der Button vom Boost-Modus deaktiviert.
Welche Daten können aufgeteilt werden?
In Octoparse gibt es nur 3 davon können aufgeteilt werden. Prüfen Sie bitte Ihre Aufgabe und sehen, ob sie eine Schleife aus folgenden drei Typen enthält:
Liste der URLs (häufigst verwendet)
Textliste
Feste Liste
Wenn ja, können Sie sie im Boost-Modus führen, in dem Octoparse die gesamte Aufgabe in mehrere Teilaufgaben (maximal 100) aufteilt, je nach der eigentlichen Aufgabe. Im Gegensatz zur Aufgabenteilung in der Cloud führt Octoparse lokal nur drei Unteraufgaben gleichzeitig aus. Daher ist der Boost-Modus bei lokalen Datenläufen etwa dreimal so schnell wie der Standard-Modus. Wir setzen den Wert auf 3 und begrenzen die Anzahl der gleichzeitigen lokalen Läufe für den Fall, dass Octoparse Ihr lokales Gerät über seine Grenzen hinaus belastet.
TIPPS: Lesen Sie bitte diesen Artikel, um mehr Tipps erfahren, wie man seine Aufgabe teilbar sein lässt.
Führungsfenster der lokalen Daten
1. Standard Modus
Starten Sie beliebige vorhandene Aufgabe in Standard Modus, dann wird ein neues Führungsfenster der lokalen Daten erscheinen.
Führungsinfo der Aufgaben: Im oberen grauen Bereich werden nun der Aufgabenstatus, die Anzahl der extrahierten Daten, die Anzahl der Duplikate, die Laufzeit, die Durchschnittsgeschwindigkeit usw. angezeigt.
Umbrechen/Fortsetzen: Weiter rechts befindet sich neben der Option, die Aufgabe vollständig zu beenden, eine Schaltfläche zum Umbrechen/Fortsetzen einer lokal ausgeführten Aufgabe. Wenn Sie auf Ihrer Zielwebseite gelegentlich ein CAPTCHA lösen oder einige Informationen eingeben müssen, können Sie die Aufgabe anhalten, das Browserfenster für den lokalen Lauf öffnen und die Aufgabe manuell bearbeiten. Bitte beachten Sie, dass Octoparse eine Aufgabe NICHT wieder aufnehmen kann, wenn Sie die Software schließen.
Browser anzeigen: Wenn Sie auf das Fenster mit dem „Browser anzeigen“ klicken, wechselt der obere graue Bereich zur Webansicht, in der Sie sehen können, wie die Webseiten geladen werden, und den laufenden Prozess Ihrer Aufgabe überwachen können.
Aufgabe bearbeiten: Klicken Sie auf „Aufgabe bearbeiten“-Icon, was Sie zurück zur Oberfläche für die Aufgabenbearbeitung führt.
Im unteren weißen Bereich werden die Aufgabendetails auf vier umschaltbaren Registerkarten angezeigt, darunter Aufgabenübersicht, Datenliste, Ereignis-Log und Aktuelle Läufe.
Aufgabenübersicht: Diese Registerkarte gibt einen Überblick über einen bestimmten Datenlauf. Sie zeigt die Startzeit, die Endzeit, die Anzahl der Daten ohne Duplikate sowie die CAPTCHA-Versuche und die gescheiterten URLs während der Datenextraktion. Außerdem können Sie auch hier den Automation-Prozess einstellen.
Datenliste: Auf dieser Registerkarte werden alle Daten aufgelistet, die aus diesem Datenlauf extrahiert wurden.
Ereignis-Log: Auf dieser Registerkarte werden alle Protokollereignisse eines bestimmten Datenlaufs aufgelistet. Sie können entweder alle Protokollereignisse auflisten oder nur die Fehlerprotokolle filtern. Die Fehlerprotokolle sind bei der Fehlersuche äußerst hilfreich. Sie können die Protokolle als Textdatei exportieren.
Aktuelle Läufe: Auf dieser Registerkarte wird der Verlauf für jeden lokalen Datenlauf angezeigt. Unten rechts finden Sie eine Option zum automatischen Sichern Ihrer lokalen Laufdaten in der Cloud, nachdem eine Aufgabe gestoppt oder abgeschlossen wurde (verfügbar für die Profi- und höhere Pläne). In der Spalte Optionen können Sie auch wählen, ob Sie die Daten für einen bestimmten Datenlauf manuell sichern/exportieren oder alle Daten gleichzeitig sichern/exportieren möchten.
TIPP: Octoparse unterstützt nun Cloud-Backup für lokale Läufe. Wenn Sie einen Profi- oder höheren Plan abonniert haben, können Sie Octoparse jetzt so einstellen, dass Ihre lokalen Laufdaten automatisch in der Cloud gesichert werden, nachdem eine Aufgabe angehalten oder abgeschlossen wurde. Dies ist äußerst hilfreich, wenn Sie die API verwenden möchten, um Ihre lokalen Daten mit einer Datenbank zu verbinden.
2. Boost Modus
Wenn wir eine Aufgabe im Boost-Modus starten, ist die Standardansicht des neuen Fensters für den lokalen Datenlauf etwas anders als im Standard-Modus.
Es gibt ein Boost-Icon, eine Anzeige für die Beschleunigung in Prozent und eine Schaltfläche von „Boost-Modus deaktivieren“ rechts neben dem Aufgabenstatus. Wenn wir auf „Boost-Modus deaktivieren“ klicken, beendet Octoparse die drei gleichzeitigen Teilaufgaben und führt dann die restlichen Teilaufgaben nacheinander aus. Beachten Sie, dass der Boost-Modus nach der Deaktivierung nicht mehr für den aktuellen Lauf aktiviert werden kann.
Der untere weiße Bereich zeigt nach wie vor die Aufgabendetails auf vier umschaltbaren Registerkarten an, darunter Aufgabenübersicht, Datenliste, Teilaufgabenstatus und Aktuelle Läufe. Die Registerkarten „Aufgabenübersicht“, „Datenliste“ und „Aktuelle Läufe“ bleiben dieselben wie im Standard-Modus, daher überspringen wir diese und konzentrieren uns auf die Einführung der Registerkarte „Teilaufgabenstatus“.
Teilaufgabenstatus
Diese Registerkarte wird für Aufgaben angezeigt, die im Boost-Modus ausgeführt werden. Sie können die Erstellungszeit, die Startzeit, die Endzeit, die Laufzeit, die Datenanzahl und den Status aller Teilaufgaben in Tabellenform überprüfen.
Wenn eine Teilaufgabe als abgeschlossen markiert ist, können Sie den Mauszeiger über diese Datenzeile bewegen und auf Log klicken, um die Ereignisprotokolle anzuzeigen.
Wenn eine Teilaufgabe als Pausiert/Laufend markiert ist, können Sie sie umbrechen/fortsetzen oder auf Details klicken, um die Detailseite aufzurufen. Sie gelangen dann zu einem neuen Fenster mit den Registerkarten „Datenliste“ und „Log“.
TIPP: Sie können im Boost-Modus schnell auf die Details einer Teilaufgabe zugreifen, indem Sie auf das Symbol „Browser anzeigen“ klicken. Wenn Sie darauf klicken, wird ein Dropdown-Menü angezeigt, in dem Sie aus den gleichzeitigen Teilaufgaben auswählen können.