Um die Scraping-Funktionen zu verbessern, die Stabilität zu erhöhen und den immer komplexer werdenden Anforderungen an die Datenextraktion gerecht zu werden, hat Octoparse in Version 8.8.0 zwei neue Scraping-Modi für die lokale Extraktion eingeführt: den Chrome-Modus und den Monitorlosen Modus.
Chrome-Modus (Headful-Modus)
Was ist das:
Chrome-Modus verwendet Ihren eigenen Google-Chrome-Browser, um eine Aufgabe zu laufen. Dies bedeutet, dass Octoparse den Browser direkt steuert und echte Benutzeraktionen auf der Website simuliert.
Best für:
Websites mit manueller Anmeldung.
Durch CAPTCHA oder Cloudflare geschützte Seiten.
Komplexe oder stark interaktive Websites.
Notiz:
Wenn Sie eine Aufgabe im Chrome-Modus ausführen, bleibt der Chrome-Browser im Vordergrund. Bitte vermeiden Sie während dieser Zeit jegliche Vorgänge in Chrome.
Die Aufgabe kann nicht minimiert werden und wird beendet, wenn der Browser geschlossen wird.
Monitorloser Modus
Was ist das:
Der Monitorlosen Modus läuft ohne sichtbare Browser-Oberfläche. Stattdessen führt er Scraping-Aufgaben im Hintergrund aus, wodurch er ressourcenschonend und effizient ist.
Best für:
Websites, die keine manuelle Anmeldung erfordern.
Seiten mit einfachen HTML-Strukturen.
Websites mit minimalen Anti-Scraping-Maßnahmen.
Routinemäßige Scraping-Aufgaben mit hohem Volumen.
Wie kann man den Modus in Octoparse wechseln?
Öffnen Sie Ihre Aufgabe in Octoparse 8.8.0 oder einer höheren Version.
Klicken Sie auf „Ausführen“.
Wählen Sie im Abschnitt „Auf Ihrem Gerät ausführen“ den Chrome-Modus, den monitorlosen Modus oder den Standardmodus aus.
Tipp: Der Standardmodus ist die Standardeinstellung, wenn Sie auf „Starten“ klicken. Bei der lokalen Ausführung Ihrer Aufgabe wird der im Client integrierte Browser verwendet. Sie können zu einem anderen Modus wechseln, wenn dieser Ihren Anforderungen besser entspricht.