Zum Hauptinhalt springen

Welche Arten von Websites/Daten kann Octoparse scrapen?

Diese Woche aktualisiert

Octoparse unterstützt das Scrapen von Daten von über 98 % der Websites, einschließlich solcher mit AJAX, JavaScript und anderen dynamischen Elementen. Es ermöglicht zudem die einfache Handhabung von Formularen, Dropdown-Listen, unendlichem Scrollen und vielem mehr.

Generell gilt: Wenn Informationen auf einer Website kopiert und eingefügt werden können, können sie mit Octoparse gescrapt werden. Genauer gesagt, solange die Zieldaten im HTML-Quellcode der Website vorhanden sind (auch wenn sie auf der Seite nicht direkt sichtbar sind), kann Octoparse sie extrahieren.


1. Auf der Webseite sichtbare Elemente:

  • Text

  • Bild-URL

  • Links (URLs)

  • Innerer/Äußerer HTML-Code

  • Attributwert

Für weitere Informationen sehen Sie sich bitte Folgendes an: Extrahieren Sie Attribute eines Webelements (Text, URL, HTML usw.)


2. Jegliche im Quellcode versteckte Informationen, wie zum Beispiel:

  • Seiten-URL
    Seitentitel
    Metadaten
    HTML-Quellcode
    Aktuelle Uhrzeit

Weitere Details finden Sie hier:


3. Welche Arten von Websites kann Octoparse nicht scrapen?

Derzeit ist Octoparse nicht in der Lage, Daten von Folgendem zu scrapen:

  • XML-Sitemap

  • PDF-Datei


Wenn Sie es als zeitaufwendig empfinden, Daten von komplexen Websites zu scrapen, oder Sie sich einfach darauf konzentrieren möchten, Ihr Unternehmen optimal zu führen, können Sie uns gerne für unseren Datenservice kontaktieren.

Hat dies deine Frage beantwortet?