Octoparse unterstützt das Scrapen von Daten von über 98 % der Websites, einschließlich solcher mit AJAX, JavaScript und anderen dynamischen Elementen. Es ermöglicht zudem die einfache Handhabung von Formularen, Dropdown-Listen, unendlichem Scrollen und vielem mehr.
Generell gilt: Wenn Informationen auf einer Website kopiert und eingefügt werden können, können sie mit Octoparse gescrapt werden. Genauer gesagt, solange die Zieldaten im HTML-Quellcode der Website vorhanden sind (auch wenn sie auf der Seite nicht direkt sichtbar sind), kann Octoparse sie extrahieren.
1. Auf der Webseite sichtbare Elemente:
Text
Bild-URL
Links (URLs)
Innerer/Äußerer HTML-Code
Attributwert
Für weitere Informationen sehen Sie sich bitte Folgendes an: Extrahieren Sie Attribute eines Webelements (Text, URL, HTML usw.)
2. Jegliche im Quellcode versteckte Informationen, wie zum Beispiel:
Seiten-URL
Seitentitel
Metadaten
HTML-Quellcode
Aktuelle Uhrzeit
Weitere Details finden Sie hier:
3. Welche Arten von Websites kann Octoparse nicht scrapen?
Derzeit ist Octoparse nicht in der Lage, Daten von Folgendem zu scrapen:
XML-Sitemap
PDF-Datei
Wenn Sie es als zeitaufwendig empfinden, Daten von komplexen Websites zu scrapen, oder Sie sich einfach darauf konzentrieren möchten, Ihr Unternehmen optimal zu führen, können Sie uns gerne für unseren Datenservice kontaktieren.
