Zum Hauptinhalt springen

Scraping der Produktdaten aus Lazada

Vor über 11 Monaten aktualisiert

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!

Lazada ist eine internationale E-Commerce-Plattform und einer der größten E-Commerce-Betreiber in Südostasien. Derzeit gibt es dort über 10.000 Drittanbieter und 50 Millionen aktive Käufer pro Jahr.

Dieses Tutorial zeigt Ihnen, wie Sie mit Octoparse Produktinformationen wie Produkttitel, Preis, Bewertung, Versandinformationen usw. von Lazada abrufen können.

Hier ist eine Beispiel-URL, damit Sie diesem Tutorial folgen können:

Die wichtigsten Schritte werden im Menü auf der rechten Seite angezeigt, und Sie können die Beispielaufgabendatei hier herunterladen.


Schritt 1: Zur Website - um die Ziel-Website zu öffnen

  • Geben Sie die URL auf die Startseite ein und dann klicken Sie auf „Starten“.

Lazada verwendet Captcha als Anti-Scraping-Maßnahme; daher ist es wichtig, vor der Einrichtung der Aufgabe das Captcha zu lösen.

  • Öffnen Sie den Browser-Modus.

  • Lösen Sie den Captcha manuell.

  • Schließen Sie den Browser-Modus ab.

Für mehr Information, wie man Capctha in Octoparse lösen kann, prüfen Sie bitte dieses Tutorial: Auflösung des Captcha


Schritt 2: Verwendung der Auto-Detektionsfunktion - um einen Workflow zu erstellen

  • Klicken Sie auf „Daten der Webseite automatisch detektieren“ unter Tipps und warten, bis die Detektion abgeschlossen ist.

  • Klicken Sie „Workflow erstellen“ an.

  • In der Datenvorschau können Sie überprüfen, ob Sie nun mit dem Daten-Output zufrieden sind.

    • Wenn Sie die extrahierten Datenfelder bearbeiten möchten, können Sie einfach auf „...“ klicken und die ausgewählten Datenfelder duplizieren, löschen, verfeinern usw.

    • Wenn Sie den Namen eines Felder umbenennen möchten, können Sie doppelt auf den Titel des Feldes klicken.


Schritt 3: Unterseite-URL wählen - um Daten aus der Detailseite zu extrahieren

  • Wählen Sie die Unterseite-URL in der Tipps-Platte.

  • Wählen Sie Title_URL als das Datenfeld zum Klicken > Bestätigen

  • Klicken Sie auf Ihr gewünschtes Datenfeld, z. B. Infos zum Versand.

  • Selektieren Sie „Text“ in der Tipps-Platte.

  • Wiederholen Sie die obigen Schritte, um alle anderen Daten auf der Detailseite zu extrahieren.


Schritt 4: Aufgabe ausführen - um Ihre gewünschten Daten zu erhalten

  • Klicken Sie auf „Speichern“.

  • Klicken Sie auf „Starten“.

  • Wählen Sie „Standard-Modus“ unter „Auf Ihrem Gerät ausführen“, um das Task mit Ihrem lokalen Gerät auszuführen.

  • Klicken Sie auf „Unterbrechen“ und „Browser anzeigen“, um den Captcha manuell zu lösen, dann setzen Sie den Prozess fort.


Hier sind die Beispieldaten.

Hat dies deine Frage beantwortet?