Zum Hauptinhalt springen

Scraping der Kundenbewertungen von Tripadviser

Vor über 2 Jahren aktualisiert

In diesem Tutorial erfahren Sie, wie man die Kundenbewertungen von Tripadviser extrahieren kann. Dazu ist eine URL als Beispiel herausgegeben und die Ziedaten beziehen sich um die Hotel-Infos, Kundenamen und Bewertungen.


Schritt 1: „Go To Web Page” - Öffnen Sie die Ziel-Webseite.

  • Geben Sie die URL auf der Startseite ein und klicken Sie auf „Start”.

Scraping der Kundenbewertungen von Tripadviser_01


Schritt 2: Erstellen Sie einen Workflow nach der automatische Detektion der Webseite.

  • Klicken Sie auf „Auto-detect web page data” und warten Sie, bis die Detektion abgeschlossen ist.

Scraping der Kundenbewertungen von Tripadviser_02

  • Überprüfen Sie die Datenfelder in der Datenvorschau, und Sie können auch bei Bedarf die unerwünschten Felder löschen oder Felder umbenennen.

Scraping der Kundenbewertungen von Tripadviser_03

  • Deaktivieren Sie „Add a page scroll” und klicken Sie auf „Create workflow”.

Scraping der Kundenbewertungen von Tripadviser_04


Schritt 3: Klicken Sie auf die Linken, um Bewertungsinfo zu erhalten.

  • Klicken Sie auf „Click on link(s) to scrape the linked page(s)”.

Scraping der Kundenbewertungen von Tripadviser_05

  • Wählen Sie „Title URL” und klicken auf „Confirm” .

Scraping der Kundenbewertungen von Tripadviser_06

Modifizieren Sie XPath der URLs für präzise Lokalisierung der Titellinken.

  • Klicken Sie auf „Click URLs in the list” und geben Sie XPath ein: //a[contains(@class,"property_title prominent")]

Scraping der Kundenbewertungen von Tripadviser_07


Schritt 4: Erstellen Sie ein „Loop Item” um Detail-Infos der Bewertungen zu erhalten.

  • Wählen Sie die ihnen gewünschten Daten auf Webseite und klicken Sie auf „Extract the text of the selected element”.

Scraping der Kundenbewertungen von Tripadviser_08

  • Scrollen Sie die Seite nach unten, wählen Sie die ersten zwei Bewertungen und klicken auf „Extract the text of the selected elements”.

  • Wählen Sie die Daten (von Benutzernamen und Bewertungen), und klicken Sie auf „Extract the text of the selected link”.

Scraping der Kundenbewertungen von Tripadviser_09


Schritt 5: Erstellen Sie „Pagination”, um die Bewertungen mehrer Seiten zu extrahieren.

  • Scrollen Sie die Seite nach unten, klicken auf den Button für „Next” und „Loop click next page”.

  • Stellen Sie den Wert von AJAX ein.

Scraping der Kundenbewertungen von Tripadviser_10


Schritt 6: Modifizieren Sie XPath der Datenfeldern.

  • Klicken Sie auf „Vertical View”.

  • Modifizieren Sie XPath von Daten.

Hier sind XPath-Beipiele für die Daten auf Tripadviser.

Phone number: //div[@data-blcontact="PHONE "]

Address: //span[contains(@class,'map')]/following-sibling::span[1]

Number of reviews: //a[@href="#REVIEWS"]

Reviewer name: //a[contains(@class, "header_link")]

Review title: //div[@data-test-target="review-title"]

Review rating: //div[@data-test-target="review-rating"]

Date of stay: //span[contains(text(),"Date of stay:")]/..

Review content: //div[@data-test-target="review-title"]/following-sibling::div[1]

Scraping der Kundenbewertungen von Tripadviser_11


Schritt 7: Reinigen Sie die Daten, um die Felder neu zu formatieren.

Für die Felder von „Rating”, „Date of Stay” und „Review time” können Sie möglicherweise feststellen, dass die Daten durch XPath-Modifizieren nicht so genau sind. Deswegen ist die Datenreinigung benötigt. Dazu

  • Klicken Sie wie z.B. auf die Daten von „Rating”, und wählen Sie „Extract the outer HTML of the selected element”.

Scraping der Kundenbewertungen von Tripadviser_12

  • Klicken Sie dann auf „Clean data”>„Add Step”>„Match with Regular Expression” nacheinander.

Scraping der Kundenbewertungen von Tripadviser_13

  • Wählen Sie „Try RegEx Tool”.

  • Geben Sie „rating bubble_” auf „Start with” und " auf „End with”.

  • Klicken Sie auf „Generate” und „Apply”.

Scraping der Kundenbewertungen von Tripadviser_14

  • Fügen Sie einen Schritt „Replace with Regular Expression” hinzu.

  • Geben Sie dann „ ([0-9]+)([0-9]{1})” in „Regular Expression” ein.

  • Geben Sie „ $1.$2” in „With” ein.

Scraping der Kundenbewertungen von Tripadviser_15


Schritt 8: Scraping starten, um die Aufgabe auszuführen und Daten zu erhalten.

  • Klicken Sie auf „Save”.

  • Klicken Sie auf „Run”.

  • Wählen Sie „Run on your device”, um die Aufgabe mit Ihrem lokalen Gerät auszuführen, oder wählen Sie „Run in the Cloud”, um die Aufgabe auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer)

Scraping der Kundenbewertungen von Tripadviser_16


Hier ist eine Datenausgabe als Beispiel.

Scraping der Kundenbewertungen von Tripadviser_17

Hat dies deine Frage beantwortet?