Zum Hauptinhalt springen

Scraping der Bewertungen aus einem Tweet

Vor über 11 Monaten aktualisiert

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!

X(Twitter) ist eine kostenlose Social-Networking-Website, auf der die Nutzer*innen kurze Beiträge, so genannte Tweets, veröffentlichen. Twitter-Nutzer*innen posten durchschnittlich 6000 Tweets pro Sekunde, so dass täglich über 500 Millionen Tweets gepostet werden. Diese Tweets können Text, Videos, Fotos oder Links enthalten, und die Nutzer*innen können miteinander interagieren, indem sie auf Tweets antworten.

In diesem Tutorial würden wir Ihnen anzeigen, wie Sie die Bewertung aus einem Tweet in X scrapen können.

Um diesem Tutorial zu folgen, benötigen Sie wahrscheinlich diese URL:

Die wichtigsten Schritte werden im Menü auf der rechten Seite angezeigt, und Sie können die Beispielaufgabendatei hier herunterladen.


Schritt 1: „Zur Webseite“ erstellen - um die Zile-Website zu eröffnen

  • Geben Sie die URL auf die Startseite ein und dann klicken Sie auf „Starten“.


Schritt 2: Bei Twitter anmelden - um die Bewertungen anzuzeigen

  • Öffnen Sie den Browser-Modus.

  • Klicken Sie auf Anmelden.

  • Fügen Sie Ihre Anmeldungsinfos ein, um sich bei Twitter anzumelden.

  • Klicken Sie auf den „Zur Website“-Schritt --> „Optionen“-Tab auswählen --> „Cookies verwenden“ aktivieren --> Auf „Verwenden Sie Cookies aus dieser aktuellen Seite“ klicken --> „Übernehmen“ anklicken

  • Deaktivieren Sie jetzt den Browser-Modus.

Notiz: Octoparse bietet zusammen drei Methoden zur Speicherung der Cookies. Mehr können Sie in diesem Tutorial finden.


Schritt 3: Verwendung der Auto-Detektionsfunktion - um einen Workflow zu erstellen

Mit der automatischen Erkennungsfunktion von Octoparse können Sie schnell einen Workflow erstellen, der dem Design der Ziel-Website entspricht.

  • Klicken Sie auf „Daten der Webseite automatisch detektieren“ unter Tipps und warten, bis die Detektion abgeschlossen ist.

  • Klicken Sie „Workflow erstellen“ an.


Schritt 4: Einstelleungen der Herunterscrollen-Seite modifizieren - um die Seite besser herunterzuscrollen und die Daten vollständig laden zu können

  • Klicken Sie auf „Seite scrollen“.

  • Stellen Sie die Wartezeit als 2-3s ein.

  • Klicken Sie auf „Übernehmen“ zur Speicherung der Änderungen.

Notiz: Überprüfen Sie hier, um während des Scrollen der Seite mehr über Daten-Scraping zu finden.


Schritt 5: XPath der Schleife anzupassen - um die Datenfelder genauer zu lokalisieren

  • Klicken Sie auf „Schleifenelement“ im Workflow.

  • Geben Sie den Matching-XPath in den Kasten ein: //div[@class="css-1dbjc4n r-18u37iz"]/div[2]

  • Klicken Sie auf „Übernehmen“ zur Speicherung der Änderung.

  • Prüfen Sie die Datenfelder in der Datenvorschau und löschen Sie die ungewünschten Felder beim Klick auf „Mehr“ --> Feld löschen


Schritt 6: Text extrahieren - um Ihre gewünschten Daten zu wählen

  • Klicken Sie auf das Element, woran Sie Interesse haben.

  • Wählen Sie „Text“ in der Tipps-Platte.

Nach der Auswahl von den Daten können Sie in die Datenvorschau eingehen und dann die Datenfelder umbenennen, wenn nötig.


Schritt 7: Starten der Extraktion - um Task durchzuführen und Daten zu erhalten

  • Klicken Sie auf „Speichern“.

  • Klicken Sie auf „Starten“.

  • Wählen Sie „Standard-Modus“ unter „Auf Ihrem Gerät ausführen“, um das Task mit Ihrem lokalen Gerät auszuführen.

  • Warten Sie, bis die Ausführung abgeschlossen ist.


Hier sind die Beispieldaten.

Tipp: Lokale Läufe eignen sich hervorragend für die Fehlersuche bei Aufgaben und für schnelle Läufe. Wenn Sie mit komplizierteren Aufgaben zu tun haben, wird empfohlen, dass Sie „In der Cloud ausführen“ wählen, um die Aufgabe in der Cloud-basierten Plattform von Octoparse auszuführen, um die Geschwindigkeit zu erhöhen. Probieren Sie diese Premium-Funktion aus, indem Sie sich für die 14-tägige kostenlose Testversion anmelden. Sie können Ihre Aufgaben auch so planen, dass sie stündlich, täglich oder wöchentlich ausgeführt werden und Ihnen regelmäßig Daten geliefert werden.


Hat dies deine Frage beantwortet?