Zum Hauptinhalt springen

Scraping der Videos aus TikTok

Vor über einem Jahr aktualisiert

Sie folgen jetzt einem Tutorial für die neueste Version von Octoparse. Wenn Sie zur Zeit eine ältere Version verwenden, empfehlen wir Ihnen kräftig es, ein Upgrade zu machen, weil sie schneller, leichter und stärker ist! Herunterladen und Installierung eines Upgrades hier, wenn Sie nicht so bereits machen!


TikTok ist nun eine super beliebte und auf Videos fokussierte Social-Networking-Applikation, die eine Vielzahl von kurzen Nutzervideos aus Genres wie Streiche, Stunts, Tricks, Witze, Tanz und Unterhaltung bereitstellt.

In diesem Tutorial würden wir Ihnen anzeigen, wie man mit der Auto-Detektionsfunktion von Octoparse nur in 3 Schritte die laufende Video-Information aus TikTok scrapen kann.

Die folgende URL ist den Link vom laufenden Video aus TikTok, die wir als Beispiel nennen. Wir würden Ihnen die Schritte anzeigen, um die Hintergrundsmusik, URL des Autor, ID des Autor, Autorname, Likes, Bewertungen usw. zu scrapen.

Hier gibt es einige Schritte in diesem Tutorial. [Herunterladen der Datei hier]


Schritt 1: "Go to Web Page" - um die Ziel-Webseite zu öffnen

  • Erstellen Sie dadurch Ihr Task, dass Sie die URL in den Suchkasten auf der Startseite eingeben.

  • Klicken Sie auf "Start".

Startseite

Tipp: Wenn Sie nach dem Eingehen ein Captcha bekommen, öffnen Sie zuerst den Browse-Modus und dann manuell es anpassen. Nach der Auflösung von Captcha sollten Sie wieder den Modus schließen.


Schritt 2: Auto-Detect der Webseite - um einen Workflow zu erstellen

  • Klicken Sie auf "Auto-detect web page data" und warten Sie, bis es abgeschlossen ist.

auto detect

Wir benötigen die Daten überprüfen, die durch Auto-Detektion ausgewählt werden.

  • Gehen Sie zur Datenvorschau, um zu sehen, ob Sie mit aktuellem Daten-Output zufrieden wären.

    • Einfach durch Klick auf Löschen-Icon die ungewünschten Daten löschen

      mceclip13.png
    • Durch doppeltes Klick auf den Kopf der Datenfelder sie umbenennen

Datenfelder in der Datenvorschau
  • Klicken Sie auf "Edit" unter "Add a page scroll", um die Einstellung "scroll to the bottom of the page" anzukreuzen. Dann stellen Sie "Repeats" als 20 und die Wartezeit als 1s ein (Sie können auch mehr "Repeats" einstellen, wenn Sie mehr Videos erhalten möchten).

  • Klicken Sie auf "Confirm" zur Speicherung der Einstellungen.

confirm
  • Klicken Sie auf "Create workflow".


Schritt 3: Ausführung Ihres Tasks - um Ihre gewünschten Daten zu erhalten

  • Klicken Sie auf "Save" und dann "Run".

  • Wählen Sie "Run on your device", um Ihr Task in Ihrem eigenen Gerät durchzuführen, oder wählen Sie "Run in the Cloud", um Ihr Task in der Cloud durchzuführen (nur für bezahlte Benutzer*innen).

task run

Hier gibt es ein Beispiel-Output:

Beispiel-Output
Hat dies deine Frage beantwortet?