Leadsgenerierung ist eine der populärsten und nützlichsten Webseiten für Datenerfassung. Das Branchenverzeichnis Gelbe Seite spielt in Deutschland bei Sammelung von Kontaktinformationen über Unternehmen, Selbständige und Freiberufler eine besonders wichtige Rolle. In diesem Tutorial würden wir Ihnen anzeigen, wie man Leadsdaten von Gelbe Seiten scrapen kann.
Für Gelbe Seiten können Sie zuerst auf der Startseite unsere Gelbe Seiten Sammlung probieren, die einfach zu verwenden ist. Alles, was Sie tun müssen, ist einige Parameter einzugeben, und dann wird das Task durchgeführt. Für weitere Details können Sie hier checken: Aufgabenvorlage
Wir bieten vier verschiedene Gelbe Seiten Templates an:
Gelbe Seiten Scraper: Blitzschnelles Extrahieren von Leadsdaten – kostenlos nutzen und direkt loslegen!
Gelbe Seiten Scraper nach URLs: Individuelles Scraping mit deinen eigenen URLs für präzise Ergebnisse – ebenfalls kostenlos verfügbar!
Gelbe Seiten Details Scraper (Cloud): Cloud-basiertes Scraping für detaillierte Infos – superschnell und stabil! (Premium)
Gelbe Seiten Listing Scraper (Cloud): Scraping für komplette Listen – effizient und leistungsstark! (Premium)
Prüfen Sie bitte die folgenden Schritte, wenn Sie wissen möchten, wie man von Anfang an mit Octoparse ein Task erstellen kann. Wir würden die folgende URL verwenden, um die Daten wie Titel, Adresse, Telefonnummer usw. scrapen.
In der rechten Seitenleiste sind die hauptsächlichen Schritte in diesem Tutorial. [Im Anhang laden Sie die Datei herunter]
Schritt 1: „Gehen Sie zur Webseite“ - um die Ziel-Webseite zu öffnen
Geben Sie die URL auf die Startseite ein und dann klicken Sie auf Starten.
Schritt 2: Verwendung der Auto-Detektionsfunktion - um einen Workflow zu erstellen
Klicken Sie auf „Daten der Webseite automatisch detektieren“ und warten Sie darauf, bis die Detektion abgeschlossen ist.
Klicken Sie auf „Workflow erstellen“.
Gehen Sie zur „Datenvorschau", um zu sehen, ob Sie mit dem aktuellen Daten-Output zufrieden sind.
In der Datenvorschau können Sie überprüfen, ob Sie nun mit dem Daten-Output zufrieden sind.
Wenn Sie die extrahierten Datenfelder bearbeiten möchten, können Sie einfach auf „...“ klicken und die ausgewählten Datenfelder duplizieren, löschen, verfeinern usw.
Wenn Sie den Namen eines Felder umbenennen möchten, können Sie doppelt auf den Titel des Feldes klicken.
Wenn Sie aus den Seitenlisten alle gewünschten Daten scrapen können, können Sie direkt mit Schritt 5 (Einstellung der Paginierung) fortfahren. Falls Sie auf jeden Detail-Link scrapen möchten, um mehr Infos zu erhalten, folgen Sie bitte dem nächsten Schritt.
Schritt 3: Klicken auf jede Detailseite - um mehr Infos zu extrahieren
Klicken Sie direkt nach der Auto-Detektion auf den Titel jedes Items und dann wählen Sie „Auf Element klicken“ in der Tipps, um in die Detailseite einzugehen.
Stellen Sie Wartezeit und AJAX-Timeout für diesen Schritt „Klick Item“ ein, um mit genuger Zeit Webseite laden zu lassen und nicht blokiert zu werden.
Stellen die Wartezeit mehr als 3s ein. Die Zeit können Sie natürlich nach Ihren Bedarf und der Webseite anpassen.
Schritt 4: „Daten Scrapen“ - um die Daten auf die Detailseiten zu scrapen
Extrahieren Sie die gewünschten Daten auf die Detailseite. Einfach darauf klicken und dann wählen „Text“ oder beliebiges Element, was Sie scrapen können.
Schritt 5: Einstellung der Paginierung - um wiederholt mehr Daten zu laden
Klicken Sie wieder auf „Daten extrahieren“ in der Liste, um in die Seitenliste zurückzugehen.
Scrollen Sie manuell nach den unten auf diese Webseite. Am Ende können Sie einen Button von „Mehr Anzeigen“ ansehen.
Klicken Sie darauf und wählen Sie „Schleife klicken“, um eine Paginiereng zu erstellen.
Stellen Sie Wartezeit als 3s und AJAX-Timeout als 7s für diesen Click-Schritt ein.
Der Schritt von Pagnierung sollte das Schleifen-Element enthalten.
Tipps: Mehr Details über Erstellung einer Paginierung mit dem Button von „Mehr Anzeigen“ können Sie in diesem Tutorial ansehen und lernen: Umgang mit Paginierung (mit Button „Mehr Laden“).
Schritt 6: Starten der Extraktion - um Task durchzuführen und Daten zu erhalten
Klicken auf „Speichern“.
Klicken auf „Starten“.
Wählen „Auf Ihrem Gerät ausführen“, um das Task mit Ihrem lokalen Gerät auszuführen, oder Wählen „In der Cloud ausführen“, um das Task auf unseren Cloud-Servern auszuführen (nur für Premium-Benutzer).
Hier sind die Beispieldaten.