Zum Hauptinhalt springen

Hinzufügen der bunutzerdefinierten Datenfelder

Vor über 2 Jahren aktualisiert

Octoparse bietet einige vordefinierte Datenfelder an, die für Benutzer*innen besonders praktisch und bequem sind. Sie können auch in Ihr Task einen befestigten Wert hinzufügen.


Wo kann man vordefinierte Datenfelder hinzufügen?

In der Datenvorschau (Data Preview) können Sie die gewünschten Datenfelder wie folgend hinzufügen:

data preview

Welche vordefinierte Datenfelder kann ich hinzufügen?

Es gibt 5 Arten von definierten Felder -

Datenfelder

1. Datenextraktion auf der Webseite

Diese Option wird Ihnen leiten, andere Elemente zu scrapen, die Sie auf dem Bildschirm extrahieren möchten.

2. Aktuelles Datum & Aktuelle Zeit

Dies wird die Extraktionszeit, wenn eine Datenzeile gescrapt wird. Beispielerweise können Sie dieses Feld hinzufügen, wenn Sie eine Aufgabenplanung haben, womit diese Aufgabe jeden Tag ausgeführt wird, und Sie das Datum wissen möchten, an dem die Datenzeilen gescrapt werden.

aktuelles Datum

TIPPS:

  1. Sie können mit der Verfeinerung extrahierter Zeit das Datum umformatieren, um das Format des aktuellen Zeitfeldes zu verändern.

  2. Hinzufügen der jetzigen Zeit in der Cloud-Datenextraktion kann Ihnen helfen, alle Duplikate zu behalten: Wie kann ich die Duplikate in den Cloud-Ausführungen behalten? (Englisch)

  3. Das Datum in der Cloud-Extraktion ist auf UTC-Uhrzeit.

3. Hinzufügen einer „Page-level data“

Page-level data
  • Page URL: URL der aktuellen Seite

  • Page titel: Titel der aktuellen Seite, der eine kurze Beschreibung einer Webseite ist und an der Spitze vom Browse-Fenster liegt.

Page titel
  • Meta description: Meta-Description-Tag der aktuellen Seite, der eine Sammlung von der Seite enthält.

meta description
  • Meta keyword: Meta-Keyword-Tag der aktuellen Seite

meta keyword
  • HTML source code: der komplette HTML-Code der aktuellen Seite

4. Hinzufügen eines befestigten Wertes

Mit dieser Option können Sie einen befestigten Wert für jede Datenzeile erstellen.

Sie können Ihren kundenspezifischen Feldernamen einstellen oder aus den „Common Fields“ einen Namen wählen. Dann geben Sie den gefestigten Wert ein, den Sie hinzufügen möchten. (Wenn Sie ein leeres Feld hinzufügen wollen, lassen Sie einfach das Kästchen von „Enter Text“ leer sein.)

Fixed value

5. Hinzufügen ursprünglicher Eingabe-URL

Wenn Sie eine Liste von URLs scrapen, möchten Sie wahrscheinlich die ursprüngliche Eingabe-URL als ein Feld erhalten und mit Ihren Ziel-Daten zusammen extrahieren. Da können Sie sie passen und überprüfen, ob es noch URLs gibt, die nicht gescrapt werden.

Hat dies deine Frage beantwortet?