Octoparse bietet einige vordefinierte Datenfelder an, die für Benutzer*innen besonders praktisch und bequem sind. Sie können auch in Ihr Task einen befestigten Wert hinzufügen.
Wo kann man vordefinierte Datenfelder hinzufügen?
In der Datenvorschau (Data Preview) können Sie die gewünschten Datenfelder wie folgend hinzufügen:
Welche vordefinierte Datenfelder kann ich hinzufügen?
Es gibt 5 Arten von definierten Felder -
1. Datenextraktion auf der Webseite
Diese Option wird Ihnen leiten, andere Elemente zu scrapen, die Sie auf dem Bildschirm extrahieren möchten.
2. Aktuelles Datum & Aktuelle Zeit
Dies wird die Extraktionszeit, wenn eine Datenzeile gescrapt wird. Beispielerweise können Sie dieses Feld hinzufügen, wenn Sie eine Aufgabenplanung haben, womit diese Aufgabe jeden Tag ausgeführt wird, und Sie das Datum wissen möchten, an dem die Datenzeilen gescrapt werden.
TIPPS:
|
3. Hinzufügen einer „Page-level data“
Page URL: URL der aktuellen Seite
Page titel: Titel der aktuellen Seite, der eine kurze Beschreibung einer Webseite ist und an der Spitze vom Browse-Fenster liegt.
Meta description: Meta-Description-Tag der aktuellen Seite, der eine Sammlung von der Seite enthält.
Meta keyword: Meta-Keyword-Tag der aktuellen Seite
HTML source code: der komplette HTML-Code der aktuellen Seite
4. Hinzufügen eines befestigten Wertes
Mit dieser Option können Sie einen befestigten Wert für jede Datenzeile erstellen.
Sie können Ihren kundenspezifischen Feldernamen einstellen oder aus den „Common Fields“ einen Namen wählen. Dann geben Sie den gefestigten Wert ein, den Sie hinzufügen möchten. (Wenn Sie ein leeres Feld hinzufügen wollen, lassen Sie einfach das Kästchen von „Enter Text“ leer sein.)
5. Hinzufügen ursprünglicher Eingabe-URL
Wenn Sie eine Liste von URLs scrapen, möchten Sie wahrscheinlich die ursprüngliche Eingabe-URL als ein Feld erhalten und mit Ihren Ziel-Daten zusammen extrahieren. Da können Sie sie passen und überprüfen, ob es noch URLs gibt, die nicht gescrapt werden.