Vai al contenuto principale

Estrazione di dati da una tabella

Aggiornato più di un anno fa

Le tabelle dati sono comuni tra i siti web relativi alla finanza, allo sport, ecc. Questo tutorial ti guiderà su come recuperare i dati delle tabelle.

Se hai imparato come ottenere un elenco di dati, i dati della tabella sono più o meno simili (Estrai una lista). Puoi prendere ogni riga della tabella come un elemento dei dati dell'elenco. Quindi, ciascuna cella della tabella è uguale a un sottoelemento nell'elemento.

Come raccogliere i dati delle tabelle utilizzando Octoparse? Andiamo avanti!


1. Usare la funzione del rilevamento automatico a costruire il flusso di lavoro

Octoparse supporta il rilevamento automatico della tabella e l'acquisizione di tutte le colonne. Con questa funzione, devi solo

  • Copiare l'url e incollarlo in Octoparse, quindi cliccare su Start per creare una nuova attività

  • Fare clic su Auto-detect web page data (rileva automaticamente i dati sulla pagina web) nel pannello dei suggerimenti per creare un flusso di lavoro

  • Controllare se tutte le celle sono state acquisite e fare clic su Create workflow (crea flusso di lavoro)

SUGGERIMENTO: controlla Lezione 1: Estrarre i dati automaticamente per i dettagli sul rilevamento automatico.


2. Costruire manualmente il flusso di lavoro

Cosa succede se il rilevamento automatico fallisce o non raccoglie i dati completi della tabella? In questo caso, è necessario impostare l'attività manualmente. Ecco i passaggi:

  • Selezionare la prima cella nella prima riga della tabella, in seguito, fare clic sul tasto Expand the selection (espandi la selezione) finché non seleziona l'intera prima riga

SUGGERIMENTO: si può cliccare su Turn OFF Auto-detection (disattiva il rilevamento automatico) o Cancel Auto-detection (annulla il rilevamento automatico) per disattivare il rilevamento automatico se inizia automaticamente

  • Sceglie Select all child elements (seleziona tutti gli elementi figlio) nel pannello dei suggerimenti.

Vengono selezionati tutti gli elementi figlio della prima riga, quindi Octoparse trova altri elementi simili evidenziati in rosso.

  • Scegli Select all similar groups (seleziona tutti i gruppi simili ) sul pannello dei suggerimenti.

Vengono selezionati tutti gli elementi figlio della tabella ed evidenziati in verde.

green.png

  • Clicca su Element data (dati elemento) sul pannello dei suggerimenti.

  • Modificare i campi dati se necessario (opzionale)

Ora hai tutti i campi dati configurati per l'attività. Puoi perfezionarli nella sezione Anteprima dei dati.

  • Fare doppio clic sul nome del campo per rinominare i campi dati

  • Fare clic sul tasto More accanto al nome del campo per ulteriori azioni

Hai ricevuto la risposta alla tua domanda?