Le tabelle dati sono comuni tra i siti web relativi alla finanza, allo sport, ecc. Questo tutorial ti guiderà su come recuperare i dati delle tabelle.
Se hai imparato come ottenere un elenco di dati, i dati della tabella sono più o meno simili (Estrai una lista). Puoi prendere ogni riga della tabella come un elemento dei dati dell'elenco. Quindi, ciascuna cella della tabella è uguale a un sottoelemento nell'elemento.
Come raccogliere i dati delle tabelle utilizzando Octoparse? Andiamo avanti!
URL di prova: https://money.cnn.com/data/hotstocks/index.html
1. Usare la funzione del rilevamento automatico a costruire il flusso di lavoro
Octoparse supporta il rilevamento automatico della tabella e l'acquisizione di tutte le colonne. Con questa funzione, devi solo
Copiare l'url e incollarlo in Octoparse, quindi cliccare su Start per creare una nuova attività
Fare clic su Auto-detect web page data (rileva automaticamente i dati sulla pagina web) nel pannello dei suggerimenti per creare un flusso di lavoro
Controllare se tutte le celle sono state acquisite e fare clic su Create workflow (crea flusso di lavoro)
SUGGERIMENTO: controlla Lezione 1: Estrarre i dati automaticamente per i dettagli sul rilevamento automatico.
2. Costruire manualmente il flusso di lavoro
Cosa succede se il rilevamento automatico fallisce o non raccoglie i dati completi della tabella? In questo caso, è necessario impostare l'attività manualmente. Ecco i passaggi:
Selezionare la prima cella nella prima riga della tabella, in seguito, fare clic sul tasto Expand the selection (espandi la selezione) finché non seleziona l'intera prima riga
SUGGERIMENTO: si può cliccare su Turn OFF Auto-detection (disattiva il rilevamento automatico) o Cancel Auto-detection (annulla il rilevamento automatico) per disattivare il rilevamento automatico se inizia automaticamente
Sceglie Select all child elements (seleziona tutti gli elementi figlio) nel pannello dei suggerimenti.
Vengono selezionati tutti gli elementi figlio della prima riga, quindi Octoparse trova altri elementi simili evidenziati in rosso.
Scegli Select all similar groups (seleziona tutti i gruppi simili ) sul pannello dei suggerimenti.
Vengono selezionati tutti gli elementi figlio della tabella ed evidenziati in verde.
Clicca su Element data (dati elemento) sul pannello dei suggerimenti.
Modificare i campi dati se necessario (opzionale)
Ora hai tutti i campi dati configurati per l'attività. Puoi perfezionarli nella sezione Anteprima dei dati.
Fare doppio clic sul nome del campo per rinominare i campi dati
Fare clic sul tasto More accanto al nome del campo per ulteriori azioni