Vai al contenuto principale

Lezione 5: Acquisire i dati desiderati

Aggiornato più di un anno fa

Ora che hai costruito ed esaminato completamente la tua prima attività di web scraping, è possibile andare avanti ed eseguirla per estrarre i dati reali.


1. Due metodi di acquisitzione dati

Esistono due metodi con cui si può eseguire l'attività:

  • Esegui sul tuo dispositivo (noto anche come estrazione locale o esecuzione locale)

  • Esegui nel cloud (noto anche come estrazione nel cloud o esecuzione nel cloud)

Se esegui un'attività sul tuo dispositivo, dovrai avere l'app Octoparse aperta durante il processo di estrazione. Sul tuo PC sarà in esecuzione una finestra di estrazione in cui potrai osservare l'estrazione dei dati e attendere il completamento.

D'altra parte, se scegli di eseguire un'attività nel cloud, l'attività verrà eseguita sulla piattaforma cloud Octoparse, il che significa che puoi chiudere l'app Octoparse o anche il tuo computer durante il processo. Si può tornare a recuperare i tuoi dati una volta terminato il lavoro. Le attività in esecuzione nel cloud generalmente vengono eseguite da 4 a 12 volte più velocemente rispetto alle estrazioni locali. A seconda dei requisiti del tuo progetto, puoi sempre scegliere un piano adatto a te.

Suggerimento: Per alcune attività esistono due modalità di estrazione sia per l'esecuzione locale che per quella nel cloud, cioè la Modalità standard e la Modalità d'accelerazione. Puoi scoprire la differenza tra le due modalità. Modalità Standard e Modalità d'accelerazione


2. Iniziare un'esecuzione

Una volta terminata la creazione di un'attività, puoi fare clic sul pulsante "Run" (esegui) per avviare un'esecuzione.

In alternativa, puoi anche accedere all'attività sulla Dashboard e utilizzare i pulsanti Run/Stop (esegui/interrompi) per eseguire/interrompere un'attività.


3. Controllare i dati

Ora che l'esecuzione è terminata, si può andare avanti e controllare i dati.

Vai alla Dashboard per trovare la tua attività. Passa il mouse sopra il numero di righe raschiate e facci clic per verificare i dati estratti dall'ultima esecuzione. Clicca su All Data (tutti i dati) per verificare i dati estratti da tutte le esecuzioni.

È possibile controllare tutti i dati anche facendo clic su l'icona ... sulla Dashboard, selezionando View data (vedi dati) e scegliendo se vuoi vedere i dati sul cloud o i dati locali.

check_data.jpg


4. Esportare i dati

Se i dati sembrano a posto, puoi esportarli direttamente facendo clic su Export Data (esporta dati) nell'angolo in basso a destra della scheda visualizzazione dati. Octoparse supporta l'esportazione di dati in file Excel, CSV o HTML o in un database o Fogli Google.

SUGGERIMENTI:

  • È possibile accedere ai dati estratti nel cloud su qualsiasi dispositivo purché si acceda al proprio account.

  • I dati nel cloud vengono salvati solo per 3 mesi, dopodiché verranno rimossi dai server cloud. Ricordati di esportare i dati prima che vengano rimossi.

  • Si può accedere ai dati locali solo sul dispositivo in cui è stata eseguita l'estrazione locale.

  • I dati nel cloud di un'attività verranno archiviati insieme per rimuovere i duplicati. Se esegui la stessa attività per la seconda volta, probabilmente vedrai dei duplicati eliminati alla seconda esecuzione.

  • I duplicati nel cloud verrà rimossi automaticamente.

DOMANDE FREQUENTI:


Hai ricevuto la risposta alla tua domanda?