Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!
Le recensioni sui prodotti sono un riferimento importante per migliorare le prestazioni dei tuoi prodotti. In questo tutorial, ti presenteremo il metodo di fare lo scraping delle review su Amazon.
Per lo scraping dei prodotti su Amazon, si può semplicemente utilizzare i modelli predefiniti. Tuttavia è possibile farlo da zero da se stesso creando un'attività.
In questo case usiamo questo url di esempio:
I passaggi principali sono mostrati nel menù a destra e si può scaricare il file dell'attività di esempio qui.
1. Go to Web Page: per aprire il sito web di destinazione
Inserire l'URL nella homepage e cliccare su Start
Verrà visualizzato il passaggio Go to Web Page (vai alla pagina web) creato nel flusso di lavoro
Andare alle impostazioni di Go to Web Page ->Options
Spuntare la casella di Use cookie
Cliccare su Use cookie from the current page (utilizza cookie dalla pagina corrente)
Fare clic su Apply per salvare
2. Creare un'azione di Click Item: per vedere tutte le recensioni
Scorrere la pagina verso il basso per trovare il tasto Vedi altre recensioni
Fare clic sul pulsante e scegliere Click URL
3. Rileva automaticamente i dati sulla pagina web: per creare il flusso di lavoro
Fare clic su Auto-detect web page data (rileva automaticamente i dati della pagina web)
Attendere il completamento del rilevamento ->deselezionare Add a page scroll -> Create workflow
4. Impostare il timeout di caricamento AJAX per l'azione Click to Paginate
Cliccare sull'azione Click to Paginate
Modificare il timeout in 10s
Fare clic su Apply
5. Controllare i dati all'anteprima e il flusso di lavoro
Andare all'anteprima dei dati a controllare l'attuale output dei dati. Fare doppio clic sull'intestazione di un campo dati per rinominarlo o cliccare su "..." per cancellare un campo dati.
Ecco il flusso di lavoro finale. Una volta tutto è pronto, si può continuare ad eseguire l'attività.
6. Eseguire l'attività per estrarre i dati
Cliccare su Run in alto a sinistra
Scegliere Run on your device (esegui sul tuo dispositivo) per eseguire l'attività sul tuo computer oppure selezionare Run task in the Cloud (esegui nel cloud) per eseguire l'attività nel Cloud (solo per utenti premium)
Ecco i dati di esempio esportati: