Quando estraiamo informazioni dai siti web, spesso ci aspettiamo di ottenere dati non solo dalla pagina dei risultati di ricerca (solitamente una pagina di elenco), ma anche dalla pagina dei dettagli di ciascun prodotto.
Se non sai come raggiungere questo obiettivo con Octoparse, puoi consultare questo tutorial: Scraping di dati da pagine di elenco e di dettaglio.
In alcuni casi, tuttavia, quando la pagina dei dettagli non può essere aperta in una nuova scheda, Octoparse non riesce a tornare alla pagina di elenco per raccogliere i dettagli successivi. Se non riusciamo a individuare un pulsante ritorno alla pagina precedente sulle pagine dei dettagli, dovremo separare l'attività in due parti. Altrimenti, si rischia che il task si interrompe dopo ottenuta solo la prima riga di dati.
Questo tutorial ti mostrerà come gestire questo problema con la nuova funzione Go Back to the previous in Octoparse.
Per seguire questo tutorial, puoi usare l'URL qui sotto:
https://www.thombrowne.com/it/shopping?categories=137010|137061|136744|136373|136322|136683&originalquery=SUNGLASS
Supponiamo che tu abbia già impostato un loop per cliccare sulla pagina dei dettagli dalla pagina dell'elenco.
Per iniziare, devi assicurarti che la pagina corrente nel browser Octoparse sia la pagina dei dettagli e non la pagina dell'elenco.
Fare clic sul pulsante Aggiungi passaggio per aggiungere un passaggio al flusso di lavoro
Seleziona Torna alla pagina precedente nel menu a discesa
E nel flusso di lavoro verrà presentata un'azione Torna alla pagina precedente:
NOTA: Per verificare se questo passaggio funziona correttamente, puoi semplicemente cliccare sulla casella Torna alla pagina precedente, che ti reindirizzerà automaticamente alla pagina dell'elenco. L'opzione nuova scheda per l'azione di Clicca l'elemento deve essere deselezionata.
Ecco un esempio di dati estratti. I formati Excel, CSV, HTML e JSON sono disponibili per l'esportazione.