Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!
eBay è una società multinazionale di e-commerce con sede negli Stati Uniti, che facilita le vendite consumer-to-consumer e business-to-consumer attraverso il suo sito web. È una delle piattaforme di e-commerce più famose e utilizzate a livello mondiale.
Il tutorial ti introdurrà come estrarre gli URL delle immagini dalla pagina dei dettagli dei prodotto su eBay.
Per proseguire, potresti voler utilizzare l'URL seguente:
I passaggi principali sono mostrati nel menu a destra e puoi scaricare il file dell'attività di esempio qui.
1. Creare un'azione Go To Web Page: per aprire la pagina web di destinazione
Inserire l'URL di destinazione nella homepage di Octoparse e fare clic su Start
2. Creare un loop di impaginazione: per estrarre dati da più pagine di elenchi
Scorrere fino alla fine della pagina web
Fare clic sul tasto di Avanti (->)
Cliccare su Loop click sul pannello dei suggerimenti
Impostare il tempo di caricamento AJAX: è consigliato fra 7 e 10 secondi
Nota: scopri di più su AJAX e come se lo risolve in Octoparse qui.
3. Creare uno scorrimento di pagina - per caricare completamente i dati su ciascuna pagina
Fare clic sul tasto Add Step (+) nel flusso di lavoro > Loop
Impostare la modalità di loo a Scroll Page (Scorri la pagina)
Spuntare Scroll for one screen (scorri per una schermata)
Inserire 15 per le volte di ripetizione
Cliccare su Apply
4. Creare un'azione di Elementi in loop: per cliccare in loop sul link di ciascun prodotto e accedere alla pagina dei dettagli
Fare clic sul nome del primo prodotto
Cliccare su Select all similar elements (seleziona tutti gli elementi simili) sul pannello dei suggerimenti
Scegliere Loop click each element (clicca in loop su ogni elemento)
Cliccare su No
Fare clic su Loop Item 1
Impostare la Loop Mode come Variable List
Inserire l'XPath corrispondente: //ul[@class="b-list__items_nofooter srp-results srp-grid"]/li//a[@class="s-item__link"]
Cliccare su Apply per salvare i cambiamenti
5. Estrarre i dati: per raccogliere gli URL delle immagini
Cliccare sulla prima immagine nella barra laterale
Fare clic su Select all similar elements sul pannello dei suggerimenti
Cliccare su Text
Cliccare su Loop Item 2
Impostare la Loop Mode come Variable List
Inserire l'XPath corrispondente: //div[@class='ux-image-filmstrip-carousel']/button/img
Cliccare su Apply per salvare i cambiamenti
Fare clic sul tasto di Altro accanto al campo dati
Scegliere Customize field
Selezionare Select image URL(src attribute)
Scegliere Merge multiple rows of data into one (unisci più righe di dati in una sola)
Nota: Unire più righe di dati in una ti aiuta a ottenere tutte le immagini di un prodotto in un'unica cella. Se vuoi raggrupparli in righe diverse, non è necessario spuntarlo. Per suddividere le immagini in colonne diverse, puoi fare riferimento a Acquisire immagini da un carosello
6. Eseguire l'attività: per ottenere i dati target
Fare clic su Save in alto a destra per salvare l'attività
Cliccare su Run e attendere che venga visualizzata la finestra di esecuzione dell'attività
Scegliere Run on your device (esegui sul tuo dispositivo) per eseguire l'attività sul tuo dispositivo locale
Attendere il completamento dell'attività
Ecco i dati di esempio esportati da un'esecuzione locale: