Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!
In questo tutorial, ti mostreremo come estrarre informazioni sugli hotel su Booking.com.
Inoltre, puoi andare al Catalogo dei modelli sia nella schermata principale del software Octoparse o sul nostro sito e iniziare direttamente con il modello pre-costruito per Booking.com per risparmiare tempo. Con questa funzionalità, non c'è bisogno di configurare le attività di scraping.
Se vuoi sapere come creare l'attività da zero, puoi continuare a leggere il seguente tutorial.
Effettueremo lo scraping di dati quali nomi di hotel, immagini, indirizzi, descrizioni, punteggi, recensioni e valutazioni a stelle con Octoparse.
[Scarica l'attività demo qui]
1. Vai alla pagina: per aprire il sito web di destinazione
Inserire l'URL nella homepage e cliccare su Inizia
2. Rileva automaticamente la pagina web: per creare il flusso di lavoro
Fare clic su Rileva automaticamente i dati della pagina web e attendere il completamento del rilevamento
Fare clic su Crea flusso di lavoro
Regola l'ordine dei campi come preferisci
Elimina o rinomina i campi dati
È piuttosto comodo eliminare i campi che non vuoi insieme dopo il rilevamento automatico.
Fai clic sull'icona della vista verticale per passare alla vista verticale per eliminare e rinominare i campi. Nota che devi fare doppio clic sul nome del campo per rinominarlo.
Se desideri cliccare su ciascun link della pagina dei dettagli per ottenere maggiori informazioni, segui i passaggi successivi.
3. Fare clic sul link di ogni hotel: per ottenere ulteriori informazioni
Fai clic su Seleziona URL delle sottopagine sul pannello dei suggerimenti
Seleziona Clicca su un campo dati estratto e scegli quello su cui vuoi cliccare dal menu a discesa (puoi confermare se è il link corretto nell'anteprima dei dati)
Clicca su Conferma
4. Estrai dati: per estrarre i dati dalle pagine dei dettagli
Se c'è un pop-up, attiva la modalità di navigazione per chiuderlo manualmente. Quindi disattivalo.
Seleziona le informazioni che vuoi sulla pagina web e fai clic su Dati dell'elemento
5. Impostare un tempo di attesa: per rallentare lo scraping
Booking potrebbe bloccare il tuo IP se esegui uno scraping eccessivo, pertanto dobbiamo controllare la velocità di scraping.
Fai clic su Estrai dati1
Vai a Opzioni
Seleziona Attendi prima dell'azione
Imposta il tempo su 5-10 secondi
Fai clic su Applica
6. Eseguire l'estrazione
Fai clic su Salva ed Esegui in alto a destra
Selezionare Esegui sul tuo dispositivo per eseguire l'attività sul tuo computer oppure scegliere Esegui nel Cloud per eseguirla sui nostri server cloud (solo per utenti premium)
Ecco un esempio dell'output: