Immobiliare.it, uno dei portali immobiliari principali in Italia, è il leader per la pubblicazione e la ricerca di annunci immobiliari, per cui costruisce una miniera d'oro di dati di immobili per investitori, venditori e agenzie di proprietà. Con il presente tutorial ti mostreremo come raccogliere facilmente le informazioni su Immobiliare.it.
Per risparmiare il tempo, puoi sempre andare alla Templates Gallery a utilizzare i modelli predefiniti di scraping di Immobiliare.it per ottenere velocemente i dati immobiliare con pochi clic. Per ulteriori dettagli, verificalo qui: Modelli
È possibile anche costruire un'attività di scraping da se stesso in modo da adattarla meglio alle tue esigenze. I principali passaggi sono visualizzati nel menù alla destra.
Potrebbe essere necessario il link di esempio per seguire i passaggi:
1. Vai alla pagina: per aprire il sito web di destinazione
Inserire l'URL nella homepage e cliccare su Inizia
2. Rilevamento automatico: per creare il flusso di lavoro
Fare clic su Rileva automaticamente i dati sulla pagina web e attendere il completamento del rilevamento
Cliccare su Controlla sotto Impagina per scansionare più pagine e si può trovare che non viene rilevato il tasto di pagina successiva corretto
Fare clic su Modifica accanto e selezionare quello giusto ">"
Deselezionare la casella Aggiungi scorrimentI di pagina
Fare clic su Crea flusso di lavoro
Un'azione Impaginazione e Elementi in loop verrebbero generati automaticamente nel flusso di lavoro.
Fare clic su Altro e poi Elimina il campo per cancellare i dati indesiderati
Fare doppio clic sull'intestazione dei campi dati che vuoi per rinominarli
Se tutti i dati di cui hai bisogno possono essere estratti dalla pagina della lista, puoi fermarti qui e passare a impostare il limite di tempo per il caricamento AJAX per l'azione Click to Paginate. Se desideri accedere alla pagina dei dettagli di ciascun prodotto per ottenere maggiori informazioni, procedi nei seguenti passaggi.
3. Fare clic sul link di ogni prodotto: per ottenere ulteriori informazioni
Cliccare sul primo elemento nella pagina e scegliere Fai clic su URL sul pannello dei suggerimenti
Arrivato a questo passaggio, il flusso di lavoro dovrebbe assomigliare a:
4. Estrai dati: per estrarre i dati dalle pagine dei dettagli
Selezionare le informazioni che vuoi sulla pagina web
Scegliere Testo
Ripetere i passaggi precedenti per estrarre tutti i dati necessari
5. Impostare il timeout di caricamento AJAX per l'azione Clicca per paginare
Fare clic per aprire le impostazioni dell'azione Clicca per paginare
Andare su Opzioni
Spuntare la casella Carica con AJAX e selezionare 10 come timeout AJAX
6. Eseguire l'estrazione
Fai clic su Salva ed Esegui in alto a destra
Selezionare Esegui sul tuo dispositivo per eseguire l'attività sul tuo computer oppure scegliere Esegui nel Cloud per eseguirla sui nostri server cloud (solo per utenti premium)
Ecco una parte dei dati di esempio esportati: