Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!
Bing è uno dei motori di ricerca più popolari al mondo. In questo tutorial, ti mostreremo come ottenere informazioni sui risultati di ricerca di Bing.com.
Avresti bisogno di un link di esempio per seguire i passaggi della guida:
Estrarremo dati come titoli, URL e descrizione dai risultati di ricerca utilizzando Octoparse.
1. Vai alla pagina: per aprire la pagina web di destinazione
Inserire l'URL di destinazione nella homepage di Octoparse e fare clic su Inizia
2. Estrarre certi elementi da ogni pagina web
Cominciamo con il secondo oggetto non sponsarizzato nella pagina dei risultati di ricerca
Cliccare sul titolo dell'articolo
Fare clic su Seleziona tutti gli elementi simili sul pannello dei suggerimenti
Scegliere Testo
3. Creare l'impaginazione per fare lo scraping su diverse pagine
Fare clic su Next page button sul pannello dei suggerimenti
Scorrere verso il basso e cliccare sul tasto ">"
Impostare il timeout per AJAX come 5 secondi e confermare le impostazioni
Arrivato a questo passaggio, il flusso di lavoro sarebbe:
4. Continuare ad estrarre gli elementi necessari
Cliccare sul titolo dello stesso oggetto
Questa volta scegliere Link sul pannello dei suggerimenti per estrarre i link
Se è necessario ottenere anche le descrizioni, fare semplicemente clic sul testo e selezionare Text
È possibile anche aggiungere alcuni campi dati predefiniti cliccando l'icona "+". In questo esempio vorrei visualizzare gli orari dell'estrazine, quindi scelgo Data e orario attuali
Fare doppio clic sull'intestazione di un campo dati per rinominarlo se necessario
5. Modificare gli XPath per individuare precisamente i dati
Possiamo trovare che esistono dei dati estratti non corretti, in questo caso, abbiamo bisogno di correggere i loro XPath.
Cliccare sulla finestrina di Elementi in loop e incollare nella casella di XPath: //li[@class='b_algo']
Anche gli XPath per i campi dati devono essere modificati.
Passare dall'anteprima dei dati alla vista verticale
Modificare l'XPath dei campi come segue
Titolo: //h2
Titolo URL: //h2/a
Descrizione: //p
Ci sono alcuni tutorial relativi i quali ti potrebbero servire:
6. Eseguire l'estrazione
Fai clic su Salva ed Esegui in alto a destra
Selezionare Esegui sul tuo dispositivo per eseguire l'attività sul tuo computer oppure scegliere Esegui nel Cloud per eseguirla sui nostri server cloud (solo per utenti premium)
Ecco i dati di esempio estratti, i quali possono essere esportati nei formati Excel, CSV, HTML e JSON.