Vai al contenuto principale

Come estrarre risultati di ricerca di Bing

Aggiornato oltre 11 mesi fa

Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!

Bing è uno dei motori di ricerca più popolari al mondo. In questo tutorial, ti mostreremo come ottenere informazioni sui risultati di ricerca di Bing.com.

Avresti bisogno di un link di esempio per seguire i passaggi della guida:

Estrarremo dati come titoli, URL e descrizione dai risultati di ricerca utilizzando Octoparse.


1. Vai alla pagina: per aprire la pagina web di destinazione

  • Inserire l'URL di destinazione nella homepage di Octoparse e fare clic su Inizia


2. Estrarre certi elementi da ogni pagina web

Cominciamo con il secondo oggetto non sponsarizzato nella pagina dei risultati di ricerca

  • Cliccare sul titolo dell'articolo

  • Fare clic su Seleziona tutti gli elementi simili sul pannello dei suggerimenti

  • Scegliere Testo


3. Creare l'impaginazione per fare lo scraping su diverse pagine

  • Fare clic su Next page button sul pannello dei suggerimenti

  • Scorrere verso il basso e cliccare sul tasto ">"

  • Impostare il timeout per AJAX come 5 secondi e confermare le impostazioni

Arrivato a questo passaggio, il flusso di lavoro sarebbe:


4. Continuare ad estrarre gli elementi necessari

  • Cliccare sul titolo dello stesso oggetto

  • Questa volta scegliere Link sul pannello dei suggerimenti per estrarre i link

  • Se è necessario ottenere anche le descrizioni, fare semplicemente clic sul testo e selezionare Text

  • È possibile anche aggiungere alcuni campi dati predefiniti cliccando l'icona "+". In questo esempio vorrei visualizzare gli orari dell'estrazine, quindi scelgo Data e orario attuali

  • Fare doppio clic sull'intestazione di un campo dati per rinominarlo se necessario


5. Modificare gli XPath per individuare precisamente i dati

Possiamo trovare che esistono dei dati estratti non corretti, in questo caso, abbiamo bisogno di correggere i loro XPath.

  • Cliccare sulla finestrina di Elementi in loop e incollare nella casella di XPath: //li[@class='b_algo']

Anche gli XPath per i campi dati devono essere modificati.

  • Passare dall'anteprima dei dati alla vista verticale

  • Modificare l'XPath dei campi come segue

Titolo: //h2

Titolo URL: //h2/a

Descrizione: //p

Ci sono alcuni tutorial relativi i quali ti potrebbero servire:


6. Eseguire l'estrazione

  • Fai clic su Salva ed Esegui in alto a destra

  • Selezionare Esegui sul tuo dispositivo per eseguire l'attività sul tuo computer oppure scegliere Esegui nel Cloud per eseguirla sui nostri server cloud (solo per utenti premium)

Ecco i dati di esempio estratti, i quali possono essere esportati nei formati Excel, CSV, HTML e JSON.

Hai ricevuto la risposta alla tua domanda?