Vai al contenuto principale

Come estrarre i rating stelle

Aggiornato oggi

Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!

A volte non possiamo estrarre direttamente la valutazione allo stesso modo in cui raccogliamo altre informazioni in formato di testo, ad sempio, il titolo della pagina. Nel caso qui sotto, le informazioni sulla valutazione sono memorizzate nel valore dell'attributo "alt" all'interno dell'elemento "img". In questo tutorial, ti presenterà come estrarre questo tipo di informazioni sulla valutazione a stelle dalle pagine web.

Ci sono due modi per ottenere le informazioni sulla valutazione a stelle.


Estrarre attributi dal codice sorgente

✅ La migliore scelta per

scraping semplice di rating da alt, src, o altri attributi.

Passaggi:

1. Selezionare l'area di valutazione sulla pagina web e scegliere Image URL (URL dell'immagine) sul pannello dei suggerimenti. Si può anche scegliere OuterHtml qui.

2. Fare clic sull'azione Estrai dati e clicca sull'icona "...". Quindi scegliere il Personalizza il campo.

3. Scegliere Seleziona altri attributi. Selezionare alt o src.

4. Il risultato verrà visualizzato nel campo.


Estrarre e pulire il codice HTML usando RegEx

2.1 Selezionare l'area di valutazione sulla pagina web e fare clic su OuterHtml.

2.2 Cliccare su Extract Data e clicca sull'icona "...". Quindi scegli Clean data (pulisci dati).

2.3 Dopodiché, fare clic su Add Step (aggiungi passaggio) e poi Match with Regular Expression (scegli Corrispondenza con espressione regolare).

2.4 Se conosci come funzionare l'espressione regolare (RegEx), puoi inserire la formula direttamente nella casella dell'espressione regolare. Se non sei familiare con esso, clicca su "Not sure about RegEx? Try the RegEx tool!".

2.5 Cliccare su Start with e poi inserire la parte della stringa che precede le informazioni effettive di cui abbiamo bisogno. Poi, fare clic su End with e immettere la parte della stringa che segue le informazioni effettive desiderate.

Dopo di che, cliccare su Match per vedere se le informazioni corrispondenti sono quelle che vuoi. Poi fare clic su Apply.

2.6 Tornare alle impostazioni e confermalo.

2.7 Pronte tutte le impostazioni, cliccare su Apply per salvare.

Hai ricevuto la risposta alla tua domanda?