Vai al contenuto principale

Come estrarre i rating stelle

Aggiornato oltre 2 settimane fa

Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!

A volte non possiamo estrarre direttamente la valutazione allo stesso modo in cui raccogliamo altre informazioni in formato di testo, ad sempio, il titolo della pagina. Nel caso qui sotto, le informazioni sulla valutazione sono memorizzate nel valore dell'attributo "alt" all'interno dell'elemento "img". In questo tutorial, ti presenterà come estrarre questo tipo di informazioni sulla valutazione a stelle dalle pagine web.

Ci sono due modi per ottenere le informazioni sulla valutazione a stelle.


Estrarre attributi dal codice sorgente

✅ La migliore scelta per

scraping semplice di rating da alt, src, o altri attributi.

Passaggi:

1. Selezionare l'area di valutazione sulla pagina web e scegliere Image URL (URL dell'immagine) sul pannello dei suggerimenti. Si può anche scegliere OuterHtml qui.

2. Fare clic sull'azione Estrai dati e clicca sull'icona "...". Quindi scegliere il Personalizza il campo.

3. Scegliere Seleziona altri attributi. Selezionare alt o src.

4. Il risultato verrà visualizzato nel campo.


Estrarre e pulire il codice HTML usando RegEx

✅ La migliore scelta per

Casi complessi in cui le valutazioni sono nascoste nell'HTML.

Passaggi:

1. Selezionare l'area di valutazione sulla pagina web e fare clic su OuterHtml.

2. Cliccare su Estrai dati e clicca sull'icona "...". Quindi scegli Pulisci dati.

3. Dopodiché, fare clic su Aggiungi un passaggio e poi Corrispondenza con espressione regolare.

4. Se conosci come funzionare l'espressione regolare (RegEx), puoi inserire la formula direttamente nella casella dell'espressione regolare. Se non sei familiare con esso, clicca su "Prova lo strumento RegEx!".

  • Per ogni stringa di test, evidenzia manualmente solo il testo che desideri.

  • Fai clic su Genera. L'IA analizzerà i tuoi esempi e proporrà un pattern RegEx.

  • Fai clic su Prova per verificare che il pattern funzioni con tutti i tuoi campioni.

  • Fai clic su Applica e salva, assegna un nome al pattern e conferma.

Hai ricevuto la risposta alla tua domanda?