A volte abbiamo bisogno di estrarre l’URL di un’immagine da un sito web, ma tutto ciò che otteniamo è solo l’URL di una miniatura (thumbnail) invece di un’immagine a grandezza normale.
Ecco, ad esempio, un’immagine estratta da Amazon. Come si può vedere, l’immagine è troppo piccola per essere visualizzata correttamente.
Per ottenere le immagini a dimensione normale, è sufficiente modificare l’URL dell’immagine che abbiamo già, seguendo i passaggi qui sotto:
Se desidera sapere prima come estrarre gli URL delle immagini, può consultare questo tutorial: Come estrarre immagini da un carosello
1. Osservare la differenza tra l’URL dell’immagine intera e quello della miniatura
Gli URL di immagini con dimensioni diverse di solito differiscono solo in minima parte. Occorre quindi individuare la differenza tra l’URL dell’immagine intera e quello della miniatura.
Per esempio, la miniatura su Amazon ha questo URL:
L’URL dell’immagine intera invece è:
Come può notare, l’URL della miniatura contiene la stringa ‘SR38,50’. Basta eliminarla per ottenere l’immagine a dimensione normale.
In altri casi, può capitare di vedere un numero che indica la dimensione dell’immagine, ad esempio width=208:
Provi a sostituire width=416 con width=1100 per verificare se l’URL funziona:
2. Utilizzare la funzione Pulisci dati di Octoparse per riformattare l’URL della miniatura
Clicchi sul pulsante Altro (...) e poi su Pulisci dati.
Aggiunga un’operazione di tipo Sostituisci.
Inserisca il valore da sostituire nel campo Sostituisci (es. ._AC_US100_)
Inserisca nel campo Con il valore con cui vuole sostituirlo.
Nel caso dell’URL di Amazon, bisogna eliminare la stringa ._AC_US100_, quindi lasci il campo Con vuoto.
Clicchi su Conferma per salvare.
Clicchi su Applica per applicare le impostazioni.
A questo punto, otterrà l’URL completo dell’immagine tra i risultati finali.