È possibile estrarre email o numeri di telefono da siti web?
Con Octoparse puoi estrarre facilmente email e numeri di telefono da pagine web con lo stesso/simile layout. Si può semplicemente fare clic su qualsiasi numero di telefono e selezionare Extract text of the selected element (estrai il testo dell'elemento selezionato).
Che tipo di email o numeri di telefono estrae Octoparse?
Quando Octoparse scrape i dati, in realtà analizza e preleva il contenuto dal codice sorgente. Quindi Octoparse riesce ad acquisire i numeri di telefono in formato testo.
Ad esempio, quando estraiamo "Krishnam Bio-tech", Octoparse cattura effettivamente il testo tra gli attributi <span> cattura il testo qui <span>.
Tuttavia, alcuni siti web potrebbero utilizzare misure anti-scraping e crittografare le e-mail o i numeri di telefono in un'immagine o in altri formati non testuali. (Ma sembra che il formato testo sulla pagina web).
Come posso ottenere i numeri di telefono crittografati con Octoparse?
Ma non preoccuparti, esiste una soluzione comoda alternativa se stai cercando di recuperare numeri di telefono da siti web come Justdial.
I numeri di telefono verranno visualizzati come testo se li scarichiamo da un browser mobile. Ciò significa che, per estrarre dati da questi siti Web, dobbiamo modificare lo User-agent per l'attività.
Andare alle impostazioni dell'attività e modifica le impostazioni UA
Utilizzare Safari iOS per dispositivi mobili per le tue attività su Justdial