Octoparse supporta lo scraping del 98% di tutti i siti Web, compresi quelli con AJAX, script JAVA e altri siti Web dinamici. È anche facile interagire con moduli, elenchi a discesa, scorrimento infinito e molto altro in Octoparse.
Come regola generale, tutti i dati/informazioni che possono essere copiati e incollati da qualsiasi sito Web possono essere recuperati utilizzando Octoparse. Più specificamente, se i dati di destinazione si trovano nel codice sorgente HTML del sito Web (anche se non visibili sulla pagina Web), possono essere recuperati utilizzando Octoparse.
1. Elementi visibili sulla pagina web:
Testo
URL delle immagini
Link (URL)
innerHTML e outerHTML
Valore dell'attributo
Per maggiori informazione controlla questa guida: Estrazione degli attributi di un elemento web (testo, URL, HTML, ecc.)
2. Qualsiasi informazione nascosto nel codice sorgente:
URL della pagina
Titolo della pagina
Metadato
Codice sorgente HTML
Tempo attuale
Scopri di più:
3. Quali tipi di siti Web non sono scansionabili da Octoparse?
Attualmente, non è possibile per Octoparse a scrappare dati da:
Sitemap XML
File PDF
Se ritieni che l'estrazione di dati da siti Web complessi richieda molto tempo o desideri semplicemente concentrarti sulla gestione della tua attività al massimo delle sue potenzialità, non esitare a contattarci per il nostro servizio dati.