Vai al contenuto principale

Quali tipi di siti Web o dati possono essere estrapolati usando Octoparse?

Aggiornato più di un anno fa

Octoparse supporta lo scraping del 98% di tutti i siti Web, compresi quelli con AJAX, script JAVA e altri siti Web dinamici. È anche facile interagire con moduli, elenchi a discesa, scorrimento infinito e molto altro in Octoparse.

Come regola generale, tutti i dati/informazioni che possono essere copiati e incollati da qualsiasi sito Web possono essere recuperati utilizzando Octoparse. Più specificamente, se i dati di destinazione si trovano nel codice sorgente HTML del sito Web (anche se non visibili sulla pagina Web), possono essere recuperati utilizzando Octoparse.


1. Elementi visibili sulla pagina web:

  • Testo

  • URL delle immagini

  • Link (URL)

  • innerHTML e outerHTML

  • Valore dell'attributo

Per maggiori informazione controlla questa guida: Estrazione degli attributi di un elemento web (testo, URL, HTML, ecc.)


2. Qualsiasi informazione nascosto nel codice sorgente:

  • URL della pagina

  • Titolo della pagina

  • Metadato

  • Codice sorgente HTML

  • Tempo attuale

Scopri di più:


3. Quali tipi di siti Web non sono scansionabili da Octoparse?

Attualmente, non è possibile per Octoparse a scrappare dati da:

  • Sitemap XML

  • File PDF


Se ritieni che l'estrazione di dati da siti Web complessi richieda molto tempo o desideri semplicemente concentrarti sulla gestione della tua attività al massimo delle sue potenzialità, non esitare a contattarci per il nostro servizio dati.

Hai ricevuto la risposta alla tua domanda?