Vai al contenuto principale

Lezione 0: Scoprire Octoparse

Aggiornato più di un anno fa

Benvenuti nella nuovissima versione Octoparse 8.5! Ci sono alcuni aggiornamenti importanti in questa ultima versione, quindi stiamo mettendo insieme una nuova serie di corsi per aiutarti a cogliere le nuove funzionalità e i miglioramenti del software.

Seguire tutte le lezioni introduttive ti aiuterà a comprendere a fondo Octoparse 8.5. Sarai in grado di estrarre dati dalla maggior parte dei siti web con Octoparse. Per leggere tutte le lezioni ci vorranno dai 30 ai 60 minuti circa. Divertiti!


1. Interfaccia

Non appena accedi a Octoparse, troverai due sezioni principali: la schermata home (Home screen) e la barra laterale (Sidebar).

1.1 Schermata home

Nella parte superiore della pagina è presente una barra di ricerca in cui è possibile inserire gli URL della pagina web di destinazione per iniziare a creare un'attività.

Oppure si può anche inserire il nome di un modello (ad esempio, Amazon o eBay) per cercare un modello di scraping predefinito.

È possibile accedere ad alcuni dei modelli e tutorial più popolari nella homepage.

C'è un pulsante di supporto nell'angolo in basso a destra. Puoi cercare un tutorial o avviare una breve chat con il team di supporto Octoparse per qualsiasi assistenza necessaria.

1.2 La barra laterale

Il menù nella barra laterale a sinistra contiene tutti che vuoi per navigare a Octoparse.

  • + Nuovo: creare/importare una nuova attività o creare nuovi gruppi di attività.

  • Dashboard: dove si può trovare tutte le attività di scraping. È possibile modificare, eliminare, rinominare e organizzare tutte le attività nel tuo account. Puoi anche eseguire, fermare o pianificare qualsiasi attività facilmente.

  • Modelli: dove si può trovare tutti i modelli disponibili.

1.3 Area di lavoro

Nell'area di lavoro di Octoparse puoi creare le attività. Contiene 5 parti principali e ciascuna parte serve al suo scopo particolare.

  • Navigatore integrato: una volta inserito l'url di una pagina web di destinazione, la pagina web verrà caricata nel browser integrato di Octoparse. È possibile navigare nel sito web in modalità Navigazione o fare clic per estrarre i dati necessari in modalità seleziona.

  • Suggerimenti: Octoparse utilizza i Suggerimenti intelligenti per parlarti durante l'estrazione, per guidarti attraverso il processo di creazione delle attività.

  • Flusso di lavoro: mentre procedi con l'interazione con la pagina web, ad esempio aprire una pagina web o cliccare su un elemento/pulsante della pagina, l'intero processo viene definito automaticamente sotto forma di flusso di lavoro.

  • Impostazioni: le opzioni di impostazione per le azioni nel flusso di lavoro verranno visualizzate dopo aver selezionato un'azione.

  • Anteprima dei dati: ti offre un'anteprima dei dati selezionati. Puoi anche rinominare i campi di dati o rimuovere quelli che non sono necessari.


2. Caratteristiche principali

I modelli di attività sono attività predefinite che consentono agli utenti di ottenere dati inserendo parametri semplici come URL o parole chiave. Attualmente esistono oltre 100 modelli per la maggior parte dei siti web popolari. Non è necessario costruire nulla e non sono richieste competenze tecniche. Seleziona semplicemente il modello che ti serve, controlla i dati di esempio per vedere se ottiene ciò di cui hai bisogno ed estrai subito i dati!

2.2 Raccogliere i dati con modalità avanzata

Contrariamente ai modelli di attività in cui tutto è già preimpostato, la modalità avanzata Octoparse è una modalità di scraping altamente flessibile e potente che ti permette di costruire un'attività di scraping personalizzata in base alle tue esigenze specifiche. L'attività personalizzata è sufficientemente abile da poter estrarre dati dalle pagine web complicate, come pagine con JavaScript, AJAX o qualsiasi sito web dinamico.

Costruire le tue attività di scraping con attività personalizzate non deve essere complicato o intimidatorio. Con il nuovo algoritmo di rilevamento automatico, Octoparse rileva automaticamente gli elementi su una pagina e genera impostazioni di attività consigliate come estrarre l'elenco e passare alla pagina successiva.

Oltre ai dati rilevati automaticamente, è sempre possibile modificare manualmente le impostazioni dell'attività o creare un'attività da zero saltando il rilevamento automatico.

Se sei soddisfato dei dati rilevati automaticamente, basta salvare le impostazioni e Octoparse genererà automaticamente il flusso di lavoro dell'attività per te. Puoi aggiungere passaggi aggiuntivi al flusso di lavoro o modificare le azioni manualmente, se necessario.

Octoparse offre una piattaforma cloud potente per utenti premium (piano standard e superiori) per eseguire le loto attività 24 ore su 24, 7 giorni su 7. Se si esegue un'attività con Estrazione nel cloud, viene eseguita nel cloud con più server utilizzando i nostri IP e si può chiudere l'app o il computer mentre l'attività è in esecuzione. Non è necessario preoccuparsi delle limitazioni di hardware.

I dati estratti verranno salvati nel cloud e sarà possibile accedervi in qualsiasi momento. Funzionalità avanzate come la rotazione IP automatica, la pianificazione delle attività, l'accelerazione dell'estrazione e l'API Octoparse fanno tutte parte del servizio cloud di Octoparse.


Hai ricevuto la risposta alla tua domanda?