Vai al contenuto principale

Perché l'attività aspetta a lungo prima dell'estrazione della seconda pagina?

Aggiornato più di un anno fa

Se occorre molto tempo prima che Octoparse sia in grado di passare all'azione successiva nel flusso di lavoro o se rimani bloccato facendo clic sul pulsante "Pagina successiva", ciò è probabilmente dovuto alla tecnica AJAX (abbreviazione di Asynchronous JavaScript and XML ) applicato al tasto Pagina successiva. Questa guida ti spiegheremo come risolvere il problema in modo da poter estrarre i dati in modo efficiente e più veloce.


Perché il caricamento AJAX rallenta il processo

Prima che Octoparse possa eseguire azioni come Fai clic su elemento e Clicca per paginare, deve confermare che la pagina sia completamente caricata. Quindi Octoparse considera il ricaricamento della pagina come segnale per quando la pagina web è pronta per l'azione successiva nel flusso di lavoro. Per una pagina web caricata con AJAX, tuttavia, il nuovo contenuto viene solitamente aggiornato senza ricaricare; in questo caso Octoparse non riceverebbe il segnale per procedere. Di conseguenza, potresti ottenere zero o molti meno dati estratti del previsto.

Per risolvere questo problema, possiamo impostare un timeout di caricamento AJAX per l'azione Fai clic su elemento. Quando viene raggiunto il timeout, Octopares procederà all'azione successiva indipendentemente dal fatto che venga rilevato o meno il ricaricamento della pagina.

Dove impostare il caricamento AJAX

  • Fare clic sull'azione Fai clic su elemento o Clicca per impaginare

  • Spuntare la casella Carica con AJAX nella scheda Opzioni sotto il flusso di lavoro

  • Impostare il timeout AJAX secondo quanto veloce la pagina web carica e clicca su Applica per salvare le impostazioni

Suggerimento:
Assicurati di impostare un timeout sufficientemente lungo da consentire il caricamento delle informazioni di destinazione.

Nella maggior parte dei casi, Octoparse rileva AJAX e imposta automaticamente il timeout, ma potrebbe comunque essere necessario estendere il timeout AJAX per le pagine che impiegano più tempo a caricarsi.

Scopri di più su AJAX: Guida AJAX

Hai ricevuto la risposta alla tua domanda?