Se occorre molto tempo prima che Octoparse sia in grado di passare all'azione successiva nel flusso di lavoro o se rimani bloccato facendo clic sul pulsante "Pagina successiva", ciò è probabilmente dovuto alla tecnica AJAX (abbreviazione di Asynchronous JavaScript and XML ) applicato al tasto Pagina successiva. Questa guida ti spiegheremo come risolvere il problema in modo da poter estrarre i dati in modo efficiente e più veloce.
Perché il caricamento AJAX rallenta il processo
Prima che Octoparse possa eseguire azioni come Fai clic su elemento e Clicca per paginare, deve confermare che la pagina sia completamente caricata. Quindi Octoparse considera il ricaricamento della pagina come segnale per quando la pagina web è pronta per l'azione successiva nel flusso di lavoro. Per una pagina web caricata con AJAX, tuttavia, il nuovo contenuto viene solitamente aggiornato senza ricaricare; in questo caso Octoparse non riceverebbe il segnale per procedere. Di conseguenza, potresti ottenere zero o molti meno dati estratti del previsto.
Per risolvere questo problema, possiamo impostare un timeout di caricamento AJAX per l'azione Fai clic su elemento. Quando viene raggiunto il timeout, Octopares procederà all'azione successiva indipendentemente dal fatto che venga rilevato o meno il ricaricamento della pagina.
Dove impostare il caricamento AJAX
Fare clic sull'azione Fai clic su elemento o Clicca per impaginare
Spuntare la casella Carica con AJAX nella scheda Opzioni sotto il flusso di lavoro
Impostare il timeout AJAX secondo quanto veloce la pagina web carica e clicca su Applica per salvare le impostazioni
Suggerimento:
Assicurati di impostare un timeout sufficientemente lungo da consentire il caricamento delle informazioni di destinazione.
Nella maggior parte dei casi, Octoparse rileva AJAX e imposta automaticamente il timeout, ma potrebbe comunque essere necessario estendere il timeout AJAX per le pagine che impiegano più tempo a caricarsi.
Scopri di più su AJAX: Guida AJAX