Per potenziare le capacità di scraping, migliorare la stabilità e soddisfare esigenze di estrazione dati sempre più complesse, Octoparse ha introdotto due nuove modalità di scraping per l'estrazione locale nella versione 8.8.0: Modalità Chrome e Modalità headless.
1. Modalità Chrome (Modalità Headful)
Cos'è:
La Modalità Chrome utilizza il browser Google Chrome locale per eseguire l'attività. In questo caso, Octoparse controlla direttamente il browser, simulando azioni reali umane sul sito web.
Ideale per:
Siti web che richiedono l'accesso manuale.
Pagine protette da CAPTCHA o Cloudflare.
Siti web complicati o altamente interattivi.
Note:
Quando si esegue un'attività in Modalità Chrome, il browser Chrome rimane in primo piano. Evita qualsiasi operazione in Chrome durante questo periodo.
L'attività non può essere ridotta a icona e si interromperà alla chiusura del browser.
2. Modalità headless
Cos'è:
La Modalità Phantom viene eseguita senza un'interfaccia browser visibile. Esegue invece le attività di scraping in background, rendendola leggera ed efficiente.
Ideale per:
Siti web che non richiedono l'accesso manuale
Pagine con strutture HTML semplici.
Siti con misure anti-scraping minime.
Attività di scraping di routine ad alto volume.
Come cambiare modalità in Octoparse
Apri l'attività in Octoparse 8.8.0 o versione più recente.
Fai clic su Esegui
Nella sezione Esegui sul tuo dispositivo, scegli Modalità Chrome, Modalità headless o Modalità standard.
Suggerimento: la Modalità Standard è l'impostazione predefinita quando fai clic su Esegui. L'esecuzione dell'attività in locale utilizza il browser integrato nel client. Puoi passare a una modalità diversa se più adatta alle tue esigenze.