Vai al contenuto principale

Cos'è il Cloudflare e come possiamo bypassarlo?

Aggiornato più di un anno fa

Nell'ambiente web odierno, molti siti web utilizzano Cloudflare per proteggersi da attività malevole, presentando sfide per il data scraping. In questo tutorial, spiegheremo cosa è la verifica Cloudflare e ti guideremo attraverso due soluzioni comprovate per bypassarla.


Cos'è la verifica Cloudflare?

La verifica Cloudflare è una misura di sicurezza utilizzata dai siti web per distinguere tra utenti legittimi e bot automatici. Spesso comporta sfide CAPTCHA, controlli di integrità del browser e limitazione dei tassi di richiesta. Queste verifiche aiutano a proteggere i siti web da minacce come attacchi DDoS, spam e scraping, ma pongono anche ostacoli significativi per gli strumenti di web scraping.


Come affrontarlo in Octoparse?

Soluzione 1: Bypass automatico con credito

Al lancio della nuova versione 8.7.2, Octoparse può risolvere automaticamente le sfide Cloudflare per te. Quando il sito web mostra il CAPTCHA di Cloudflare, tutto ciò che devi fare è selezionare l'opzione Bypassa Cloudflare usando credito e fare clic su Bypassa quando appare il Cloudflare turnstile e attendere che venga aggirato automaticamente.

Questa funzione costa $1,50 per 1.000 richieste, quindi assicurati di avere abbastanza crediti aggiuntivi nel tuo account prima di utilizzare la funzionalità. Una cosa da notare è che verrà addebitato un costo una volta che clicchi su Bypassa per avviare il processo, sia che esso abbia successo o meno. La probabilità di successo nella risoluzione di queste sfide è di circa l'80%.

È anche importante notare che questa funzione è disponibile solo nel passaggio "Vai alla pagina", vale a dire che Octoparse non può rilevare o risolvere Cloudflare che riappare in tempo reale durante il processo di esecuzione dell'attività.

Nota: Se hai bisogno di disabilitare la funzione di verifica Cloudflare durante lo scraping, deseleziona l'opzione Bypassa Cloudflare usando credito nelle Impostazioni di attività.

Soluzione 2: Bypass manuale

È possibile anche bypassare la verifica cloudflare manualmente quando modifichi o esegui le tue attività. Per maggiori dettagli del metodo controlla questo tutorial.

Hai ricevuto la risposta alla tua domanda?