Vai al contenuto principale

Perché ottengo campi vuoti durante l’estrazione in Cloud?

Aggiornato oltre 5 mesi fa

In alcuni casi, l’estrazione locale funziona perfettamente, ma durante le esecuzioni in Cloud alcuni campi risultano vuoti. In questo tutorial vedremo le cause più comuni di questo problema e come risolverlo.


1. Le attività eseguite in Cloud sono suddivise e troppo rapide, per cui alcuni elementi vengono saltati

Le attività con modalità di loop come Elenco fisso, Elenco di URL e Elenco di testi sono suddivisibili. Questo significa che il compito principale viene suddiviso in sottocompiti ed eseguito da più nodi cloud contemporaneamente. In questi casi, ogni passaggio viene elaborato molto velocemente, quindi alcune pagine potrebbero non caricarsi completamente prima di passare al passaggio successivo.

Per assicurarsi che la pagina web venga caricata completamente nel Cloud, può provare a:

  • Aumentare il timeout nel passaggio Vai alla pagina web

  • Impostare un'attesa prima dell'azione

È possibile impostare un tempo di attesa per ogni passaggio nel flusso di lavoro. Si consiglia di aggiungere un’attesa specifica all’azione "Estrai dati".

  • Impostare un elemento di ancoraggio da trovare prima di eseguire l’azione

Questo passaggio garantisce che l’estrazione inizi solo dopo che è stato trovato un determinato elemento. Può scegliere l’XPath di un elemento presente nei campi che desidera estrarre.

Suggerimento: come ottenere l’XPath di un determinato elemento sulla pagina?

  • Clicchi su Estrai dati

  • Passi alla visualizzazione verticale, dove potrà vedere tutti gli XPath associati a ciascun campo


2. Il sito web in questione è multiregionale

Un sito multiregionale può presentare strutture di pagina diverse in base al paese da cui viene visitato. Quando un'attività viene eseguita in Cloud, viene elaborata tramite indirizzi IP americani per impostazione predefinita. Pertanto, per i siti web che mostrano contenuti diversi al di fuori degli Stati Uniti, alcuni dati potrebbero non essere visualizzati perché non presenti nella versione americana del sito.

Per verificare se un sito è multiregionale, può:

Controllare lo screenshot del log Cloud per verificare se la pagina web è stata caricata correttamente. Può confrontarla con quella che vede sul suo dispositivo.

Se i contenuti desiderati sono visibili solo con il suo IP locale, si consiglia di:

Hai ricevuto la risposta alla tua domanda?