Octoparse

En algunos casos, la extracción local funciona perfectamente, pero se extraen campos en blanco en la extracción en la nube. Este tutorial presentará las causas de este problema y cómo resolverlo.

___________________________________________________________

1. Ejecución en la nube scrapea datos antes de que se carguen completamente datos en la página 

La ejecución en la nube es el tipo de tabla dividida y scrapea demasiado rápido, por lo que Los datos no se han cargado correctamente, el paso de recogida se ha completado

Las tareas con modo de bucle "Lista Fija," "Lista of URLs" y "Lista de texto" se dividen en tablas. Las tareas principales se dividen en sub-tareas ejecutadas con múltiples servidores en la nube simultáneamente. En este caso, cada paso de la tarea funcionará muy rápido, por lo que algunas páginas pueden no cargarse completamente antes de pasar al siguiente paso.

Para asegurarte de que la página web se cargue completamente en la nube, puedes intentar lo siguiente:

Aumentar el tiempo de espera para el paso "Ir a la página web".

- Aumentar el tiempo de espera para el paso "Ir a la página web".

Configurar una <a href="https://helpcenter.octoparse.com/es/articles/8483602">espera antes de la acción.</a>

- Configurar una <a href="https://helpcenter.octoparse.com/es/articles/8483602">espera antes de la acción.</a>

Todos los pasos creados en el flujo de trabajo pueden configurar un tiempo de espera. Sugerimos que configures el tiempo de espera para las acciones "Extraer datos".

Configurar un elemento ancla para encontrar antes de la acción.

Este paso garantizará que la extracción solo comience después de que se haya encontrado un cierto elemento. Puedes elegir el XPath de cualquier elemento de los campos deseados.

Primero, haz clic en el paso "Extraer datos". Segundo, llena el elemento con un XPath y cambia "Esperar antes de la acción" a 30 segundos.

Nota: ¿Cómo obtener el XPath de un elemento específico en la página?

Cambia a la vista vertical y verás todos los XPath relativos para cada campo.

- Haz clic en "Extraer datos".
- Cambia a la vista vertical y verás todos los XPath relativos para cada campo.

2. El sitio web que estás buscando es multinacional.

Un sitio web multinacional podría tener diferentes estructuras de página para el contenido proporcionado a visitantes de diferentes países. Cuando una tarea se configura para ejecutarse en la nube, se ejecuta con nuestras IP basadas en América. En este caso, para tareas dirigidas a sitios web fuera de América, algunos datos pueden omitirse, ya que no se pueden encontrar en el sitio web abierto en la nube.

Para identificar si el sitio web es multinacional, puedes hacer lo siguiente:

Probar la tarea con extracción local. Si no falta ningún dato, como ocurre en la extracción en la nube, es probable que el sitio web sea multinacional. En este caso, como el contenido objetivo solo se encuentra al abrir el sitio web con tu propia IP, te sugerimos utilizar la Extracción Local para obtener los datos.

Extraer el HTML externo de toda la página. Al verificar el HTML extraído, podrías encontrar qué ha causado que falten los datos por el mensaje en el código fuente, como "Acceso denegado".

- Probar la tarea con extracción local. Si no falta ningún dato, como ocurre en la extracción en la nube, es probable que el sitio web sea multinacional. En este caso, como el contenido objetivo solo se encuentra al abrir el sitio web con tu propia IP, te sugerimos utilizar la Extracción Local para obtener los datos.
- Extraer el HTML externo de toda la página. Al verificar el HTML extraído, podrías encontrar qué ha causado que falten los datos por el mensaje en el código fuente, como "Acceso denegado".

Aquí tienes un tutorial relacionado para verificar errores en la nube: <a href="https://helpcenter.octoparse.com/es/articles/8483700">¿Por qué la tarea no obtiene datos en la nube pero funciona bien cuando se ejecuta de forma local?</a>

¿Por qué obtengo campos blancos en la ejecución en la nube?

Go to Octoparse.com

Octoparse DE

Octoparse FR

Octoparse ES

Octoparse JP

Descarga

Blog

API Docs

Encuentra respuestas y obtén ayuda del servicio de Atención al cliente y de expertos de la comunidad de Intercom

Las conversaciones que hayas iniciado en Messenger aparecerán aquí.

No hay conversaciones creadas por usted

Prueba a usar diferentes palabras clave o comprobar si hay errores tipográficos.

Prueba a usar diferentes palabras clave o filtros.

No se encontraron conversaciones

Título

Este sitio emplea cookies y otras tecnologías que nosotros y nuestros proveedores externos utilizamos para monitorizar y registrar datos personales sobre ti y tus interacciones con el sitio (por ejemplo, contenidos vistos, movimientos del cursor, grabaciones de pantalla y contenidos del chat) para los fines descritos en nuestra Política de cookies. Al continuar en nuestro sitio, aceptas nuestros {websiteTermsLink}, {privacyPolicyLink} y {cookiePolicyLink}.

Este sitio utiliza cookies y tecnologías similares (“cookies”) que son estrictamente necesarias para su funcionamiento. Nosotros y nuestros socios también desearíamos instalar cookies adicionales para activar las funciones de análisis del rendimiento del sitio, funcionalidad, publicidad y redes sociales. Consulta nuestra {cookiePolicyLink} para más detalles. Puedes cambiar tus preferencias de cookies en nuestra Configuración de cookies.

Usamos cookies para el correcto funcionamiento de nuestro sitio y también con fines analíticos y publicitarios. Puedes activar o desactivar las cookies opcionales como prefieras. Consulta nuestra {cookiePolicyLink} para más información.

Las cookies de publicidad las instalan nuestros socios publicitarios para recopilar información sobre tu uso del sitio, nuestras comunicaciones y otros servicios online a lo largo del tiempo y con diferentes navegadores y dispositivos. Usan estos datos para mostrarte anuncios en Internet que creen que pueden interesarte y medir su rendimiento. Las cookies de redes sociales las instalan las plataformas de redes sociales para que puedas compartir contenidos en ellas y pueden rastrear información sobre tu actividad en otros servicios online para usarla como se describe en sus políticas de privacidad.

Estas cookies permiten mejorar la funcionalidad y la personalización del sitio web. Podemos instalarlas nosotros o proveedores externos cuyos servicios hemos añadido a nuestras páginas. Si no permites estas cookies, es posible que algunos o todos estos servicios no funcionen correctamente.

Estas cookies son necesarias para que el sitio web funcione y no se pueden desactivar en nuestros sistemas.

Estas cookies nos permiten contabilizar las visitas y las fuentes de tráfico para poder medir y mejorar el rendimiento de nuestro sitio. Nos ayudan a saber qué páginas son las más y las menos populares y a ver cómo se desplazan los visitantes por el sitio.

Tienes derecho a oponerte a la venta de tus datos personales. Consulta nuestra {cookiePolicyLink} para obtener más detalles sobre el uso que hacemos de tus datos.

Sus opciones de privacidad

Utilizamos cookies para mejorar tu experiencia. A continuación puedes personalizar tus preferencias o consultar nuestra {cookiePolicyLink} para más detalles.

Configuración de cookies

Centro de ayuda vacío

Oh, oh. Esa página no existe.

Inicio

Resultados de la búsqueda

Decepcionado/a

Imparcial

Sonriente

Pensando...

Buscando en las fuentes...

Analizando...

Los tickets enviados por Messenger o por un agente de atención al cliente con el que mantengas una conversación aparecerán aquí.

No hay tickets creados por ti

No se ha encontrado ningún ticket

Haz un seguimiento del progreso de todos los tickets y conversaciones relacionados con tu empresa.

Portal del cliente.

Haz un seguimiento del progreso de todos los tickets relacionados con tu empresa.

Portal de tickets.

{assigneeName} se encargará de ello muy pronto

{assigneeName} necesita más información

Necesitamos que nos facilites más información

Tickets

Sin acceso al portal de tickets

Buscar

Omitir la búsqueda. Describa lo que intenta hacer y obtenga una respuesta fundamentada.

Explore los artículos y guías de este tema.

Cree el espacio de trabajo e invite a las personas con las que trabaja.

Configure su cuenta

Cree su primer flujo de trabajo y vea cómo se ejecuta de principio a fin.

Enviar algo

Conecte las herramientas que su equipo ya utiliza para importar datos.

Conecte su pila

Un breve recorrido por el producto para que sepa dónde está todo.

{appName} en 60 segundos

Esta demo del prototipo sabe que está leyendo «{title}». Puede remitirle de nuevo al artículo actual, pero un contrato de Fin para producción con reconocimiento del artículo sigue siendo trabajo pendiente.

Respuesta prototipo con reconocimiento de artículos

Dado que ya ha preguntado sobre las invitaciones, esta demostración del prototipo puede incluir la siguiente indicación: utilice el selector de roles antes de enviar cada invitación para limitar el acceso a las responsabilidades de los compañeros de equipo.

Seguimiento de la limitación de funciones del prototipo

Esta demostración del prototipo sugiere comenzar por el perfil del espacio de trabajo, invitar a los miembros del equipo que necesitan acceso y, después, conectar las integraciones que utiliza.

Respuesta de introducción al prototipo

En esta demostración del prototipo, las integraciones se configuran desde la configuración del espacio de trabajo. Elija la integración, conecte la cuenta y revise los permisos habilitados.

Respuesta sobre integraciones del prototipo

En esta demostración del prototipo, invite a sus compañeros de equipo desde la configuración del espacio de trabajo y luego elija el nivel de acceso que necesita cada uno antes de enviar la invitación.

Respuesta de prototipo para invitar al equipo

Esta demostración del prototipo aún no tiene una respuesta predefinida para esa pregunta. Pruebe a preguntar cómo invitar a su equipo o abrir un artículo fuente. No se llamó a ninguna API de producción de Fin.

Respuesta de prototipo no disponible

Tengo esta página abierta. Pregúntame cualquier cosa al respecto y responderé según la documentación.