Ir al contenido principal

Extraer reseñas de Google Maps

Actualizado hace más de un año

Como el rey de las aplicaciones de navegación, Google Maps comenzó ofreciendo una manera fácil de obtener direcciones de un lugar a otro, pero ha evolucionado continuamente hasta convertirse en una base de datos global interactiva repleta de la información comercial más valiosa disponible en Internet.

Sin embargo, si eres propietario de una empresa y deseas extraer reseñas de empresas o lugares de Google Maps, pronto descubrirás que la forma oficial de obtener reseñas a través de la API de Google Places está limitada a 5 reseñas, lo cual no es suficiente para hacer un análisis.

Pero no te preocupes, con Octoparse 8.5, ahora puedes crear tu propio rastreador y recopilar una cantidad ilimitada de reseñas para empresas o lugares directamente desde Google Maps en pocos minutos.

En este tutorial, te guiaremos a través de los pasos para diseñar tu propio flujo de trabajo de tareas para extraer reseñas de Google Maps.

Nota: Este tutorial solo funciona para la versión 8.4 y 8.5, ya que la tarea requiere la función Desplazamiento parcial recientemente agregada. Si tienes una versión anterior de Octoparse, te recomendamos encarecidamente que actualices a la última versión para disfrutar de esta nueva y poderosa función, así como de una interfaz de edición de tareas recientemente diseñada.

To delve into the task properly, we will use Google Maps reviews for Restaurante Ático as an example.

Aquí se listan los pasos principales en este tutorial:

1. Ir a la página web - para abrir la página web de destino

  • Ingresa la URL en la barra de búsqueda en la pantalla de inicio y haz clic en "Empezar".

mceclip0.png

También puedes ingresar la URL creando la tarea en Modo Avanzado.

  • Busca el botón "+ Nuevo" en la barra lateral, haz clic en él y luego selecciona "Modo Avanzado".

mceclip1.png
  • Ingresa manualmente la URL en el cuadro del sitio web y haz clic en "Guardar" para comenzar

Google_Maps_ingresar_URL.png

De cualquier manera, verifica si se ha generado una acción "Ir a la página web" en el flujo de trabajo. Si tienes más de una URL, consulta este artículo para ver cómo Octoparse maneja una lista de URL.

mceclip2.png

2. Hacer clic en el elemento - para ir a la página "Todas las reseñas"

  • Haz clic en "600 reseñas" que te dirigirá a la página "Todas las reseñas" y selecciona "Hacer clic en el botón" para generar una acción "Hacer clic en elemento" en tu flujo de trabajo

Hacer_clic_para_mostrar_rese_as.gif
  • Establece el tiempo de espera de AJAX en 15 segundos o más

mceclip4.png

3. Crear un Elemento de bucle con Desplazamiento Parcial - para desplazarse hacia abajo en la columna de revisión

Encontrarás que la nueva página tiene múltiples barras de desplazamiento y las revisiones que deseas están dentro de una columna desplazable a la izquierda. La página no cargará más revisiones a menos que te desplaces dentro de la columna izquierda, por lo tanto, debemos configurar un elemento de bucle con un desplazamiento parcial para que nuestro flujo de trabajo se desplace y extraiga al mismo tiempo.

  • Agrega un paso "Elemento de bucle" a tu flujo de trabajo

Crear_un_Elemento_de_bucle_en_el_flujo_de_trabajo_.gif
  • Haz clic en "Elemento de bucle", establece el modo de bucle en "Desplazamiento de página" y cambia el área de desplazamiento de "Predeterminado" a "Parcial"

Configurar_desplazamiento_parcial.gif
  • Ingresa el XPath del área de desplazamiento para decirle a Octoparse dónde desplazarse

Ingresa el XPath directamente si sabes cómo escribir un XPath. Consulta este artículo para embarcarse en su viaje para convertirse en un maestro de XPath.

¿No sabes cómo escribir un XPath? No te preocupes, no estás solo. Gracias a la última actualización, ahora puede simplemente hacer clic en el ícono y seleccionar el área de desplazamiento completa manualmente desde la página web. Octoparse generará automáticamente un XPath para ti.

Seleccionar__rea_de_desplazamiento_parcial.gif

Tips: Ajusta el área seleccionada para asegurarte de haber seleccionado toda el área desplazable (incluida la barra de desplazamiento). El XPath generado automáticamente e incluso los que escribes por tu cuenta no funcionarán bien todo el tiempo. ¡Aprende de pruebas y errores!

  • Elige entre desplazarse "hasta el final de la página" o "para una pantalla"

  • Establece veces de repeticiones de desplazamiento (cuántas veces desea desplazarse)

  • Establece un tiempo de espera (intervalo de tiempo entre cada desplazamiento)

  • Haz clic en "Aplicar" para guardar tu configuración

Configuraci_n_de_desplazamiento.png

4. Extraer datos en el bucle - seleccionar los datos para la extracción

Este paso es rápido y fácil con la innovadora función de detección automática de Octoparse.

  • Haz clic en Detectar automáticamente los datos de la página web en el cuadro Tips y espera a que se complete

mceclip5.png

Note: Si por algún motivo, la detección automática no detecta la lista, también puedes seleccionar varios elementos similares en la página web para indicarle a Octoparse el patrón de selección. Consulta este artículo para ver cómo configurar una extracción de lista manualmente.

  • Cambia el nombre de los campos de datos que deseas y elimina los que no

mceclip6.png
mceclip7.png

En este caso, queremos extraer datos como Nombre, Fecha, Número de reseñas, Contenido de la reseña y Megusta que recibe cada comentario.

mceclip9.png
  • Confirma la configuración dentro del cuadro "Tips" y haz clic en "Crear workflow"

mceclip8.png
  • Asegúrate de que el elemento de bucle que crees (debe llamarse Elemento de bucle 1 de forma predeterminada) se coloque dentro del elemento de bucle anterior.

mceclip10.png

5. Limpiar los campos de datos - refinar los datos

Puedes notar que algunos datos en la columna "Número de reseñas" tienen un punto inútil delante de ellos. Usa "Reformatear datos" para eliminar los puntos de repuesto.

  • Haz clic en los tres puntos para ver más opciones para los campos de datos

  • Haz clic en "Reformatear datos"

mceclip11.png
  • Haz clic en "+Agregar paso" y selecciona la opción "Reemplazar"

mceclip12.png
  • Ingresa un punto en la barra "Reemplazar" y reemplázalo con un espacio en blanco (simplemente deje la barra "Con" en blanco)

  • Haz clic en "Evaluar" para ver si hemos obtenido el resultado deseado

  • Haz clic en "Confirmar" para aplicar el cambio

Reformatear_datos.png

6. Iniciar la extracción - ejecutar la tarea y obtener los datos

  • Haz clic en "Guardar" y "Ejecutar" en el lado superior izquierdo

  • Selecciona "Ejecutar en el dispositivo" para ejecutar la tarea en tu computadora, o selecciona "Ejecutar en la nube" para ejecutarla en nuestros servidores en la nube (solo para usuarios premium)

mceclip0.png

Nota: Las ejecuciones locales son excelentes para revisar problemas de tareas y ejecuciones de manera rápida. Si se trata de tareas más complicadas, se recomienda que seleccione "Ejecutar en la nube" para ejecutar la tarea en la plataforma basada en la nube de Octoparse para una mayor velocidad. Prueba esta función premium registrándote para la prueba gratuita de 14 días aquí. También puedes configurar extracciones programadas y recibir datos regularmente.

¿Ha quedado contestada tu pregunta?