Parfois, nous devons extraire l’URL d’une image depuis un site web, mais nous n’obtenons que l’URL d’une vignette au lieu de celle d’une image en taille normale.
Voici un exemple d’image extraite depuis Amazon. Comme vous pouvez le constater, l’image est trop petite pour être bien visible.
Pour obtenir les images en taille normale, il suffit de modifier l’URL de l’image que nous avons déjà, en suivant les étapes ci-dessous :
Si vous souhaitez savoir comment extraire les URL des images, vous pouvez d’abord consulter ce tutoriel : Extraire des images depuis un carrousel.
1. Observez la différence entre l’URL complète de l’image et l’URL de la vignette.
Les URL d’images de tailles différentes présentent généralement de légères différences. Il nous faut identifier la différence entre l’URL de l’image complète et celle de la vignette.
Par exemple, la vignette sur Amazon est la suivante :
L’URL de l’image en taille normale est :
On peut constater que l’URL de la vignette contient « SR38,50 ». Il suffit de le supprimer de l’URL.
Dans certains cas, vous verrez peut-être que l’URL de l’image contient une dimension, comme 85x85, pour indiquer la taille de l’image :
Vous pouvez essayer de remplacer « 85x85 » par « 1000x1000 » afin de vérifier si l’URL reste valide :
2. Utilisez la fonction « Nettoyer les données » d’Octoparse pour reformater l’URL de la vignette en URL complète.
Saisissez la valeur que vous souhaitez remplacer (par exemple SR38,50) dans la case « Remplacer ».
Saisissez la valeur par laquelle vous voulez la remplacer dans la case « Par ».
(Dans le cas de l’URL d’image Amazon, vous devez supprimer « SR38,50 », ce qui signifie le remplacer par rien. Il suffit donc de laisser la case « Par » vide.)
Cliquez sur « Confirmer » pour enregistrer.
Vous pourrez alors obtenir l’URL de l’image en taille réelle dans les résultats finaux.