Le web scraping et le crawling ne sont pas illégaux en soi, sauf si ces techniques sont utilisées à des fins malveillantes, telles que : extraction concurrentielle de données, fraude en ligne, piratage de comptes, vol de données, appropriation illégale de la propriété intellectuelle, ou toute autre activité illégale.
Le web scraping désigne l’action de télécharger automatiquement les données d’une page web pour en extraire des informations spécifiques. Les données extraites peuvent ensuite être stockées dans une base de données, un fichier, etc.
Le web crawling, quant à lui, consiste à télécharger automatiquement les données d’une page web, à en extraire les liens hypertextes, puis à les suivre. Les données collectées sont généralement stockées dans un index ou une base de données pour en faciliter la recherche.
Bien que les mêmes résultats puissent être obtenus manuellement via un navigateur, le web scraping et le crawling sont des outils permettant d'automatiser et de simplifier le processus fastidieux de collecte de données.
Consultez ces articles pour en savoir plus sur le sujet
Reddit, Lobsters, Web Scraping and Crawling Are Perfectly Legal, Right?