こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
スクレイピングは違法ではありません
Webスクレイピングやクローリングという技術自体は、競合分析、価格調査、学術研究などの正当な目的で使用される限り、合法です。ただし、オンライン詐欺、アカウント乗っ取り、知的財産の窃盗といった悪意のある活動に利用することは厳禁です。
技術的な定義と役割
Webスクレイピングの定義は、自動的にWebページのデータをダウンロードし、そこから特定の情報を抽出する行為です。抽出されたデータは、データベースやファイルとして保存し、ビジネスや研究に活用できます。一方、Webクローリングは、自動的にWebページのデータをダウンロードし、そこに含まれるハイパーリンクを順次たどることでサイト構造を把握する行為を指します。
これらの作業は、理論的にはブラウザを使用して手動で行うことも可能ですが、スクレイピングツールは、その膨大な手間を自動化し、効率化するための手段を提供します。これはあくまでデータ収集を支援する「ツール」であり、取得したデータの合法的な利用および各サイトの規定遵守については、利用者自身の責任に帰属します。
関連リソース
このトピックに関する詳細や公的機関の指針については、以下のリソースをご覧ください。
Reddit, Lobsters, Web Scraping and Crawling Are Perfectly Legal, Right?
著作権法第30条の4では、「情報解析」(大量の情報から要素を抽出し、比較・分類等を行うこと)を目的とする場合、著作権者の許諾なく著作物を利用できると定められています。これにより、データを解析・抽出するための機械的な収集行為は、著作権者の利益を不当に害さない限り、法的に認められています。
