カーセンサーは中古車情報のオンラインプラットフォームです。車の販売者と購入者をつなぎ、信頼性の高い情報を提供します。メーカー、モデル、価格、年式、走行距離などの詳細な情報を検索でき、写真や評価、販売者の連絡先も見られます。使いやすく便利な選択肢で、日本国内で広く利用されています。
このチュートリアルでは、WebスクレイピングツールOctoparseを使って、カーセンサーから中古車販売店の情報をスクレイピングする方法についてご説明します。
また、Octoparseのメイン画面にある「テンプレートタスク」に移動し、利用準備が整ったテンプレートを直接使用して時間を節約することもできます。この機能を使用すると、タスクのワークフローを作成することなしでカーセンサーのデータをスクレイピングすることができます。詳細については、こちらをご覧ください:タスクテンプレート
次のURLを例として使います。
主な手順は右側のメニューに表示されています。こちらからサンプルタスクをダウンロードできます。
1. ウェブページを開く - 対象のウェブページを開く
ホームページにURLを入力してください。
スタートボタンをクリックしてください。
2. ウェブページのデータを自動検出 - ワークフローを作成する
ウェブページのデータを自動検出をクリックします。
ワークフローを生成をクリックします。
次のようなワークフローが生成されます。
必要に応じて、データプレビュー上のデータフィールドを削除したり、名前を変更したりします。
ページ上の内容を選択し、操作提案のテキストあるいはほかの要素をクリックすることで、補充したいデータを取得できます。
3. 各詳細リンクをクリック - 追加情報をスクレイピングする
ご希望のリンクを選択し、操作提案パネル上の選択したリンクをクリックするを選択します。
ワークフローのループアイテムの中にアイテムをクリックステップが追加されます。
4. データを抽出 - 詳細ページでデータを抽出する
必要なデータを選択し、テキストをクリックします。
フィールド名をダブルクリックしてフィールドの名前を変更できます。
5. 抽出を開始 - タスクを実行してデータを取得する
保存をクリックします。
右上の実行をクリックします。
デバイス上でタスクを実行するには、ローカル抽出を選択します。または、クラウドでタスクを実行するには、クラウド抽出を選択します(プレミアムユーザーのみ)
以下はサンプル出力です。