メインコンテンツにスキップ

Kijiji から車両情報をスクレイピング

12か月以上前に更新

こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。

Kijiji はカナダのオンラインクラシファイド広告サイトで、eBay Classifieds グループの一部です。

このチュートリアルでは、Kijiji から車両情報をスクレイピングする方法を紹介します。

1.png

チュートリアルに従うには、以下の URL を使用してください:


​主要な手順は右側のメニューに表示されており、サンプルタスクファイルはここからダウンロードできます。


1.「ウェブページへ移動」を作成-ターゲットウェブサイトを開くため

  • ホーム画面の検索ボックスにターゲットURLを入力し、「スタート」をクリックします。


2.「ループクリックアイテム」を作成し、リスト内の各アイテムを順にクリック

  • 最初のアイテムカードをクリックします。

  • 次に、2番目のアイテムカードをクリックします。

  • 操作提案で「各URLにループクリック」をクリックします。


3.「ループアイテム」のXPathを修正して、すべてのアイテムを特定

アイテムカードのループ設定後に、一部のアイテムがループに含まれない場合があります。そのため、すべてのアイテムを手動で特定するために、XPath を修正する必要があります。

  • ループアイテムをクリックします。

  • ループモード可変リストに変更します。

  • Xpath://a[@data-testid="listing-link"] を入力します。

  • 保存」をクリックします。


4.「アイテムをクリック」を設定して、詳細情報を表示させる

詳細な説明は詳細ページで隠されているため、「もっと見る」ボタンをクリックして情報を完全に読み込む必要があります。

  • 説明の下の「Show more」をクリックします。

  • 操作提案の「選択したボタンをクリックする」を選択します。


5.「データを抽出」して、必要なデータを選択

  • 操作提案の「要素データ」をクリックします。

  • データフィールドの名前を変更する必要がある場合は、フィールドをダブルクリックします。


6.データフィールドのXPathを修正して、各詳細ページで要素を正確に特定

データ収集が欠けている場合やフィールドの位置がずれている場合は、すべての詳細ページで要素が正しく特定できるようにXPathを再設定する必要があります。

  • データプレビュー」パネルに移動します。

  • 右上隅のアイコンをクリックして「縦表示」に切り替えます。

  • フィールドのXPathを入力します。

各データフィールドのXPathは以下の通りです:

商品名: //h1[@itemprop="name"]

価格: //span[@itemprop="price"]

画像リンク: //div[contains(@class,'backgroundImage')]//img

アドレス: //a[contains(@class,"location")]

トランスミッション: //span[contains(text(),"Transmission")]/following-sibling::span

燃料タイプ: //span[contains(text(),"Fuel Type")]/following-sibling::span

在庫番号: //span[contains(text(),"Stock")]/following-sibling::span

ドライブトレイン: //span[contains(text(),"Drivetrain")]/following-sibling::span

ボディタイプ: //span[contains(text(),"Body Type")]/following-sibling::span

説明: //div[@itemprop="description"]


最終的なワークフローは次のようになります:


7.タスクを実行して、必要なデータを取得

  • 実行」をクリックして、タスクをデバイスまたはクラウドで実行します。

  • ローカル収集」セクションの「通常モード」を選択して、タスクをローカルデバイスで実行します。

  • タスクが完了するまで待ちます。


こちらがサンプル出力データで、Excel、CSV、HTML、JSON 形式でエクスポートできます。

ヒント: ローカル収集は迅速な実行や少量のデータに最適です。より複雑なタスクや大量のデータを扱う場合は、クラウド収集をお勧めします。14日間の無料トライアルにサインアップしてプレミアム機能をお試しください。タスクは毎時、毎日、または毎週スケジュールでき、データを定期的に受け取ることができます。

こちらの回答で解決しましたか?