メインコンテンツにスキップ

Airbnbから宿泊先の詳細をスクレイピング

12か月以上前に更新

こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。

Airbnbは理想的なバケーションレンタルを見つけるのに最適なサイトです。このチュートリアルでは、Octoparseを使ってAirbnbからホテル情報を取得する方法をご紹介します。

最も簡単な方法は、Airbnbの事前設定されたタスクテンプレートを使用することです。スクレイピングタスクを設定する必要はなく、キーワードやURLを入力してデータを取得するだけです。詳細については、タスクテンプレートをご覧ください。

主な手順は右側のメニューに表示されています。また、サンプルのタスクファイルはこちらからダウンロードできます。


1. Webページを開く - ターゲットとなるWebサイトへ移動

  • ホームページでURLを入力し、「スタート」をクリック


2. ループアイテムとページネーションの設定 - 各ホテルのリンクをクリックしてページを切り替える設定を行います

  • 最初のブロックを選択し、全てのブロックを検出

  • 類似要素をすべて選択」をクリック

  • 各URLにループクリック」をクリック

  • はい」をクリックして、「ページネーション」を作成

  • 「次へ」を選択

  • ページの最後までスクロールして、「次のページ」アイコンを選択し、「保存」をクリック

作成されたワークフローは以下のようになります。

次のページはAJAXで読み込まれるため、「次のページをクリック」アクションにAJAXタイムアウトを追加する必要があります。

  • 「次のページをクリック」をクリック

  • 「詳細設定」に移動

  • 「Ajax読み込み」のチェックを入れる

  • AJAXタイムアウトを5~10秒に設定


3. ループアイテムのXPathを修正 - アイテムを正確に特定する

自動生成されたXPathがうまく機能しない場合があります。この場合、「ループアイテム」のXPathを修正する必要があります。

  • 「ループアイテム」をクリック

  • 「ループモード」を「可変リスト」に変更

  • XPathを入力: //div[@data-testid="card-container"]/a

  • 「保存」をクリック

注:XPathは、Octoparseで正しい要素を特定する上で重要な役割を果たします。詳細については、こちらのチュートリアルを参照してください:XPathとは?OctoparseでXPathを利用する方法は?


4. 詳細ページからデータを抽出

  • 「アイテムをクリック」をクリックして詳細ページに移動

  • 任意の情報を選択し、ヒントパネルで「テキスト」を選択

  • 現在のページのURLを取得したい場合は、「フィールドを追加」 -> 「該当ページの情報を追加」 -> 「URL」 を選択します。

  • フィールド名を変更するには、ダブルクリックします。


5. タスクを実行 - 必要なデータを取得

  • 実行」をクリックして、デバイスまたはクラウドでタスクを実行します。

  • タスクをお使いのデバイスで実行するには、「ローカル実行」セクションで「通常モード」を選択します。

  • タスクの完了までお待ちください。


以下は出力データのサンプルです。Excel、CSV、HTML、JSON形式でエクスポートできます。

こちらの回答で解決しましたか?