メインコンテンツにスキップ

ウェブページの指定エリア内でスクロールする

2年以上前に更新

ウェブページの一部をスクロールすることは、Octoparseにとって長い間の課題であり、特に複数のスクロールバーがあるウェブページでは困難でした。

「指定されたエリア内でのスクロール」とは何でしょうか?

ほとんどの場合、ウェブページ全体をデフォルトのスクロールバーを使用してスクロールする必要があります。この場合、デフォルトスクロールバー内でのスクロール方法が正常に機能します。

しかし、レビューや投稿のページなど、異なるデザインのウェブページも存在します。

レビューはウェブページの左側に表示され、この部分にはスクロールバーがあります。このスクロールバーを下にドラッグすると、レビューがスクロールして追加のレビューが読み込まれます。ただし、ページの他の部分はスクロールされません。

Octoparseでは、タスク設定で子階層スクロールを設定する必要があります。

もう1つの例として、TikTokの動画のコメントページがあります。コメントセクションには、メインの動画ページとは別のスクロールバーがあります。このスクロールバーを使用して、コメントを表示しスクロールすることができます。


Octoparseで指定エリア内をスクロールするには?

設定方法は2つあります:

1. 「Webページを開く」アクションまたは「アイテムをクリック」でスクロールを設定する(最初にスクロールし読み込み完了してからデータを抽出)

  • Webページを開く」または「アイテムをクリック」をクリックします。

  • 詳細設定」をクリックし、「スクロールダウン」にチェックを入れます。

  • スクロールモードを「子階層」に設定します。

2. ループアイテムでスクロールを設定する(スクロールとデータ抽出を同時に実行)

  • ワークフローに「ループアイテム」ステップを追加します。

  • ループアイテム」をクリックし、「ループモード」から「ページをスクロール」を選択します。

  • スクロールモードを「子階層」に設定します。


スクロールエリアのXPathを入力する

次に、Octoparseにどこをスクロールするか指示する必要があります。スクロールエリアのXPathを入力する必要があります。

XPathを書く方法を学ぶ必要があります。XPathの詳細はこのチュートリアルをご覧ください: XPathとは?OctoparseでXPathを利用する方法は?

XPathを書く方法がわからない場合は、一致するXPath入力ボックスのアイコンをクリックし、ウェブページからスクロールエリアを手動で選択してください。Octoparseが自動的にXPathを生成します。

ヒント: 自動生成されたXPathや自分で書いたXPathでも、常にうまく機能するとは限りません。選択したエリアがスクロール可能かどうかを確認するために、複数回試す必要がある場合があります。

  • スクロール方式のオプションを選択: 一番下までスクロールまたは1画面ずつスクロール

  • スクロールのループ回数(スクロールしたい回数)と実行間隔(各スクロールの間隔時間)を設定します。

  • 設定を保存するために「保存」をクリックします。

こちらの回答で解決しましたか?