ウェブページの一部をスクロールすることは、Octoparseにとって長い間の課題であり、特に複数のスクロールバーがあるウェブページでは困難でした。
「指定されたエリア内でのスクロール」とは何でしょうか?
ほとんどの場合、ウェブページ全体をデフォルトのスクロールバーを使用してスクロールする必要があります。この場合、デフォルトスクロールバー内でのスクロール方法が正常に機能します。
しかし、レビューや投稿のページなど、異なるデザインのウェブページも存在します。
レビューはウェブページの左側に表示され、この部分にはスクロールバーがあります。このスクロールバーを下にドラッグすると、レビューがスクロールして追加のレビューが読み込まれます。ただし、ページの他の部分はスクロールされません。
Octoparseでは、タスク設定で子階層スクロールを設定する必要があります。
もう1つの例として、TikTokの動画のコメントページがあります。コメントセクションには、メインの動画ページとは別のスクロールバーがあります。このスクロールバーを使用して、コメントを表示しスクロールすることができます。
Octoparseで指定エリア内をスクロールするには?
設定方法は2つあります:
1. 「Webページを開く」アクションまたは「アイテムをクリック」でスクロールを設定する(最初にスクロールし読み込み完了してからデータを抽出)
2. ループアイテムでスクロールを設定する(スクロールとデータ抽出を同時に実行)
スクロールエリアのXPathを入力する
次に、Octoparseにどこをスクロールするか指示する必要があります。スクロールエリアのXPathを入力する必要があります。
XPathを書く方法を学ぶ必要があります。XPathの詳細はこのチュートリアルをご覧ください: XPathとは?OctoparseでXPathを利用する方法は?
XPathを書く方法がわからない場合は、一致するXPath入力ボックスのアイコンをクリックし、ウェブページからスクロールエリアを手動で選択してください。Octoparseが自動的にXPathを生成します。
ヒント: 自動生成されたXPathや自分で書いたXPathでも、常にうまく機能するとは限りません。選択したエリアがスクロール可能かどうかを確認するために、複数回試す必要がある場合があります。