メインコンテンツにスキップ

Octoparseで広告ポップアップをバイパスする方法

1年以上前に更新

こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。

クローラーの抽出速度はページの読み込み速度に影響を受けます。バナーやポップアップなど、予期しない広告が多数表示される場合、ページの読み込みが遅くなり、時間が無駄になる可能性があります。広告ブロックを使用することで、ページリクエストを減らし、読み込み時間を最適化することができます。

では、Octoparseで広告をブロックする方法はありますか?このチュートリアルに従い、この問題を解決するための2つの方法を試してみましょう。


解決策1:ワークフロー内で広告をブロックする

  • Webページを開く」をクリックし、詳細設定を選択します。

  • ポップアップをブロック」(広告が表示される可能性があります)にチェックを入れます。

  • 変更を保存するために「保存」をクリックします。

mceclip0.jpg

解決策2:タスク設定で広告をブロックする

  • 右上隅の歯車アイコンをクリックします。

  • 広告をブロックする」にチェックを入れます。

  • 保存」をクリックします。

ヒント:

  1. 広告ブロック技術を使用すると、一部のウェブページの構造が変わる場合があります。その場合は、XPathを調整して要素の位置を再配置してください。(XPathについて詳しい情報は、「XPathとは?OctoparseでXPathを利用する方法は?」をチェックしてください。)

  2. 広告ブロックを使用すると、ページの読み込みに問題が発生する可能性があります。たとえば、ページがまったく読み込まれないなど、ページの読み込みが正しく行われない場合は、広告ブロックを選択しないでください。

こちらの回答で解決しましたか?