こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
ウェブサイトで検索する場合、例えばGoogle.comのような場合、キーワードを入力した後に検索ボタンをクリックするか、キーボードでEnterキーを押して直接検索結果ページに移動することができます。Octoparseは簡単にクリックアクションをシミュレートできますが、ウェブサイトに検索ボタンがない場合はどうすればよいでしょうか?
この記事では、利用可能な送信ボタンがない場合にOctoparseが「Enterキーを押す」機能をどのように処理するかを説明します。
以下のURLを例として使用します。
問題が発生した場合に機能の制約を回避する2つのオプションがあります。
「テキストを入力」の設定で「Enterキーを押す」機能を使用する
検索キーワードをパラメータとして新しいURLを生成する
1. 「テキストを入力」の設定で「Enterキーを押す」機能を使用する
Mazadaのウェブページを開くと、キーワードを入力した後に検索を実行する利用可能な送信ボタンがないことが明らかです。
ワークフローを実行する際に、システムが自動的にEnterキーを押して検索するために、「Enterキーを押す」機能を設定する必要があります。
キーワードを入力するために検索ボックスをクリックします。
ワークフローに「テキストを入力」アクションが作成されます。
2. キーワードをパラメータとして新しいURLを生成する
いくつかのウェブサイトでは、検索されたキーワードをURLのパラメータとして使用し、新しいURLを構築しています。例えば、あるサイトのホームドメインhttps://www.allaboutincontinence.co.uk/ ですが、
下記のキーワードを検索した場合: id-for-men-level-3、検索結果のURLは以下のようになります。https://www.allaboutincontinence.co.uk/id-for-men-level-3
このURLからワークフローを設定でき、ホームページに送信ボタンがない場合の問題を回避できます。テキストの入力とボタンのクリックが不要なので、スクレイピング時間も節約できます。
ヒント:キーワードリストから一括でURLリストを生成する場合は、「一括URL生成」機能を使用できます。