こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
ユーザーがテキストやボタンをクリックすると表示されるリスト形式のメニューをドロップダウンメニューと呼びます。ウェブサイトでは選択肢を提供するためによく使われています。
場合によっては、ドロップダウンの選択項目自体を個別のデータフィールドとしてスクレイピングしたい場面があると思います。例えば、ドロップダウンにカテゴリー情報が含まれている場合などです。この記事では、ドロップダウンリストからデータを取り出す様々な方法を簡単に紹介します。
ご注意:ドロップダウンメニューのオプションを切り替えて、対応するページデータを抽出する方法はこのチュートリアルをご参照ください。
Octoparseでは、ウェブページ上の他のデータフィールドと同じようにドロップダウンの値を直接スクレイピングするか、ループアイテムからスクレイピングするかの2通りの方法があります。
1. ウェブページ上の他のデータフィールドと同じように直接選択項目の値をスクレイピングする
この方法を説明するために、イープラスのドロップダウンリストを例にします。
Octoparseでドロップダウンメニューボックスをクリックします。
「ドロップダウンメニューを切り替える」を選択して、ドロップダウンスイッチループを設定します。
再びドロップダウンメニューボックスをクリックします。
「テキスト」を選択します。
「ループ内のアイテムを抽出する」のチェックを外し、「保存」をクリックします。
ループリストのオプションを繰り返し、「データを抽出」をクリックして、データプレビューセクションに選択したドロップダウンのデータが表示されるか確認できます。
2. ループアイテムを使って選択項目のデータをスクレイピングする
選択してもデータが変わらない場合は、ループアイテムを使って選択したデータをスクレイピングする必要があります。
ドロップダウンメニューボックスをクリックして、ドロップダウンスイッチループを設定します。
ループ内に「データを抽出」アクションを追加します。
「ループ内のアイテムを抽出する」にチェックを入れ、「保存」をクリックします。
ドロップダウンメニューをクリックし、SELECTタグをクリックしてから、最初のOPTIONを選択します。
「テキスト」を選択します。
ループの異なるオプションを切り替えて、データプレビュー画面で対応するようにデータが変わるかを確認できます。