Octoparseでは、クリックするだけでウェブページ内の要素にアクセスしたり選択したりできます。ページ内の要素をクリックすると、操作オプションが含まれた操作提案パネルが表示されます。しかし、多くのユーザーがリンクを選択した際にURLスクレイピングのオプションがない、というトラブルに直面しています。
Amazonからノイズキャンセリングヘッドホンの情報をスクレイピングするタスクを設定しようとします。ウェブサイトをOctoparseで開いた後、特定の商品のタイトルをクリックしたのに、その商品のリンクURLをスクレイピングするオプションが見つからない場合があります。
これは、ハイパーリンクは通常Aタグで定義されるため、この場合Octoparseがその要素をspanタグと認識し、テキストのみを取得しているからです。
ヒント:Aタグはリンク先を示すhref属性を持ち、他のページへのリンクを定義します。
解決法は難しくありません。操作提案パネルの下部のHTMLタグパスを確認し、Aタグをクリックして要素を変更します。
Aタグをクリックすると、操作提案パネルに選択リンクのURL抽出オプションが表示されます。
問題解決!タスク作成を続けましょう。