こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。
タスクでスクレイピングが完了した後、同様の別URLからデータを取得する場合は、タスクのURLリストを更新したいと思うことでしょう。この記事では、タスクのURLリストを更新する方法を説明します。
1. 単一URLの更新
タスクに起点URLが1つ(ループURLがない場合)のときは、以下の手順でURLを更新できます。
ワークフロー上の「Webページを開く」をクリックし、URLボックスに新しいURLを貼り付けます。
「保存」をクリックして保存します。
2. 複数URLの更新
Octoparseでは、同一ウェブページレイアウトのリストURLをループする機能があります。全URLが同一ドメインからのものであることがループURLアクションの前提条件なので、それを守る必要があります。そうしないとOctoparseはURLを認識できず、抽出処理を行いません。
「URLリスト」を選択し、編集ボタンをクリックします。
または、ビルトインブラウザ上部の「抽出するURLを設定」ボタンをクリックします。
この方法でURLリストが更新されます。他にもURLの一括インポートの方法があります。
3. APIを使ったURL更新
Professionalプランやエンタープライズソリューションを利用している場合は、OctoparseのOpen APIにアクセスできます。これを使ってOctoparseソフトを開くことなく自動でURLを更新できます。