メインコンテンツにスキップ

URLリストの更新方法

1年以上前に更新

こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってください。

タスクでスクレイピングが完了した後、同様の別URLからデータを取得する場合は、タスクのURLリストを更新したいと思うことでしょう。この記事では、タスクのURLリストを更新する方法を説明します。


1. 単一URLの更新

タスクに起点URLが1つ(ループURLがない場合)のときは、以下の手順でURLを更新できます。

  • ワークフロー上の「Webページを開く」をクリックし、URLボックスに新しいURLを貼り付けます。

  • 「保存」をクリックして保存します。


2. 複数URLの更新

Octoparseでは、同一ウェブページレイアウトのリストURLをループする機能があります。全URLが同一ドメインからのものであることがループURLアクションの前提条件なので、それを守る必要があります。そうしないとOctoparseはURLを認識できず、抽出処理を行いません。

  • URLリスト」を選択し、編集ボタンをクリックします。

  • 新たなURLリストをコピー&ペーストし、「保存」をクリックします。

または、ビルトインブラウザ上部の「抽出するURLを設定」ボタンをクリックします。

この方法でURLリストが更新されます。他にもURLの一括インポートの方法があります。


3. APIを使ったURL更新

Professionalプランやエンタープライズソリューションを利用している場合は、OctoparseのOpen APIにアクセスできます。これを使ってOctoparseソフトを開くことなく自動でURLを更新できます。

こちらの回答で解決しましたか?