メインコンテンツにスキップ

Octoparseでローカル実行する方法

3週間以上前に更新

もしタスクに分割可能なループが含まれている場合、ポップアップ画面が表示され、高速モード通常モードの選択肢が表示されます。ローカルデバイスの性能がいい場合、ダッシュボード設定でデフォルトでローカル実行の高速モードを有効にすることをおすすめします。

タスクが分割不可能な場合、高速モードボタンは無効になります。


具体的には、Octoparseには3つの分割可能なループモードがあります。タスクを確認し、以下の3つのループタイプが含まれているかどうかを確認してください:

  1. URLリスト

  2. テキストリスト

  3. 定数リスト

もし含まれている場合、高速モードで実行することができます。Octoparseはタスク全体を複数のサブタスク(最大100個)に分割し、実際のタスクに応じて実行します。クラウドでのタスク分割とは異なり、Octoparseはローカルで同時に3つのサブタスクのみを実行します。そのため、ローカルデータ実行においては、高速モードは通常モードに比べて約3倍高速です。Octoparseは、ローカルデバイスが限界を超えないように、同時実行するローカルタスクの数を3に制限しています。

TIP: タスクを分割可能にするためのさまざまなヒントやトリックについては、この記事をご覧ください。


ローカルデータ抽出実行ウィンドウ

通常モード

既存のタスクを通常モードで開始すると、新しいローカルデータ実行ウィンドウが表示されます。

タスク実行情報


上部の灰色の領域には、タスクのステータス抽出されたデータの数重複データ実行時間平均速度などが表示されます。

一時停止/続行

さらに右側を見ると、タスクを完全に停止するオプションに加えて、ローカル実行タスクを一時停止/続行するためのボタンがあります。対象のウェブサイトで時折CAPTCHAの解決や情報の入力が必要な場合、タスクを一時停止して、ローカル実行のブラウザウィンドウを開いて手動で処理することができます。ただし、Octoparseはソフトウェアを閉じた場合、タスクを続行することはできませんのでご注意ください。

ブラウズ

ブラウザの表示アイコンをクリックすると、上部の灰色の領域がウェブビューに切り替わります。ウェブページの読み込み状況やタスクの実行プロセスを観察することができます。

タスク編集

タスク編集アイコンをクリックすると、タスクの編集インターフェースに戻ります。

下部の白い領域には、タスク概要データ詳細実行ログ実行履歴の4つの切り替え可能なタブでタスクの詳細が表示されます。

タスク概要

このタブは特定のデータ実行の概要です。起動時刻、完了時刻、重複削除後の件数、およびデータ実行中のCAPTCHA使用数と失敗リンクが表示されます。

データ詳細

このタブには、この特定のデータ実行から抽出されたすべてのデータがリストアップされています。

実行ログ

このタブには、特定のデータ実行からのすべてのログイベントがリストアップされます。すべてのログイベントを表示するか、エラーログのみを表示することができます。エラーログはタスクのトラブルシューティングに非常に役立ちます。ログをテキストファイルとしてエクスポートすることもできます。

実行履歴

このタブには各ローカルデータ実行の履歴が表示されます。右下には、タスクが停止または完了した後にローカル実行データを自動クラウドバックアップするためのオプションがあります(プロ以上のプランで利用可能)。オプションの列には、特定のデータを手動でバックアップ/エクスポートするか、すべてのデータを同時にバックアップ/エクスポートするかを選択することもできます。

Octoparseは現在、ローカル実行のデータをクラウドにバックアップする機能をサポートしています。プロプラン以上にご加入いただいている場合、タスクが停止または完了した後にローカル実行データを自動的にクラウドにバックアップするようにOctoparseを設定することができます。これは、APIを使用してローカルデータをデータベースに接続する場合に非常に役立ちます。


高速モード

高速モードでタスクを開始すると、新しいローカルデータ抽出実行ウィンドウのデフォルト画面は通常モードとは少し異なります。

タスクステータスの右側には、スピードアップアイコン、速度向上率(〇倍速い)の表示、および加速停止するボタンがあります。加速停止ボタンをクリックすると、Octoparseは3つの同時サブタスクを完了し、残りのサブタスクを1つずつ実行します。なお、一度停止すると、現在の実行に対して高速モードを再開することはできません。

下部の白い領域には、タスク概要、データ詳細、実行情報、実行履歴の4つの切り替え可能なタブでタスクの詳細が表示されます。タスク概要、データ詳細、実行履歴のタブは通常モードと同じですので、そちらは省略し、実行情報タブに焦点を当てて紹介します。

サブタスクステータ

  • このタブは、高速モードで実行されるタスクに表示されます。テーブル形式で、すべてのサブタスクの作成時間、起動時刻、完了時刻、実行時間、データ件数、実行状態を確認することができます。

  • サブタスクが実行完了とマークされた場合、そのデータの行にカーソルを合わせて実行ログを表示をクリックすると、ログが表示されます。

  • サブタスクが一時停止/実行中とマークされている場合、一時停止/続行するか、詳細を見るをクリックして詳細ページに移動することができます。その後、データ詳細実行ログのタブが表示される新しいウィンドウに移動します。

高速モードでサブタスクの詳細にすばやくアクセスするには、ブラウズアイコンをクリックします。クリックするとドロップダウンメニューが表示され、同時実行中のサブタスクから選択できます。

こちらの回答で解決しましたか?