概要
ソーシャルメディアデータ分析において、「誰があるトピックについて話しているか」と「何を話しているか」の両方を把握することは、同様に重要な側面です。Octoparseは、この2つのニーズに対応するTwitterクラウドテンプレートを提供しています:
Twitter高度検索コメントスクレイパー — 特定の検索条件に一致するツイートのコンテンツを収集する
Twitterユーザー検索スクレイパー — トピックの議論に参加しているユーザーの基本的なプロフィール情報を取得する
従来、これら2つのタスクは個別に設定・実行し、その後手動で結果を統合する必要がありました。Octoparse MCP(Model Context Protocol)のバンドル機能を使用することで、自然言語の指示を使って1つのセッションで全体のワークフローを完結でき、効率を大幅に向上させることができます。
始める前に
このワークフローを使用する前に、以下をご確認ください:
MCP対応クライアント このワークフローを実行する前に、MCP対応クライアントを通じてOctoparseを接続する必要があります。
有料Octoparseアカウント このベストプラクティスで使用する両方のテンプレートには、有料のOctoparseアカウントが必要です。
十分なOctoparseクレジット タスクを実行する前に、特に複数の投稿者やアカウントをまとめてスクレイピングする場合は、アカウントに十分なクレジットがあることを確認してください。
Twitterテンプレート二つ
明確なターゲットトピックまたはハッシュタグ 開始前に、モニタリングしたいハッシュタグまたはトピックを準備してください。
重要
以下の場合、このワークフローは正常に動作しません:
MCPの接続が設定されていない場合
Octoparseアカウントがこれらのテンプレートをサポートしていない場合
アカウントのクレジットが不足している場合
テンプレート概要
ユースケース:インテントシグナルの発見 → 見込み客の特定 → リードプールの拡大
テンプレート A
Twitter高度検索コメントスクレイパー
このテンプレートを使用して、ターゲットトピックに関するリプライやコメントを収集し、強い関心や購買意向を示しているユーザーを特定します。
項目 | 詳細 |
テンプレート ID | 1838 |
実行モード | クラウドのみ |
料金 | $0.0006 / レコード |
主な機能 | 高度なクエリを使用してTwitter/Xの検索結果からリプライやコメントをスクレイピング。ツイートのテキスト、投稿者、タイムスタンプ、エンゲージメントデータを抽出 |
主な入力 | キーワード、ハッシュタグ、日付範囲、その他の高度な検索パラメーター |
出力フィールド | tweet_text, author, timestamp, likes, retweets, replies_count |
テンプレート B
Twitterユーザー検索スクレイパー
このテンプレートを使用して、初期シグナルユーザーから拡張し、アウトリーチやリード獲得のためのより幅広い類似ユーザーリストを構築します。
項目 | 詳細 |
テンプレート ID | 2146 |
実行モード | クラウドのみ |
料金 | $0.0003 / レコード |
主な機能 | Twitterの高度な検索の「People」タブからユーザープロフィールをスクレイピング。ユーザー名、ハンドル、自己紹介、ユーザータイプ、プロフィールURL、アバターURLを含む |
主な入力 | 検索キーワード(コメントテンプレートと一致するもの) |
出力フィールド | user_name, user_handle, bio, user_type, profile_url, avatar_url |
💡 プロのヒント — 3つのテンプレートバンドル:
さらに充実した分析のために、Twitter Scraper (by Keywords)(ID:288)をバンドルに追加してください。ツイートの本文全体(いいね、リツイート、メディアを含む)をわずか$0.0003/レコードで取得でき、Octoparseで135いいねを獲得した最も人気のあるTwitterテンプレートです。コメントスクレイパーとユーザースクレイパーと組み合わせることで、ツイート → リプライ → ユーザーという完全な360°ビューを1つのセッションで取得できます。
バンドルを使用する理由
各テンプレートを個別に実行することはすでに便利ですが、バンドルを使用することでさらなる効率化が実現します:
比較項目 | タスクを個別に実行 | MCP バンドル |
手順 | タスク作成 → 設定 → 開始 → 結果のダウンロード → 手動でマージ | 自然言語で一度指示するだけ → MCPが両タスクを自動開始 → 結果をまとめて返却 |
所要時間 | 線形: T1 + T2 | 最大並列(T1、T2同時実行) |
データの関連付け | キーワードで手動にデータを整合 | セッション内の共有コンテキストにより容易に合同分析が可能 |
エラーリスク | 手動ステップが多いほど設定ミスの可能性が高い | 統一されたパラメーター管理により一貫性を確保 |
主なユースケース
ユースケース1:ブランドセンチメントモニタリング
目的:Twitter上でのブランドに関する議論量を把握し、関連トピックを拡散しているユーザーの種類を特定する。
バンドル戦略:
コメントスクレイパー:ブランドに言及したツイートを収集し、センチメントと頻出キーワードを分析する
ユーザースクレイパー:活発なユーザーを特定し、KOL、メディア、一般ユーザーのいずれかを判断する
クロス分析:業界KOLが投稿した高エンゲージメントの投稿への対応を優先する
ユースケース2:競合分析
目的:競合他社のキーワードにおける議論の質とユーザープロフィールを比較する。
バンドル戦略:
各競合キーワードに対して並列バンドルタスクを作成する
コメントデータを使用してユーザーの課題と機能フィードバックを分析する
ユーザーデータを使用して競合他社間のコアユーザー層を比較する
ユースケース3:KOL発掘とパートナーシップ評価
目的:特定のトピック領域内で適切なKOLコラボレーション候補を見つける。
バンドル戦略:
ユーザースクレイパー:ターゲットトピックで活動中のユーザーリストを取得する
コメントスクレイパー:高エンゲージメントのコンテンツを取得する
両データセットを組み合わせて、コンテンツ品質が高くオーディエンスプロフィールが合致するKOLを絞り込む
# | ヒント | 説明 |
1 | キーワードを統一する | 両テンプレートで同一のキーワードを使用することで、データが同じソースから収集されることを保証し、信頼性の高いクロス分析が可能になります。 |
2 | 時間範囲パラメーターを合わせる | コメントスクレイパーは時間フィルタリングをサポートしています。2つのデータセット間の時間的なズレを避けるため、ユーザースクレイパーのデータウィンドウと合わせてください。 |
3 | まず小規模バッチでテストする | 大規模なスクレイピングの前に、50〜100レコードで設定を検証し、期待通りの出力が得られることを確認してクレジットの無駄遣いを防いでください。 |
4 | MCPセッション内で分析を行う | 会話の中で分析ニーズを直接説明し、MCPに初期データの相関分析を実行させてください。外部ツールへのエクスポートや処理は不要です。 |
5 | タスクIDを保存する | MCPが返したタスクIDを記録しておくことで、タスクを再実行(再課金)することなく、後でデータを再取得できます。 |
6 | アカウント残高を監視する | 両テンプレートはレコードごとに課金されます($0.0006と$0.0003)。バンドルタスクを同時実行する場合は、事前に合計使用量を見積もってください。 |
プロンプト例
🔍 テンプレートの利用可否を確認する
Twitterに関連するOctoparseテンプレートを検索し、テンプレートID 1838(Twitter高度検索コメントスクレイパー)とテンプレートID 2146(Twitterユーザー検索スクレイパー)が自分のアカウントで利用可能かを確認してください。実行モード、料金、必要なアカウントレベルを表示してください。
🚀 バンドルタスクを起動する(ブランドモニタリング)
以下の2つのOctoparseクラウドタスクを同時に実行してください:
Twitter高度検索コメントスクレイパー(テンプレートID 1838)、キーワード:「Tesla 2025」、過去7日間、最大200レコードTwitterユーザー検索スクレイパー(テンプレートID 2146)、同じキーワード:「Tesla 2025」、最大100レコード 両方が完了したら、各タスクで収集したレコード数を教えてください。
📊 タスクのステータスを確認する
先ほど起動した2つのタスクの現在の実行ステータスは何ですか?まだ実行中ですか、完了しましたか、それとも失敗しましたか?
📥 結果を取得してクロス分析する
両タスクが完了しました。コメントタスクから最初の100レコード、ユーザータスクから最初の50レコードを取得してください。その上で以下を教えてください:
ユーザーデータに含まれるユーザーの中で、コメントデータの投稿者としても登場するのは誰ですか?最もいいねが多いツイートトップ5は何で、誰が投稿しましたか?重複しているユーザーの中に、自己紹介に基づいて認証済みアカウントまたはKOLと判断できる人はいますか?
🔁 競合分析バンドル
4つのOctoparseクラウドタスクを同時に実行してください — 「OpenAI GPT-5」と「Google Gemini Ultra」の2つの競合キーワードそれぞれに対して、コメントスクレイプとユーザースクレイプを1つずつ。コメントにはテンプレートID 1838、ユーザーにはテンプレートID 2146を使用し、各タスクを100レコードに制限してください。4つすべてが完了したら、どちらのキーワードがより多くのエンゲージメントを生み出し、どちらがより多くの認証済みユーザーを集めたかを比較してください。
🧪 本番実行前の小規模テスト
大規模スクレイピングを実行する前に、キーワード「climate tech」、最大50レコードのみでテンプレートID 1838を使用したテストタスクを作成してください。本番バッチにコミットする前に、出力フィールドとデータ品質を確認したいと思います。
まとめ
Octoparse MCPのバンドル機能により、これまで複数の手動ステップが必要だったデータ収集プロセスが、1つの自然言語会話に集約されます。コンテンツとユーザーコンテキストの両方が重要なTwitterのようなソーシャルプラットフォームでは、Twitter高度検索コメントスクレイパーとTwitterユーザー検索スクレイパーを組み合わせることで、より短時間でリッチな多次元データの視点が得られます:
コンテンツ層:コメントデータを通じて議論の質とセンチメントを把握する
ユーザー層:ユーザー検索データを通じて参加者のアイデンティティ構成を把握する
クロス層:MCPセッション内で直接、二次元の予備的相関分析を実行する
🚀 さっそく始めましょう
AIクライアントにOctoparse MCPサーバーが設定されていれば、バンドルタスクの起動はひと言指示するだけです。コード不要、画面切り替え不要 — データ収集をそのまま分析ワークフローに組み込めます。
