こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってくださ
い。
世界で2番目に人気のある検索エンジンは、Googleに次いでYouTubeです。YouTubeでは多数の動画が利用可能であり、それらに関連するデータやコメントは非常に価値があります。
Octoparseを使用すると、事前に作成されたテンプレートで簡単にYouTubeをスクレイピングできます。こちらから確認してみてください:テンプレートタスク。キーワード/URLを入力するだけで、数分でデータを抽出できます!
このチュートリアルでは、Octoparseの自動検出機能を使用して、YouTubeから人気急上昇動画の情報をわずか3つのステップでスクレイピングする方法をご紹介します。
以下のYouTubeのトレンド動画リンクを例として使用します。
https://www.youtube.com/feed/trending?gl=JP
主な手順は右側のメニューに表示されており、サンプルのタスクファイルはこちらからダウンロードできます。
1. 「ウェブページを開く」- ターゲットのウェブサイトを開く
ホームページの検索ボックスにURLを入力してタスクを作成します。
近くの「スタート」ボタンをクリックして次に進んでください。
2. ウェブページのデータを自動検出 - ワークフローを作成する
自動検出が完了した後、すべての動画が選択されたことを確認するために検出結果を切り替えるをクリックする必要がある場合があります。
データプレビューに移動して、不要なフィールドを削除します。
スクロールダウンを設定するの下の編集をクリックして、ページの一番下までスクロールするように設定します。
回数を20回に設定します(より多くの動画を取得するために必要に応じて繰り返し回数を増やすことができます)。
設定を確認し保存を選択します。
ワークフローを生成をクリックします。
3. タスクを実行 -ご希望のデータを取得する
以下は、サンプルデータです。