こちらは最新バージョンのOctoparse向けのチュートリアルガイドです。お使いのOctoparseが古いバージョンの場合は、最新バージョンへのアップグレードを強くおすすめします。最新バージョンは高速で、より使いやすく、強力になりました。まだアップグレードしていない場合は、こちらからダウンロードとアップグレードを行ってくださ
い。
TikTok(ティックトック)は、人気のある短い動画共有アプリです。ユーザーは様々なジャンルの短い動画を作成し、共有することができます。ダンス、コメディ、挑戦など、様々なコンテンツがあります。若者を中心に広く使われ、世界中の人々に楽しみとインスピレーションを与えています。
このチュートリアルでは、Octoparseの自動検出機能を使用して、TikTokから動画情報をわずか3つのステップでスクレイピングする方法を紹介します。
以下のURLは、例として使用するTikTokのトレンド動画リンクです。バックミュージック、ユーザー名、ユーザーのURL、ユーザーのニックネーム、いいね数、コメント数などの情報を抽出する方法についてご説明します。
主な手順は右側のメニューに表示されています。こちらからサンプルタスクをダウンロードできます。
1. 「ウェブページを開く」- ターゲットのウェブサイトを開く
ホームページの検索ボックスにURLを入力して、タスクを作成します。
隣にあるスタートボタンをクリックして次に進んでください。
ヒント:ウェブページを読み込んだ後にcaptchaが表示された場合は、ブラウザモードをオンにしてcaptchaを手動で解決してください。
もしログインのポップアップが表示された場合は、閉じるボタンをクリックして、選択した要素をクリックするを選択します。
2. ウェブページのデータを自動検出 - ワークフローを作成する
ウェブページのデータを自動検出をクリックして、完了するまで待ちます。
動画が多い場合は、時間がかかることがあります。
自動検出で選択されたデータを確認する必要があります。
データプレビューに移動して、現在のデータ出力が正しいかどうかを確認します。
ページスをクロールをクリックして、ページの一番下までスクロールし、20回スクロールして、各スクロールごとに1秒待機するように設定します(より多くの動画を取得したい場合は、繰り返し回数を増やします)。
3. タスクを実行 -ご希望のデータを取得する
以下は、サンプルデータです。