틱톡(TikTok)은 현재 트렌디하고 다양한 짤막한 비디오 클립을 제공하는 매우 핫한 비디오 중심의 소셜 네트워킹 애플리케이션입니다.
이번 튜토리얼에서는 Octoparse 자동 인식 기능을 통해 틱톡에서 유행하는 동영상 정보를 3단계로 긁어내는 방법을 알려드립니다.
아래 URL은 저희가 예시로 사용할 틱톡 트렌딩 동영상 링크입니다. 예를 들어 배경음악, 작성자 URL, 작성자 ID, 작성자 이름, 좋아요, 댓글을 추출하는 단계를 보여줍니다.
샘플 URL: https://www.tiktok.com/foryou
주요 단계는 오른쪽 메뉴에 나와 있습니다. [데모 작업 다운로드]
1. "웹 페이지로 이동" - 대상 웹 사이트로 이동
홈페이지 검색창에 URL을 입력하여 작업 생성
시작 버튼을 클릭하여 계속합니다.
팁: 웹 페이지를 로드한 후 캡차가 나오면 브라우저 모드로 전환하여 캡차를 수동으로 해결하십시오.
2. 웹 페이지 데이터 자동 탐지 - 워크플로우 작성
웹 페이지 데이터 자동 인식을 클릭하고 완료될 때까지 기다립니다.
동영상이 많으면 시간이 오래 걸릴 수 있습니다.
자동 인식으로 선택된 데이터를 검사해야 합니다.
페이지 스크롤 추가 아래에 있는 편집을 클릭하여 페이지 하단까지 스크롤하고 20회 스크롤하고 스크롤 할 때마다 1초씩 대기하게 설정합니다(동영상을 추가하려면 반복 횟수를 더 설정할 수 있습니다).
"더 보기" 버튼 해제
설정 확인
워크플로우 생성을 클릭합니다.
3. 작업 실행 - 원하는 데이터 가져오기
저장을 클릭하고 오른쪽 상단에서 실행을 클릭합니다.
데이터 추출 결과는 다음과 같습니다.