메인 콘텐츠로 건너뛰기

틱톡 동영상 리스트 스크래핑하기

최소 1년 전에 업데이트됨

틱톡(TikTok)은 현재 트렌디하고 다양한 짤막한 비디오 클립을 제공하는 매우 핫한 비디오 중심의 소셜 네트워킹 애플리케이션입니다.

이번 튜토리얼에서는 Octoparse 자동 인식 기능을 통해 틱톡에서 유행하는 동영상 정보를 3단계로 긁어내는 방법을 알려드립니다.

아래 URL은 저희가 예시로 사용할 틱톡 트렌딩 동영상 링크입니다. 예를 들어 배경음악, 작성자 URL, 작성자 ID, 작성자 이름, 좋아요, 댓글을 추출하는 단계를 보여줍니다.

주요 단계는 오른쪽 메뉴에 나와 있습니다. [데모 작업 다운로드]


1. "웹 페이지로 이동" - 대상 웹 사이트로 이동

  • 홈페이지 검색창에 URL을 입력하여 작업 생성

  • 시작 버튼을 클릭하여 계속합니다.

: 웹 페이지를 로드한 후 캡차가 나오면 브라우저 모드로 전환하여 캡차를 수동으로 해결하십시오.

mceclip1.png
  • 로그인 팝업이 뜨면 닫기 버튼을 클릭하고 클릭 요소를 선택하여 닫을 수 있습니다.


2. 웹 페이지 데이터 자동 탐지 - 워크플로우 작성

  • 웹 페이지 데이터 자동 인식을 클릭하고 완료될 때까지 기다립니다.

    동영상이 많으면 시간이 오래 걸릴 수 있습니다.

mceclip1.gif

자동 인식으로 선택된 데이터를 검사해야 합니다.

  • 데이터 미리보기로 이동하여 현재 데이터 출력에 문제가 없는지 확인합니다.

    • 삭제 아이콘을 클릭하여 불필요한 데이터 필드 직접 삭제

      mceclip13.png
    • 데이터 타이틀을 더블 클릭하여 데이터 필드 이름 수정

mceclip2.gif
  • 페이지 스크롤 추가 아래에 있는 편집을 클릭하여 페이지 하단까지 스크롤하고 20회 스크롤하고 스크롤 할 때마다 1초씩 대기하게 설정합니다(동영상을 추가하려면 반복 횟수를 더 설정할 수 있습니다).

  • "더 보기" 버튼 해제

  • 설정 확인

  • 워크플로우 생성을 클릭합니다.


3. 작업 실행 - 원하는 데이터 가져오기

  • 저장을 클릭하고 오른쪽 상단에서 실행을 클릭합니다.

  • 컴퓨터에서 작업을 실행하려면 디바이스에서 실행을 선택하거나 클라우드에서 작업을 실행하려면 클라우드에서 실행을 선택합니다(프리미엄 사용자에 한함).

데이터 추출 결과는 다음과 같습니다.

mceclip3.png
답변이 도움되었나요?