메인 콘텐츠로 건너뛰기

페이지 넘기기("더 보기")

최소 1년 전에 업데이트됨

많은 웹 사이트에서는 콘텐츠를 계속 로드하기 위해 "더 로드" 또는 "더 보기" 버튼을 사용합니다.

46.png

"다음" 버튼과는 달리 "더 보기" 버튼은 하나의 웹 페이지에서 많은 콘텐츠를 계속 로드하여 크롤링이 더 까다롭습니다. 이 튜토리얼에서는 Octoparse에서 "더 보기" 버튼을 처리하는 방법을 보여드리겠습니다.

예시 링크:


1. 자동 인식 기능을 사용하여 "더 보기" 버튼을 처리합니다.

  • 자동 인식 프로세스를 시작하면 팁 패널에서 "더 보기" 버튼을 클릭하는 옵션이 표시됩니다.

  • Check(체크)를 클릭하여 Load more(더 보기) 버튼이 제대로 선택되었는지 확인합니다. 그렇지 않은 경우 Edit(편집)을 클릭하여 더 보기 버튼을 선택할 수 있습니다.

check_and_edit.gif
  • Edit(편집)을 클릭하여 클릭 횟수를 설정합니다. 이 횟수는 Load More(더 보기) 버튼을 클릭할 횟수입니다.

2.png
  • 워크플로우 생성을 클릭하여 설정을 생성합니다.

워크플로우는 아래 그림과 같아야 합니다.

mceclip0.png

2. 수동으로 페이지 작성 작업

  • 웹 페이지에서 "더 보기" 버튼을 선택하고 Loop click single element(단일 요소 루프 클릭)를 선택합니다.

  • 적절한 AJAX 타임아웃 설정(AJAX란?)

__5.gif

팁:

1. "더 보기" 버튼을 n번 클릭하려면 페이지 넘기기 블록을 클릭하고 "반복"을 선택한 다음 반복을 n번으로 설정합니다.

113.png

2. 스크래핑 중에 작업이 중복되는 경우, Octoparse가 모든 아이템을 로드한 후 스크래핑을 시작하도록 루프 아이템 절차를 페이지 넘기기 절차 뒤로 끌어낼 수 있습니다.

drag.gif


답변이 도움되었나요?