메인 콘텐츠로 건너뛰기

페이지 스크롤 설정

최소 10달 전에 업데이트됨

일부 웹사이트(예: 전자상거래)는 추가 콘텐츠를 로드하기 위해 페이지 하단까지 스크롤해야 합니다. 이 경우 페이지 스크롤 다운을 설정하여 페이지가 Octoparse로 자동으로 스크롤되도록 할 수 있습니다. 이는 특히 무한 스크롤링이나 레이지 로딩을 사용하는 웹 페이지를 추출하는 데 유용합니다.


1. 웹 페이지로 이동 동작 또는 아이템 클릭 동작에 대한 스크롤 설정

  • 웹 페이지로 이동(또는 아이템 클릭 )을 클릭하여 설정 메뉴에 액세스합니다. 옵션 탭으로 이동합니다.

옵션.jpg
  • 페이지 스크롤 다운을 설정하려면 페이지가 로드된 후 스크롤 옵션을 선택하십시오.

2.png
  • 스크롤 영역을 선택하세요.

4.png

디폴트(Default) : Octoparse는 웹 페이지 전체를 아래로 스크롤합니다.

부분(Partial) : 일부 웹사이트는 Google 지도 리뷰 와 같이 스크롤을 하나만 포함하지 않을 수 있습니다 . 필요한 정확한 영역을 찾으려면 부분을 선택하고 해당 영역에 대한 정확한 XPath를 입력할 수 있습니다.

팁: 이 부분 스크롤 기능을 사용하는 방법에 대한 이 튜토리얼을 확인할 수 있습니다: 웹 페이지의 지정된 영역 내에서 스크롤하기

  • 페이지를 어떻게 아래로 스크롤할지 선택하세요.
    아래로 스크롤하는 방법에는 두 가지가 있습니다. 페이지 맨 아래로 스크롤 하거나 한 화면에서 스크롤입니다.

7.png

페이지 맨 아래로 스크롤: Octoparse는 페이지 중간에서 멈추지 않고 바로 페이지 맨 밑까지 스크롤합니다. Google Play 리뷰처럼 페이지 맨 끝에 도달했을 때만 요소가 로드되는 경우 이 옵션을 사용해야 합니다 .

한 화면 스크롤 : Octoparse는 한 번에 한 화면만 스크롤합니다. 페이지를 아래로 스크롤할 때 페이지가 콘텐츠를 조금씩 더 로드하는 경우 이 옵션을 사용하세요.

한 화면 스크롤은 모든 웹사이트에 사용할 수 있지만 페이지 맨 아래로 스크롤은 특정 웹사이트에서만 사용할 수 있습니다. 먼저 페이지를 수동으로 스크롤하여 옵션을 테스트한 다음 대상 웹 페이지에 가장 적합한 옵션을 선택하는 것이 좋습니다.

  • 대기 시간 스크롤 시간 설정

5.png

두 스크롤 동작 사이에 적절한 대기 시간을 선택하세요 . 로드하는 데 시간이 오래 걸리는 페이지에는 더 긴 대기 시간을 선택할 수 있습니다.

다음으로 스크롤 횟수를 입력합니다 . 이는 스크롤을 반복하고 싶은 횟수입니다(즉, 스크롤 횟수). 다시 말하지만, 모든 필수 정보를 로드하는 데 필요한 스크롤 횟수를 알아내기 위해 대상 웹 페이지를 먼저 수동으로 스크롤하여 대략적인 스크롤 횟수를 정해야 합니다.


2. 루프 아이템으로 스크롤 설정

  • 워크플로우에 루프 아이템 추가

추가_스크롤.jpg
  • 스크롤 페이지를 루프 모드로 선택하세요

루프모드.jpg
  • 위에서 보여준 것처럼 스크롤 옵션을 설정하세요

스크롤_옵션.jpg
답변이 도움되었나요?