일부 웹사이트(예: 전자상거래)는 추가 콘텐츠를 로드하기 위해 페이지 하단까지 스크롤해야 합니다. 이 경우 페이지 스크롤 다운을 설정하여 페이지가 Octoparse로 자동으로 스크롤되도록 할 수 있습니다. 이는 특히 무한 스크롤링이나 레이지 로딩을 사용하는 웹 페이지를 추출하는 데 유용합니다.
1. 웹 페이지로 이동 동작 또는 아이템 클릭 동작에 대한 스크롤 설정
웹 페이지로 이동(또는 아이템 클릭 )을 클릭하여 설정 메뉴에 액세스합니다. 옵션 탭으로 이동합니다.
페이지 스크롤 다운을 설정하려면 페이지가 로드된 후 스크롤 옵션을 선택하십시오.
스크롤 영역을 선택하세요.
디폴트(Default) : Octoparse는 웹 페이지 전체를 아래로 스크롤합니다.
부분(Partial) : 일부 웹사이트는 Google 지도 리뷰 와 같이 스크롤을 하나만 포함하지 않을 수 있습니다 . 필요한 정확한 영역을 찾으려면 부분을 선택하고 해당 영역에 대한 정확한 XPath를 입력할 수 있습니다.
팁: 이 부분 스크롤 기능을 사용하는 방법에 대한 이 튜토리얼을 확인할 수 있습니다: 웹 페이지의 지정된 영역 내에서 스크롤하기
페이지를 어떻게 아래로 스크롤할지 선택하세요.
아래로 스크롤하는 방법에는 두 가지가 있습니다. 페이지 맨 아래로 스크롤 하거나 한 화면에서 스크롤입니다.
페이지 맨 아래로 스크롤: Octoparse는 페이지 중간에서 멈추지 않고 바로 페이지 맨 밑까지 스크롤합니다. Google Play 리뷰처럼 페이지 맨 끝에 도달했을 때만 요소가 로드되는 경우 이 옵션을 사용해야 합니다 .
한 화면 스크롤 : Octoparse는 한 번에 한 화면만 스크롤합니다. 페이지를 아래로 스크롤할 때 페이지가 콘텐츠를 조금씩 더 로드하는 경우 이 옵션을 사용하세요.
한 화면 스크롤은 모든 웹사이트에 사용할 수 있지만 페이지 맨 아래로 스크롤은 특정 웹사이트에서만 사용할 수 있습니다. 먼저 페이지를 수동으로 스크롤하여 옵션을 테스트한 다음 대상 웹 페이지에 가장 적합한 옵션을 선택하는 것이 좋습니다.
대기 시간 및 스크롤 시간 설정
두 스크롤 동작 사이에 적절한 대기 시간을 선택하세요 . 로드하는 데 시간이 오래 걸리는 페이지에는 더 긴 대기 시간을 선택할 수 있습니다.
다음으로 스크롤 횟수를 입력합니다 . 이는 스크롤을 반복하고 싶은 횟수입니다(즉, 스크롤 횟수). 다시 말하지만, 모든 필수 정보를 로드하는 데 필요한 스크롤 횟수를 알아내기 위해 대상 웹 페이지를 먼저 수동으로 스크롤하여 대략적인 스크롤 횟수를 정해야 합니다.
2. 루프 아이템으로 스크롤 설정
워크플로우에 루프 아이템 추가
스크롤 페이지를 루프 모드로 선택하세요
위에서 보여준 것처럼 스크롤 옵션을 설정하세요