"부분 스크롤"이란 무엇인가요?
대부분의 페이지에서 스크롤은 오른쪽에 있는 기본 스크롤바를 이용하여 전체 페이지를 스크롤합니다. 이러한 페이지의 경우 기본 스크롤 방식이 잘 작동합니다.
하지만 리뷰나 게시물 페이지처럼 별도로 설계된 영역만 스크롤되는 페이지도 있습니다.
예를 들어 Google 지도 리뷰 페이지를 살펴보겠습니다: https://www.google.com/maps/place/The+Schoolhouse/@51.4374112,-1.0878661,9.7z/data=!4m10!1m2!2m1!1srestaurants+in+london!3m6!1s0x4876058fd98fc091:0xbf1c07755166b551!8m2!3d51.4604646!4d-0.1757991!9m1!1b1
리뷰는 웹 페이지의 왼쪽 부분에 표시되며, 이 부분에 별도의 스크롤바가 있습니다. 이 스크롤바를 아래로 내리면 리뷰 영역만 아래로 이동하며 더 많은 리뷰가 로드됩니다. 하지만 다른 영역은 스크롤되지 않는 것을 볼 수 있습니다.
이처럼 특정 영역만 스크롤해야 할 때는 Octoparse에서 ‘부분 스크롤’ 단계를 설정해야 합니다.
Octoparse에서 부분 스크롤 설정 방법
부분 스크롤은 두 가지 방식으로 설정할 수 있습니다.
1. "웹 페이지로 이동" 또는 "아이템 클릭"단계에 스크롤 동작 추가하기
(스크롤 후 로드 완료 → 데이터 추출)
예를 들어 웹 페이지로 이동 단계에서 설정합니다.
웹 페이지로 이동 클릭
옵션 탭으로 이동
페이지 로딩 후 밑으로 스크롤 옵션 체크
스크롤 영역을 부분으로 선택
XPath 입력창 오른쪽의 버튼을 클릭하여 스크롤 영역 선택
선택 시 자동으로 XPath가 생성되어 Octoparse가 스크롤할 위치를 인식합니다.
적용 클릭
2. "루프 아이템" 단계에서 스크롤 설정하기 (스크롤과 추출을 동시에 수행)
워크플로우에 루프 아이템 단계 추가
루프 아이템을 클릭하고 루프 모드를 스크롤로 변경
스크롤 영역을 부분으로 선택
XPath 입력창 오른쪽 버튼을 클릭해 스크롤 영역 선택
적용 클릭
자동 생성된 XPath가 작동하지 않을 경우
자동 XPath가 정상 작동하지 않는다면, 직접 XPath를 새로 작성해 스크롤 영역을 지정할 수 있습니다.
방법은 다음과 같습니다.
스크롤바 위에서 오른쪽 클릭하여 Inspect 선택
웹페이지의 HTML 소스코드에서 스크롤 영역에 해당하는 요소 찾기
참고 : 작성한 XPath가 작동하지 않는 경우, 직접 XPath를 수정하거나 새로 작성해야 합니다.
XPath 작성법에 대한 자세한 내용은 다음 튜토리얼을 참고하세요: XPath란 무엇이며 Octoparse에서 사용하는 방법