"부분 스크롤"이란 무엇입니까?
대부분의 경우, 오른쪽에 있는 기본 스크롤바를 사용하여 전체 페이지를 스크롤해야 합니다. 이러한 페이지의 경우 기본 스크롤 방법이 잘 작동합니다.
하지만 리뷰나 게시물 페이지처럼 디자인이 다른 페이지도 있습니다.
예를 들어 Google Maps 리뷰 페이지를 살펴보겠습니다. https://www.google.com/maps/place/The+Schoolhouse/@51.4374112,-1.0878661,9.7z/data=!4m10!1m2!2m1!1srestaurants+in+london!3m6!1s0x4876058fd98fc091:0xbf1c07755166b551!8m2!3d51.4604646!4d-0.1757991!9m1!1b1
리뷰는 웹 페이지의 왼쪽 부분에 표시되며, 이 부분에는 스크롤 바가 있습니다. 이 바를 아래로 끌면 리뷰 부분이 아래로 스크롤되어 더 많은 리뷰를 로드합니다. 그러나 페이지의 다른 부분은 스크롤되지 않는다는 것을 알 수 있습니다.
리뷰 부분을 스크롤하려면 Octoparse에서 부분 스크롤 단계를 설정해야 합니다 .
Octoparse에서 부분 스크롤을 설정하는 방법은 무엇입니까?
설정 방법은 두 가지가 있습니다.
1. 웹 페이지로 이동/아이템 클릭에 대한 스크롤 동작 추가
(먼저 스크롤하여 로딩을 완료한 다음 데이터를 추출합니다)
예를 들어 웹 페이지로 이동해 보겠습니다 .
웹 페이지로 이동을 클릭하세요
옵션 탭 으로 이동
페이지가 로드된 후 맨 밑으로 스크롤 하세요
스크롤 영역 에서 부분 선택
XPath 입력 상자 오른쪽에 있는 버튼을 클릭하여 스크롤 영역을 선택합니다. 그러면 XPath가 자동으로 생성되고 이 작업에 스크롤할 위치를 알려줍니다.
적용하기 클릭
2. 루프 아이템에 대한 스크롤 설정 (스크롤과 추출을 동시에 진행)
워크플로우에 루프 아이템 단계 추가
루프 아이템을 클릭하고 루프 모드를 스크롤 페이지로 전환합니다.
스크롤 영역에서 부분 선택
스크롤 영역을 선택하려면 XPath 입력 상자 오른쪽에 있는 버튼을 클릭하세요.
적용하기 클릭
자동 생성된 XPath가 제대로 작동하지 않으면?
이런 경우, 선택한 스크롤 영역을 찾는 새로운 XPath를 작성해 볼 수 있습니다.
방법은 다음과 같습니다.
이 웹 페이지의 소스 코드를 검사하려면 스크롤 바를 우클릭하세요.
스크롤 영역과 일치하는 코드를 찾으세요
코드를 복사하고 해당 XPath를 작성하세요.
이 경우 XPath는 다음과 같아야 합니다.
//div[@class="m6QErb DxyBCb kA9KIf dS8AEf XiKgde "]
Octoparse에서 XPath 업데이트
참고 : 작성한 XPath가 작동하지 않는 경우, 스크롤 영역과 일치하도록 몇 가지 변형을 더 만들어 보고 선택한 영역이 스크롤 가능한지 확인하세요.
XPath에 대한 자세한 내용을 알아보려면 다음 튜토리얼을 확인하세요: XPath란 무엇이며 Octoparse에서 사용하는 방법