크롤러의 추출 속도는 페이지 로딩 속도의 영향을 받습니다. 배너, 팝업 등 웹 페이지에 예상치 못한 광고가 많이 나타나면 페이지가 느리게 로딩되어 시간을 낭비하게 됩니다. 광고 차단을 통해 페이지 요청을 줄이면 로딩 시간을 짧게 할 수 있습니다.
그렇다면 Octoparse는 광고를 어떻게 차단할 수 있을까요? 이 문제를 해결할 수 있는 두 가지 솔루션에 대해 알려드리겠습니다.
솔루션 1: 워크플로우의 광고 차단
솔루션 2: 작업 설정에서 광고 차단
실행 설정으로 이동합니다.
팝업 광고 차단 클릭합니다.
저장을 클릭합니다.
참고:
광고 차단 기술을 사용하면 일부 웹 페이지의 구조가 변경될 수 있습니다. 이런 경우에는 XPath를 조정하십시오. (XPath에 대한 자세한 내용은 XPath의 정의 및 Octoparse에서 사용하는 방법을 확인하십시오.)
광고 차단을 사용하면 페이지 로딩 문제가 발생할 수 있습니다. 예를 들어 페이지를 로딩할 수 없는 등 페이지 로드가 부적절한 경우에는 광고 차단을 선택하지 마십시오.