전자상거래 데이터를 수집하다 보면 제품마다 다양한 옵션(예: 사이즈, 색상 등)이 있어 각 옵션별로 가격, SKU 등을 따로 수집해야 하는 경우가 많습니다.
예를 들어, 아래의 샴푸 제품처럼 용량(사이즈)이 다를 때마다 가격이 달라지는 경우가 있습니다.
이 튜토리얼에서는 Octoparse를 사용하여 제품의 다양한 옵션 정보를 수집하는 방법을 보여드리겠습니다.
예시로 사용할 웹페이지는 다음과 같습니다:
이 제품은 옵션을 변경할 때마다 색상, 가격, 이미지, 평점, 제품 설명 등이 달라집니다.
작업의 주요 단계들이 오른쪽 메뉴에 정리되어 있으며 데모 작업 파일도 다운로드할 수 있습니다.
1. 웹페이지로 이동 만들기 — 대상 웹페이지 열기
홈 화면에서 URL을 입력하고 시작을 클릭합니다.
2. 루프 아이템 만들기 — 각 옵션 반복하도록 설정하기
요소 루프 클릭을 선택합니다.
No를 선택합니다.
그다음 AJAX 타임아웃을 설정합니다.(AJAX에 대한 자세한 내용은 AJAX 문서를 참고하세요).
(선택 사항)루프 아이템을 클릭하여 루프 모드를 고정 리스트에서 가변 리스트로 변경합니다.
그다음 아래의 XPath를 입력합니다:
//li[contains(@class, "product-variant-swatch")]
팁:
위 XPath는 본 튜토리얼의 예시 페이지에서만 적용된 점 주의하세요.
실제 사이트에서는 해당 페이지에 맞는 XPath를 직접 작성해야 합니다. 자세한 내용은 XPath 정의 및 Octoparse에서 XPath 사용 방법 튜토리얼을 참고하세요.
3. 데이터 추출 — 제품 관련 데이터 추출하기
최종 워크플로우는 다음과 같습니다:
4. 작업 실행 — 데이터 추출 실행하기
저장 및 실행을 클릭합니다.