메인 콘텐츠로 건너뛰기

옵션별 제품 스크래핑하는 방법

이 튜토리얼에서는 제품 옵션 데이터를 스크래핑하는 방법을 배워봅니다.

이번 주에 업데이트함

전자상거래 데이터를 수집하다 보면 제품마다 다양한 옵션(예: 사이즈, 색상 등)이 있어 각 옵션별로 가격, SKU 등을 따로 수집해야 하는 경우가 많습니다.

예를 들어, 아래의 샴푸 제품처럼 용량(사이즈)이 다를 때마다 가격이 달라지는 경우가 있습니다.

이 튜토리얼에서는 Octoparse를 사용하여 제품의 다양한 옵션 정보를 수집하는 방법을 보여드리겠습니다.


예시로 사용할 웹페이지는 다음과 같습니다:

이 제품은 옵션을 변경할 때마다 색상, 가격, 이미지, 평점, 제품 설명 등이 달라집니다.

작업의 주요 단계들이 오른쪽 메뉴에 정리되어 있으며 데모 작업 파일도 다운로드할 수 있습니다.


1. 웹페이지로 이동 만들기 — 대상 웹페이지 열기

  • 홈 화면에서 URL을 입력하고 시작을 클릭합니다.


2. 루프 아이템 만들기 — 각 옵션 반복하도록 설정하기

  • 목록에서 첫 번째 사이즈 옵션을 클릭한 후 오른쪽 팁 패널에서 전체 비슷한 요소 선택하기를 클릭합니다.

  • 요소 루프 클릭을 선택합니다.

  • No를 선택합니다.

  • 그다음 AJAX 타임아웃을 설정합니다.(AJAX에 대한 자세한 내용은 AJAX 문서를 참고하세요).

  • 새 탭에서 열기 옵션이 꺼져 있는지 확인하고 적용 클릭하여 저장합니다.

  • (선택 사항)루프 아이템을 클릭하여 루프 모드고정 리스트에서 가변 리스트로 변경합니다.

  • 그다음 아래의 XPath를 입력합니다:

 //li[contains(@class, "product-variant-swatch")]
  • 적용 버튼을 클릭해 저장합니다.

팁:

위 XPath는 본 튜토리얼의 예시 페이지에서만 적용된 점 주의하세요.
실제 사이트에서는 해당 페이지에 맞는 XPath를 직접 작성해야 합니다. 자세한 내용은 XPath 정의 및 Octoparse에서 XPath 사용 방법 튜토리얼을 참고하세요.


3. 데이터 추출 — 제품 관련 데이터 추출하기

  • 아이템 클릭을 선택해 세부 페이지로 이동합니다.

  • 페이지에서 추출할 데이터를 클릭한 후 텍스트를 선택해 데이터를 추출합니다.

  • 필요에 따라 필드 이름을 변경합니다.

  • 최종 워크플로우는 다음과 같습니다:


4. 작업 실행 — 데이터 추출 실행하기

  • 저장 실행을 클릭합니다.

  • 로컬 실행을 선택하여  로컬 디바이스에서 작업 실행을 시작합니다.

  • 작업이 완료될 때까지 기다립니다.

  • 아래는 추출된 데이터의 예시입니다:

답변이 도움되었나요?