SHEIN은 온라인 패스트 패션 소매업체로 패스트 패션 산업에 큰 영향을 미치고 있으며 현재 틱톡에서 큰 인기를 끌고 있습니다. 주로 패스트 패션 업계에서 훨씬 저렴한 가격에 여성복을 제공합니다.
이번 튜토리얼에서 사용할 URL:
상품명, 가격, 이미지 URL, SKU, 리뷰 수, 평점 등의 데이터를 가져옵니다.
주요 단계는 오른쪽 메뉴에 표시되어 있으며, 여기에서 샘플 작업 파일을 다운로드할 수 있습니다.
1. 웹 페이지로 이동 - 대상 웹 페이지를 엽니다.
홈 페이지에 URL을 입력하고 시작을 클릭합니다.
2. 웹 페이지 자동 인식 - 워크플로우를 생성합니다.
웹 페이지 데이터 자동 인식 선택
자동 인식이 완료될 때까지 기다립니다.
페이지 스크롤 추가 클릭 해제
팁 패널에서 워크플로우 만들기 버튼을 클릭
데이터 미리보기에서 데이터 필드를 확인하고, 필요한 경우 원하지 않는 필드를 삭제하거나 필드 이름을 변경할 수도 있습니다.
3. 상세 페이지 URL 선택 - 제품 상세정보 추출
4. 데이터 추출 - 추출할 데이터를 선택합니다.
페이지에서 추출할 데이터를 클릭
팁 패널에서 텍스트 선택
필요한 모든 데이터를 얻을 때까지 이 단계를 반복합니다.
필요한 경우 데이터 필드 이름 편집
각 단계 전에 로컬 네트워크에 따라 대기 시간을 추가
데이터 추출을 클릭하고 세로 보기 아이콘을 클릭한 다음 Product_name 및 Title_URL에 대한 XPath를 변경합니다./div[@class="S-product-item_info"]/div/a
5. 작업 실행 - 원하는 데이터 가져오기
저장을 클릭하고 오른쪽 위에 있는 실행을 클릭합니다.
컴퓨터에서 작업을 실행하려면 로컬 디바이스에서 실행을 선택합니다.
데이터 추출 결과: