메인 콘텐츠로 건너뛰기

탭에서 데이터 가져오기

최소 1년 전에 업데이트됨

전자 상거래 웹 사이트를 스크랩해 본 적이 있다면 탭 내부에서 데이터를 스크랩하는 것이 생소하지 않을 겁니다. 하나의 웹 페이지에 많은 정보를 표시해야 하는 경우, 종종 탭을 사용합니다.

아래 웹 페이지를 예로 들어 보겠습니다.

이 웹 페이지에서 "배송 및 반품" 탭과 "사이즈 가이드" 탭 안에서 데이터를 보려면 각각 탭을 클릭해야 합니다.

2021-09-23_14-45-06.png

이제 "배송 및 반품" 탭에서 데이터를 추출하려면 어떻게 해야 할까요? 탭 내부에서 데이터를 가져오는 두 가지 방법이 있습니다.


1. 먼저 탭을 클릭하여 탭 내부의 데이터를 긁어냅니다.

Octoparse에게 탭을 클릭하고 각각 탭 내부에서 내용을 긁어내라고 명령할 수 있습니다.

  • "배송 및 반품" 탭을 클릭합니다.

  • 팁 패널에서 "클릭 요소"를 선택합니다.

  • AJAX를 설정합니다. 네트워크 속도에 따라 AJAX 시간 초과를 조정할 수 있습니다.

  • 그런 다음 캡처해야 할 데이터를 클릭하고 Tips 패널에서 "요소의 텍스트 추출"을 선택합니다.

_3.gif

팁:

  1. AJAX에 대해 자세히 알아보려면 이 튜토리얼을 확인하십시오.

  2. 클릭 작업의 경우 새 탭에서 열기 옵션이 선택되어 있지 않은지 확인하십시오.

1.png

2. 콘텐츠가 소스 코드에 있을 때 탭 내부에서 직접 데이터를 긁어냅니다.

정보가 서로 다른 탭으로 분류되더라도 각 탭 내부의 콘텐츠는 해당 탭의 클릭 여부와 관계없이 소스 코드에 이미 존재할 수 있습니다. 이 경우 먼저 브라우저 모드에서 탭 내용을 표시한 후 대상 정보를 직접 스크랩할 수 있습니다. 이렇게 하면 클릭 작업을 워크플로우에 따로 추가할 필요가 없습니다.

  • 탭 콘텐츠가 소스 코드로 제공되는지 확인하려면 일반 브라우저에 웹 페이지를 로드하고 키보드에서 "F12"를 누릅니다.

  • 소스 코드를 검사하고 대상 콘텐츠가 있는지 확인합니다. 예제 웹 페이지의 경우 "배송 및 반품" 탭을 클릭하지 않더라도 소스 코드에서 해당 데이터를 찾을 수 있습니다. 탭을 클릭하지 않고도 탭 내용을 직접 긁어낼 수 있다는 것을 알 수 있습니다.

2.png
  • 이제 Octoparse로 돌아가서 내장 브라우저의 오른쪽 상단에 있는 버튼을 전환하여 브라우저 모드로 전환합니다.

  • 내용을 표시하려면 "배송 및 반품" 탭을 클릭합니다.

  • 브라우저 모드 버튼을 다시 전환하고 워크플로우 모드로 다시 전환합니다.

  • 캡처할 데이터를 클릭하고 팁 패널에서 "요소의 텍스트 추출"을 선택합니다.

  • 탭 콘텐츠가 모두 캡처되어 있습니다.

_4.gif
답변이 도움되었나요?