메인 콘텐츠로 건너뛰기

레슨 5: 데이터 가져오기

최소 1년 전에 업데이트됨

축하합니다! 당신의 첫 번째 스크래핑 작업이 구축되고 테스트까지 통과하였습니다. 이제 작업을 실행하여 리얼 데이터를 가져올 수 있습니다.



1. 데이터를 가져오는 두 가지 방법

작업을 실행하는 방법은 두 가지 있습니다.

  • 내 디바이스에서 실행(로컬 추출/로컬 실행이라고도 함)

  • 클라우드에서 실행(클라우드 추출/클라우드 실행이라고도 함)

디바이스에서 작업을 실행하는 경우 작업 실행이 끝날 때까지 반드시 Octoparse를 연 상태여야 합니다. PC화면에 실행 창이 나타나고 데이터가 추출되는 과정을 보면서 완료될 때까지 기다리면 됩니다.

mceclip0.png

반면 클라우드에서 작업을 실행하면 Octoparse Cloud Platform에서 작업이 실행되므로 Octoparse나 컴퓨터가 꺼진 상태라도 작업이 완료되면 데이터를 찾을 수 있습니다. 클라우드에서 실행 중인 작업은 일반적으로 로컬 추출에 비해 4배에서 12배 더 빠르게 실행됩니다. 사용자의 프로젝트 요구에 따라 적합한 제품계획을 선택할 수 있습니다.

참고: 일부 작업에는 로컬 및 클라우드 두 실행방식에 대해 스탠더드 모드부스트 모드 옵션이 있습니다. 두 모드의 차이는 아래 링크에서 확인할 수 있습니다. 표준 모드 vs 부스트 모드


2. 실행 시작

작업 작성이 완료되면 "실행" 버튼을 눌러 시작할 수 있습니다.

1818.png

또는 대시보드의 작업 행에서 실행/중지 버튼을 사용하여 작업을 실행/중지할 수도 있습니다.

Run.jpg

3. 데이터 확인

작업 실행이 완료되었으니 이제 데이터를 확인해 볼 차례입니다.

대시보드로 이동하여 작업을 찾습니다. 스크랩된 행 수 위에 마우스를 클릭하면 최근 실행에서 스크랩된 데이터를 확인할 수 있습니다. 모든 실행에서 스크랩된 데이터를 확인하려면 모든 데이터를 클릭합니다.

lines.jpg

또는 ...을 클릭하여 모든 데이터를 확인할 수도 있습니다. 대시보드의 아이콘에서 데이터 보기를 선택한 다음 클라우드 데이터 로컬 데이터 중 어느 방법으로 추출한 데이터를 볼 것인지 선택합니다.

check_data.jpg

4. 데이터 내보내기

데이터가 마음에 들 경우 데이터 보기 탭의 오른쪽 하단에 있는 데이터 내보내기를 클릭하여 데이터를 바로 내보낼 수 있습니다. Octoparse는 Excel, CSV, HTML 파일, 데이터베이스 또는 Google sheet로 데이터 내보내기를 지원합니다.

TIPS:

  • 클라우드에서 추출된 데이터는 로그인만 하면 언제 어디서나 모든 기기에서 액세스할 수 있습니다.

  • 클라우드 데이터는 3개월만 저장되며 그 후에는 클라우드 서버에서 삭제됩니다. 데이터가 삭제되기 전에 미리 데이터를 내보내는 것을 명심하시기를 바랍니다.

  • 데이터가 2만 행을 초과할 경우 여러 개의 데이터 파일(파일당 2만 행)로 내보냅니다.

  • 로컬 데이터는 로컬 추출이 실행된 디바이스에서만 액세스할 수 있습니다.

  • 동일한 작업 파일의 클라우드 데이터는 중복 항을 제거하기 위해 함께 저장됩니다. 그래서 동일한 작업을 두 번 실행할 때 두 번째 실행 시 중복 항이 스크랩되는 것을 볼 수 있습니다.

  • 클라우드는 중복데이터를 자동으로 제거합니다.

FAQ:

  • 페이지가 스킵되는 문제는 왜 생길까요?

  • Octoparse가 마지막 페이지 데이터만 가져올 때 해결 방법

  • 주변 텍스트를 통해 요소를 찾고 스크랩하기

  • 요소 XPath 커스터마이징

  • 로컬에서는 데이터가 제대로 수집되지만 클라우드에서는 데이터를 가져오지 못하는 이유


답변이 도움되었나요?