첫 번째 스크래핑 작업을 만들고 테스트까지 완료했어요. 이제 실행해서 실제 데이터를 추출해 보세요!
1. 데이터를 가져오는 두 가지 방법
작업을 실행하는 방법은 두 가지 있습니다.
로컬 디바이스에서 실행하기(로컬 추출/로컬 실행)
클라우드에서 실행하기(클라우드 추출/클라우드 실행)
디바이스에서 작업을 실행하는 경우 작업 실행이 끝날 때까지 반드시 Octoparse를 연 상태이어야 합니다. PC화면에 실행 창이 나타나고 데이터가 추출되는 과정을 진행하며 완료될 때까지 기다리면 됩니다.
반면 클라우드에서 실행하기를 선택하면 Octoparse 클라우드 플랫폼에서 작업이 실행되므로 Octoparse나 컴퓨터는 꺼진 상태라도 작업을 계속 진행하며 데이터를 스크래핑을 하고 있습니다. 클라우드에서 실행 중인 작업은 보통 로컬 추출에 비해 4배에서 12배 더 빠르게 실행됩니다. 여러분의 프로젝트 요구에 따라 적합한 요금제를 선택할 수 있습니다.
참고: 일부 작업에는 로컬 실행과 클라우드 실행 모두에서 스탠다드 모드 및 부스트 모드 옵션이 제공됩니다. 두 모드 차이에 대한 설명은 아래 링크에서 확인할 수 있습니다.
2. 실행 시작
작업 워크플로우 및 테스트가 확인되면 "실행" 버튼을 눌러 시작하세요.
또는 대시보드 해당 작업 행에서 실행/중지 버튼을 클릭하여 작업을 실행/중료할 수도 있습니다.
3. 데이터 확인
작업 실행이 완료되었으니 이제 가져온 데이터를 확인해 볼 차례입니다.
먼저 대시보드로 이동하여 작업을 찾아주세요. 스크래핑된 줄 수를 클릭하면 최신 실행에서 수집된 데이터를 확인할 수 있습니다. 전체 데이터를 클릭하면 모든 실행에서 수집된 데이터를 확인할 수 있습니다.
또는 마지막 ... 아이콘을 클릭하여 모든 데이터를 확인할 수도 있습니다. 리스트에서 데이터 보기를 선택한 다음 클라우드 데이터와 로컬 데이터를 선택하여 해당 모드로 추출한 데이터를 확인합니다.
4. 데이터 내보내기
데이터가 원하는 대로 잘 수집되었다면 전체 데이터 보기 화면에서 오른쪽 하단에 있는 데이터 내보내기를 클릭해 바로 내보낼 수 있습니다. Octoparse는 세 가지 데이터 내보내기 방식을 제공합니다:
파일로 내보내기: 데이터를 Excel, CSV, HTML, JSON, 또는 XML 파일로 내보내기
데이터베이스로 내보내기: 데이터를 Google Sheets, PostgreSQL, SQL Server, MySQL, 또는 Oracle 같은 데이터베이스로 내보내기
클라우드 스토리지 내보내기: 데이터를 Google Drive, Dropbox, Amazon S3와 같은 클라우드 저장소로 내보내기
팁:
클라우드 실행(Cloud run)에서 추출한 데이터는 계정에 로그인하기만 하면 어떤 기기에서도 접근할 수 있습니다.
클라우드 데이터는 최대 3개월 동안만 저장되며 이후에는 클라우드 공간에서 삭제됩니다. 삭제되기 전에 반드시 데이터를 내보내 주세요.
데이터 양이 20,000 줄을 초과하면, 여러 개의 데이터 파일(파일당 20,000 줄)로 나누어 내보내집니다.
로컬 데이터는 로컬 추출이 실행된 해당 기기에서만 접근할 수 있습니다.
동일한 작업의 클라우드 데이터는 중복 제거를 위해 함께 저장됩니다. 따라서 같은 작업을 두 번째 실행하면 두 번째 실행에서 추출된 데이터에 중복 항목이 보일 수 있습니다.
클라우드 중복 데이터는 자동으로 제거됩니다.
FAQ: