구글 플레이(google play)는 수많은 애플리케이션 정보를 저장하고 있는 빅 데이터베이스입니다. 이번 튜토리얼에서는 구글 플레이에서 애플리케이션의 기본 정보를 가져올 것입니다.
Octoparse의 홈 화면에서 사용하기 쉬운 "Task Template"를 방문하시면 됩니다. 여러 파라미터를 입력하기만 하면 작업이 완료됩니다. 자세한 내용은 여기에서 확인하십시오.
본 튜토리얼에서 다음 URL을 사용해야 합니다.
Octoparse로 상세 페이지 URL, 애플리케이션명, 작성자명, 평점 등의 데이터를 긁어드립니다.
주요 단계는 오른쪽 메뉴에 나와 있으며 샘플 작업 파일은 여기에서 다운로드할 수 있습니다.
1. 웹 페이지로 이동 - 대상 웹 페이지를 엽니다.
홈 화면에 페이지 URL을 입력하고 시작을 클릭합니다.
2. 웹 페이지 데이터 자동 인식 - 워크플로우 생성
웹 페이지 데이터 자동 인식을 클릭합니다.
인식이 완료될 때까지 기다립니다.
페이지 추가 스크롤을 취소하고 팁에서 워크플로우 생성을 클릭합니다.
데이터 미리 보기 섹션의 데이터 필드를 확인하고 필요한 경우 헤더를 더블 클릭하여 원하지 않는 필드를 삭제하거나 필드 이름을 바꿀 수도 있습니다.
3. 추출 시작 - 작업 실행 및 데이터 가져오기
최종 워크플로우는 다음과 같습니다.
저장을 클릭합니다.
오른쪽 상단에 있는 Run(실행)을 클릭합니다.
데이터 수집 결과는 다음과 같습니다.