메인 콘텐츠로 건너뛰기

레슨 0:Octoparse 첫걸음

최소 1년 전에 업데이트됨

안녕하세요. Octoparse 최신 버전 8.5에 오신 것을 환영합니다! 이 버전에는 몇 가지 주요 업데이트가 있으므로 소프트웨어의 새로운 기능과 개선점을 안내해 드리기 위해 새로운 학습 시리즈를 준비하였습니다.

도입부 수업을 모두 마치면 Octoparse 8.5를 충분히 이해하는 데 도움이 될 것입니다. Octoparse를 사용하면 대부분의 웹 페이지에서 데이터를 수집할 수 있습니다. 본 시리즈를 모두 읽는 데는 30분에서 60분 정도 걸릴 것으로 예상합니다.


1. 인터페이스

Octoparse에 로그인하면 홈 페이지와 사이드바 두 가지 주요 섹션이 보입니다.

1.1 홈페이지

페이지 상단에 타깃 웹 페이지 URL을 입력하면 작업을 시작하실 수 있습니다.

또는 템플릿 이름(예: Amazon 또는 eBay)을 입력하여 미리 작성된 스크래핑 템플릿을 검색할 수도 있습니다.

홈페이지에서 가장 인기 있는 스크래핑 템플릿 및 튜토리얼을 만나보실 수도 있습니다.

오른쪽 하단 모서리에 서포트 버튼이 있습니다. 필요한 튜토리얼을 검색하거나 간단한 채팅으로 Octoparse 서포트 팀에 문의하실 수 있습니다.

1.2 사이드바 메뉴

왼쪽 사이드바 메뉴에는 Octoparse 에서 작업하는 데 필요한 모든 것이 포함되어 있습니다.

  • + 새로 만들기: 새 작업을 만들거나 불러오거나 새 작업 그룹을 만들 수 있습니다.

  • 대시보드: 모든 스크래핑 작업물을 찾을 수 있는 곳입니다. 귀하의 계정의 모든 작업물을 편집, 삭제, 이름 변경 및 정리할 수 있습니다. 또한 모든 작업을 편리하게 실행, 중지 또는 예약할 수 있습니다.

  • 템플릿: 사용할 수 있는 모든 템플릿을 찾을 수 있습니다.

1.3 작업 공간

Octoparse 작업 공간은 작업을 구축하는 곳입니다. 여기에는 5개의 주요 섹션이 있으며, 각 섹션은 서로 다른 용도로 사용됩니다.

  • 내장 브라우저: 타깃 웹 페이지 URL을 입력하면 Octoparse의 내장 브라우저에서 웹 페이지가 로드됩니다. 브라우저 모드에서 웹 사이트를 찾아보거나 클릭하고 선택 모드에서 필요한 데이터를 선택할 수 있습니다.

  • 팁: Octoparse는 스마트 팁 기능을 사용하여 데이터 추출 과정에서 여러분과 "소통"하며 작업 작성 과정을 안내합니다.

  • 워크플로우: 웹 페이지를 열고 페이지 요소/버튼을 클릭하는 등 웹 페이지와 상호 작용을 진행하면 전체 작업 프로세스가 워크플로우 형태로 자동 형성됩니다.

  • 설정: 하나의 작업 블록을 선택하면 해당 작업에 대한 설정 옵션을 편집할 수 있습니다.

  • 데이터 미리보기:수집된 데이터를 미리 볼 수 있습니다. 여기서 데이터 필드의 이름을 바꾸거나 필요 없는 데이터 필드를 삭제할 수도 있습니다.


2. 핵심 기능

작업 템플릿은 사용자가 URL 또는 키워드와 같은 간단한 변수를 입력하여 데이터를 가져올 수 있도록 미리 준비된 작업입니다. 현재 대부분의 방문량이 많은 웹사이트를 위해 제작된 100개 이상의 템플릿이 있습니다. 작업 템플릿은 이용자가 워크플로우를 구축할 필요도 없고 전문적인 기술지식이 없으셔도 쉽게 사용하실 수 있습니다. 필요한 템플릿을 선택하고 샘플 데이터를 통하여 고객님이 원하는 데이터가 맞는지 확인한 후 바로 데이터를 추출하기만 하면 됩니다!

2.2 Custom Task

Octoparse Custom Task는 모든 것이 미리 설정된 작업 템플릿과는 달리 매우 유연하고 강력한 스크래핑 모드로 특정 요구 사항에 맞게 맞춤형 스크래핑 작업을 구축할 수 있습니다. Custom Task는 JavaScript, AJAX 또는 동적 웹 사이트와 같은 복잡한 웹 페이지를 크롤링할 수 있을 정도로 강력합니다.

Custom Task로 자신만의 스크래핑 작업을 커스텀 하는 일은 하나도 복잡하게 느껴지거나 두렵게 느껴질 필요가 없습니다. 새로운 자동 인식 알고리즘을 통해 Octoparse는 페이지의 요소를 자동으로 감지한 뒤 리스트를 추출하고 다음 페이지로 이동하는 것과 같은 예상 작업 설정을 미리 추천해 드립니다.

팁 섹션에서 자동 인식 단계를 건너뛰고 작업 설정을 수동으로 편집하면서 작업을 구축할 수도 있습니다.

자동 인식된 데이터가 만족스러우시면 바로 작업 설정을 저장하세요. 그러면 Octoparse가 워크플로우를 자동으로 생성합니다. 필요한 경우 워크플로우에서 작업 단계를 추가하거나 기존의 작업단계를 수동으로 편집할 수 있습니다.

Octoparse는 프리미엄 사용자(Standard 및 이상)가 연중무휴로 작업을 실행할 수 있는 강력한 클라우드 플랫폼을 제공합니다. 클라우드 추출 기능으로 작업을 실행하면 수많은 서버로 구성된 Cloud에서 Octoparse IP를 이용하여 작업합니다. 작업이 실행되는 동안 사용자께서는 애플리케이션이나 컴퓨터를 끄셔도 됩니다. 하드웨어 제한에 대한 걱정은 이제 그만!

추출된 데이터는 클라우드에 저장되며 언제든지 가져다 쓰실 수 있습니다. Octoparse Cloud 서비스는 자동 IP 전환, 작업 스케줄링, 추출 속도 올리기, Octoparse API 등의 고급 기능도 제공합니다.


답변이 도움되었나요?