메인 콘텐츠로 건너뛰기

레슨 0: Octoparse 첫걸음

이번 주에 업데이트함

안녕하세요! Octoparse 최신 버전 8.8에 오신 것을 환영합니다. 이번 새 버전에는 몇 가지 주요 업데이트가 있으므로 소프트웨어의 새로운 기능과 개선 사항을 빠르게 익히실 수 있도록 새로운 학습 시리즈를 준비하였습니다.

도입부 수업을 차례대로 마치면 Octoparse 8.8을 충분히 이해하는 데 도움이 될 것입니다. 이를 통해 대부분의 웹페이지에서 데이터를 수집할 수 있게 됩니다. 본 시리즈를 모두 읽는 데는 보통 30분에서 60분 정도 소요됩니다.


1. 인터페이스

Octoparse에 로그인하면 홈페이지와 사이드바 두 가지 주요 섹션이 보입니다.

1.1 홈페이지

페이지 상단에 타깃 웹 페이지 URL을 입력하면 작업을 시작하실 수 있습니다.

또는 템플릿 이름(예: Amazon 또는 eBay)을 입력하여 미리 작성된 스크래핑 템플릿을 검색할 수도 있습니다.

홈페이지에서 가장 인기 있는 스크래핑 템플릿 및 튜토리얼을 만나보실 수도 있습니다.

오른쪽 하단 모서리에 서포트 버튼이 있습니다. 필요한 튜토리얼을 검색하거나 간단한 채팅으로 Octoparse 지원팀에 문의하실 수 있습니다.

1.2 사이드바 메뉴

왼쪽 사이드바 메뉴에는 Octoparse 에서 작업하는 데 필요한 모든 것이 포함되어 있습니다.

  • + 신규 작업: 새 작업을 만들거나 불러오거나 새 작업 그룹을 만들 수 있습니다.

  • 대시보드: 모든 스크래핑 작업물을 찾을 수 있는 곳입니다. 귀하의 계정의 모든 작업물을 편집, 삭제, 이름 변경 및 관리할 수 있습니다. 또한 모든 작업을 편리하게 실행, 중지 또는 예약할 수 있습니다.

  • 템플릿: 사용할 수 있는 모든 템플릿을 찾을 수 있습니다.

1.3 작업 공간

Octoparse 작업 공간은 여러분이 작업을 구성하는 곳입니다. 여기에는 5개의 주요 섹션이 있으며 각 섹션은 서로 다른 용도로 사용됩니다.

  • 내장 브라우저: 타깃 웹페이지 URL을 입력하면 Octoparse의 내장 브라우저에서 해당 웹페이지가 로드됩니다. 브라우저 모드에서 웹 사이트를 찾아보거나 클릭하고 선택 모드에서 필요한 데이터를 선택할 수 있습니다.

  • 팁: Octoparse는 스마트 팁 기능을 사용하여 데이터 추출 과정에서 여러분과 "소통"하며 작업 작성 과정을 안내합니다.

  • 워크플로우: 웹페이지를 열고 페이지 요소/버튼을 클릭하는 동작 등 웹 페이지와 상호 작용을 진행하면 전체 작업 프로세스가 워크플로우 형태로 자동 형성됩니다.

  • 설정: 하나의 작업 블록을 선택하면 해당 작업에 대한 설정 옵션을 편집할 수 있습니다.

  • 데이터 미리보기:수집된 데이터를 미리 볼 수 있습니다. 여기서 데이터 필드의 이름을 바꾸거나 필요 없는 데이터 필드를 삭제할 수도 있습니다.


2. 핵심 기능

작업 템플릿은 사용자가 URL 또는 키워드와 같은 간단한 파라미터를 입력하여 데이터를 가져올 수 있도록 미리 만들어잔 작업입니다. 현재 많은 사용자가 찾는 주요 웹사이트 스크래핑을 위한 100개 이상의 템플릿이 제공되고 있습니다. 작업 템플릿은 별도의 워크플로우를 구축할 필요가 없고 전문적인 기술 지식도 요구되지 않으며 누구나 쉽게 접근하실 수 있습니다. 필요한 템플릿을 선택하여 샘플 데이터를 확인하며 원하는 데이터가 맞는지 확인한 뒤 바로 데이터를 추출하기만 하면 됩니다!

2.2 사용자 지정 작업으로 데이터 스크래핑

Octoparse 사용자 지정 작업은 모든 설정이 미리 구성되어 있는 템플릿 작업과 달리 매우 유연하고 강력한 스크래핑 모드로 특정 요구 사항에 맞게 맞춤형 스크래핑 작업을 직접 구성할 수 있습니다. 이 모드는 JavaScript, AJAX 등 동적 웹페이지를 포함한 복잡한 웹페이지도 문제없이 스크래핑할 수 있을 만큼 강력합니다.

사용자 지정 작업으로 스크래핑 작업을 만드는 과정은 복잡하거나 어려울 필요가 없습니다. 새로운 자동 감지 알고리즘을 사용하면 Octoparse가 페이지 내 요소를 자동으로 감지하고, 리스트 추출이나 다음 페이지 넘어가기와 같은 추천 작업 설정을 생성해 줍니다.

팁 섹션에서 제공된 자동 감지 기능외에도 사용자가 언제든지 작업 설정을 수동으로 편집하거나 자동 감지 단계를 건너뛰고 처음부터 직접 작업을 구성할 수 있습니다.

자동 감지된 데이터가 만족스러우시면 작업 설정을 저장하기만 하세요. 그러면 Octoparse가 워크플로우를 자동으로 생성합니다. 필요하다면 워크플로우에 추가 단계를 넣거나 기존 작업 단계를 수동으로 수정할 수도 있습니다.

Octoparse는 프리미엄 사용자(Standard 및 이상)가 연중무휴로 작업을 실행할 수 있는 강력한 클라우드 플랫폼을 제공합니다. 클라우드 추출 기능으로 작업을 실행하면 수많은 서버로 구성된 Cloud에서 Octoparse IP를 이용하여 작업합니다. 작업이 실행되는 동안 사용자께서는 애플리케이션이나 컴퓨터를 끄셔도 됩니다. 하드웨어 제한에 대한 걱정은 이제 그만!

추출된 데이터는 클라우드에 저장되며 언제든지 가져다 쓰실 수 있습니다. Octoparse Cloud 서비스는 자동 IP 전환, 작업 스케줄링, 추출 속도 올리기, Octoparse API 등의 고급 기능도 제공합니다.


답변이 도움되었나요?