메인 콘텐츠로 건너뛰기

옥토파스에서 작업이란 무엇인가?

오늘 업데이트함

옥토파스에서 모든 일은 ‘작업(Task)’을 만드는 것부터 시작됩니다. 옥토파스에서는 이 작업을 ‘봇(Bot)’, ‘에이전트(Agent)’, 또는 ‘크롤러(Crawler)’라고 부르기도 합니다. 이 명칭들은 모두 같은 의미로, 프로그램이 따라야 할 일련의 설정 세트를 뜻합니다. 일반적으로 하나의 작업은 하나의 웹페이지 또는 동일한 페이지 구조를 가진 여러 페이지에서 데이터를 수집하도록 구성됩니다.

작업을 만드는 과정은 간단합니다.

  1. 우선 옥토파스에서 목표 웹페이지를 불러옵니다.

  2. 그리고 수집하고 싶은 데이터를 클릭하여 선택합니다.

데이터 선택이 완료되면, 옥토파스는 사용자가 웹페이지에서 어떤 동작을 했는지(예: 버튼 클릭, 메뉴에 마우스를 올림, 특정 데이터를 선택함 등)에 따라 자동으로 워크플로우를 생성합니다.

옥토파스는 실제 사용자의 웹 브라우징 행동을 시뮬레이션하며 클릭, 검색, 페이지 이동 등의 과정을 거쳐 목표 데이터를 추출합니다. 이 모든 과정은 워크플로우에 기록된 단계별 지침을 따르며 수행됩니다. 이것이 옥토파스가 웹페이지에서 데이터를 추출하는 방식입니다.


사용자 지정 작업 vs. 작업 템플릿

옥토파스에서 작업을 만드는 방법은 두 가지입니다:

  1. 사용자 지정 작업

  2. 작업 템플릿 

사용자 지정 작업

사용자 지정 작업은 이름 그대로 사용자가 원하는 대로 크롤링 과정을 설정할 수 있습니다.
예를 들어:

  • 키워드로 검색하기

  • 계정에 로그인하기

  • 드롭다운 메뉴 클릭하기

이런 식으로 완전히 자신만의 수집 과정을 구성할 수 있습니다.
즉, 어떤 웹사이트든 데이터를 수집하려면 ‘사용자 지정 작업’만으로 충분합니다.

작업 템블릿

반대로, 작업 템플릿은 이미 미리 설정된 작업들을 제공합니다.
유명하거나 자주 사용되는 웹사이트에 대한 크롤링 구성이 기본으로 포함되어 있으며 사용자는 검색어, 페이지 URL 등의 변수만 입력하면 해당 웹사이트에서 미리 정의된 데이터 세트를 바로 추출할 수 있습니다.

지금 바로 데이터를 수집해보고 싶으신가요?
단계별로 첫 번째 작업을 만들어보는 입문 레슨을 따라가 보세요.

참고:

  1. 옥토파스 버전 7과 버전 8의 인터페이스는 다릅니다.
    자동 인식 기능은 버전 8에서만 제공됩니다.

  2. 자동 인식 기능으로 기본 워크플로우를 먼저 만든 뒤, 필요한 대로 수정하거나 최적화할 수 있습니다.

  3. 일반적으로 한 웹사이트(또는 동일 도메인 내 URL들)에서 데이터를 추출할 때는 하나의 작업/크롤러를 사용합니다. (한 작업은 동일한 페이지 구조를 가진 페이지들만 처리 가능하기 때문입니다.) 하지만 여러 웹사이트에서 이메일 주소만 추출하고 싶다면, 하나의 크롤러로도 가능합니다. 관련 튜토리얼: 서로 다른 구조의 여러 웹사이트에서 이메일 주소를 한 번에 추출할 수 있나요?


작업 관리 팁

1. 작업 정보 수정

작업 이름은 URL을 입력하여 저장할 때 자동으로 생성됩니다.

  • 작업 이름을 바꾸려면 워크플로우 상단의 텍스트 박스를 클릭해 새 이름을 입력하거나,

  • 저장된 작업에서 편집 버튼을 눌러 이름을 변경할 수 있습니다.


2. 작업 관리 기능

빠른 액션

  • 중복: 작업 복제

  • 삭제: 작업 삭제

액션

내보내기

작업 파일 내보내기 (내 컴퓨터에 저장하거나 지원팀에 전달 가능)

작업 ID(API)

API 요청 시 사용할 수 있는 작업 ID

로컬 실행

로컬 실행 (시작, 중지, 일정 예약)

클라우드 실행

클라우드 실행 (시작, 중지, 예약 실행, 실행 이력 보기)

크룹 변경

작업을 다른 그룹으로 이동

데이터 보기

클라우드 또는 로컬 데이터 보기

작업 설정

예약 설정, 자동 내보내기, 실행 설정, 차단 방지, 다운로드 등 작업에 관련된 설정

여러 작업 한 번에 관리하기:

  • 여러 작업 선택하기(또는 한 개만 선택해도 가능)

  • 제공되는 옵션 중 하나를 선택해 일괄 작업 수행

답변이 도움되었나요?