Octoparse는 웹 페이지 본문의 정보를 가져올 뿐만 아니라 웹 페이지 URL, 웹 페이지 타이틀, 메타 설명, 메타 키워드 및 HTML 소스 코드를 포함한 페이지 레벨의 데이터도 가져올 수 있습니다.
아래 단계에 따라 정보를 쉽게 가져올 수 있습니다.
STEP 1.
워크플로우에서 데이터 추출을 선택합니다.
STEP 2.
데이터 미리보기 섹션으로 이동하여 사용자 지정 필드 추가 버튼을 클릭합니다.
STEP 3.
페이지 레벨 데이터에서 원하는 데이터 종류를 선택합니다.
STEP 4 (선택 사항).
데이터 필드 이름을 더블클릭하여 데이터 필드 이름을 변경합니다.
위와 같은 방식으로 5가지 유형의 데이터를 필드에 추가할 수 있습니다.
페이지 URL : 현재 페이지의 URL
페이지 타이틀 : 웹페이지에 대한 간단한 설명으로 브라우저 창 상단에 표시되는 현재 페이지 제목
메타 설명: 페이지 개요가 들어있는 현재 페이지의 메타 설명 태그
메타 키워드 : 현재 페이지의 메타 키워드 태그
HTML 소스 코드 : 웹 페이지의 전체 HTML 소스 코드