메인 콘텐츠로 건너뛰기

페이지 레벨 데이터(metadata, URL, title 및 HTML) 가져오기

Octoparse를 사용하여 웹 페이지 URL, 웹 페이지 제목, 메타 설명, 메타 키워드 및 HTML 소스 코드를 포함하는 페이지 레벨 데이터를 추출하는 방법을 소개합니다.

어제 업데이트함

Octoparse는 웹 페이지 본문의 정보를 가져올 뿐만 아니라 웹 페이지 URL, 웹 페이지 타이틀, 메타 설명, 메타 키워드 및 HTML 소스 코드를 포함한 페이지 레벨의 데이터도 가져올 수 있습니다.

아래 단계에 따라 정보를 쉽게 가져올 수 있습니다.

STEP 1.

워크플로우에서 데이터 추출을 선택합니다.

STEP 2.

데이터 미리보기 섹션으로 이동하여 사용자 지정 필드 추가 버튼을 클릭합니다.

1.png

STEP 3.

페이지 레벨 데이터에서 원하는 데이터 종류를 선택합니다.

3.png

STEP 4 (선택 사항).

데이터 필드 이름을 더블클릭하여 데이터 필드 이름을 변경합니다.

4.png


위와 같은 방식으로 5가지 유형의 데이터를 필드에 추가할 수 있습니다.

  • 페이지 URL : 현재 페이지의 URL

  • 페이지 타이틀 : 웹페이지에 대한 간단한 설명으로 브라우저 창 상단에 표시되는 현재 페이지 제목

mceclip2.png
  • 메타 설명: 페이지 개요가 들어있는 현재 페이지의 메타 설명 태그

mceclip3.png
  • 메타 키워드 : 현재 페이지의 메타 키워드 태그

mceclip4.png
  • HTML 소스 코드 : 웹 페이지의 전체 HTML 소스 코드

답변이 도움되었나요?