메인 콘텐츠로 건너뛰기

Octoparse가 스크래핑할 수 있는 웹 사이트/데이터 유형은?

최소 1년 전에 업데이트됨

Octoparse는 AJAX, JAVA scripts 및 기타 동적 웹 사이트를 포함한 모든 웹 사이트의 98%를 스크랩할 수 있도록 지원합니다. 또한 Octoparse에서는 폼, 드롭다운 목록, 무한 스크롤 등과 쉽게 상호 작용할 수 있습니다.

Octoparse를 사용하여 웹 사이트에서 복사 및 붙여넣을 수 있는 모든 데이터/정보를 스크랩할 수 있습니다. 이외에도 웹 사이트의 HTML 소스 코드 내에 있는 데이터도 (웹 페이지에 표시되지 않더라도) Octoparse를 사용하여 스크랩할 수 있습니다.


1. 웹 페이지에서 볼 수 있는 요소:

  • 텍스트

  • 이미지 URL

  • 링크(URL)

  • 내부/외부 HTML 코드

  • 속성값

자세한 내용은 여기에서 확인하시기 바랍니다: 웹 요소의 속성 추출(텍스트, URL, HTML 등)


2. 소스 코드에 숨겨진 요소:

  • 페이지 URL

  • 페이지 제목

  • 메타데이터

  • HTML 소스코드

  • 현재시간

자세한 내용은 다음을 참조하십시오.


3. Octoparse가 가져올 수 없는 웹사이트의 유형은?

  • XML 사이트맵

  • PDF파일


복잡한 웹 사이트에서 데이터를 스크랩하는 데 시간이 많이 걸리거나 비즈니스 운영에 최대한 집중하고 싶다면 언제든지 데이터 서비스에 문의하십시오.


답변이 도움되었나요?