Octoparse는 AJAX, JAVA scripts 및 기타 동적 웹 사이트를 포함한 모든 웹 사이트의 98%를 스크랩할 수 있도록 지원합니다. 또한 Octoparse에서는 폼, 드롭다운 목록, 무한 스크롤 등과 쉽게 상호 작용할 수 있습니다.
Octoparse를 사용하여 웹 사이트에서 복사 및 붙여넣을 수 있는 모든 데이터/정보를 스크랩할 수 있습니다. 이외에도 웹 사이트의 HTML 소스 코드 내에 있는 데이터도 (웹 페이지에 표시되지 않더라도) Octoparse를 사용하여 스크랩할 수 있습니다.
1. 웹 페이지에서 볼 수 있는 요소:
텍스트
이미지 URL
링크(URL)
내부/외부 HTML 코드
속성값
자세한 내용은 여기에서 확인하시기 바랍니다: 웹 요소의 속성 추출(텍스트, URL, HTML 등)
2. 소스 코드에 숨겨진 요소:
페이지 URL
페이지 제목
메타데이터
HTML 소스코드
현재시간
자세한 내용은 다음을 참조하십시오.
3. Octoparse가 가져올 수 없는 웹사이트의 유형은?
XML 사이트맵
PDF파일
복잡한 웹 사이트에서 데이터를 스크랩하는 데 시간이 많이 걸리거나 비즈니스 운영에 최대한 집중하고 싶다면 언제든지 데이터 서비스에 문의하십시오.