Octoparse

이 튜토리얼에서는 텍스트, URL, 이미지 URL, HTML 및 기타 속성 값을 추출하는 방법을 다룹니다.

___________________________________________________________

대상 데이터를 클릭한 다음 Tips 패널에서 Text(텍스트)를 선택합니다.

2. (링크 또는 이미지의) URL 추출

URL은 하이퍼링크입니다. 아마존에서 책 제목을 클릭할 때와 마찬가지로 URL을 클릭하면 새 웹 페이지를 열거나 이동할 수 있습니다.

URL을 사용하면 웹 페이지 외에도 이미지 또는 PDF 문서와 같은 특정 파일 리소스에 인터넷을 통해 액세스할 수 있습니다. 또한 URL을 통해 해당 파일이나 이미지를 인터넷에서 다운로드하실 수 있습니다.

대상 데이터를 클릭한 다음 Tips 패널에서 Link(링크)를 선택합니다.

대상 데이터를 클릭한 다음 Tips 패널에서 Image URL(이미지 URL)을 선택합니다.

FAQ: Octoparse를 사용하여 웹 페이지에서 URL이 아닌 이미지를 직접 가져올 수 있나요?

네! <a href="https://intercom.help/octoparse/en/articles/6470908" rel="nofollow noopener noreferrer" target="_blank">버전 8.5.4</a>에 도입된 새로운 <a href="https://intercom.help/octoparse/en/articles/6470929" rel="nofollow noopener noreferrer" target="_blank">스크레이프 및 다운로드 기능</a>을 통해 스크래핑 중에 이미지를 직접 다운로드할 수 있습니다.

텍스트 및 URL과 달리 아이콘과 같은 데이터는 직접 추출할 수 없습니다. 별점과 같이 일부 시각적 비문자 콘텐츠를 추출하려면 이러한 콘텐츠의 내부/외부 HTML을 추출해야 합니다.

아이콘 외에도 이러한 요소의 HTML을 먼저 추출하여 웹 페이지에서 숨겨진 텍스트, 차트 및 그래프를 긁어낼 수도 있습니다. HTML 코드를 받은 후에는 <a href="https://intercom.help/octoparse/ko/articles/6471021-%EC%A0%95%EA%B7%9C-%ED%91%9C%ED%98%84%EC%8B%9D-regex" rel="nofollow noopener noreferrer" target="_blank">정규 표현식</a>을 적용하여 데이터를 정리해야 합니다.

내부/외부 HTML을 추출하려면 대상 데이터를 클릭한 다음 Tips 패널에서 내부/외부 HTML을 선택합니다.

팁: 추출된 내부/외부 HTML을 유용한 데이터로 정제하려면 다음 튜토리얼을 확인하십시오.

- <a href="https://helpcenter.octoparse.com/ko/articles/6470923-%EB%A0%88%EC%8A%A8-3-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%8B%A4%EB%93%AC%EA%B8%B0">레슨 3: 데이터 다듬기</a>
- <a href="https://intercom.help/octoparse/ko/articles/6471021-%EC%A0%95%EA%B7%9C-%ED%91%9C%ED%98%84%EC%8B%9D-regex" rel="nofollow noopener noreferrer" target="_blank">정규 표현 도구</a>

속성은 HTML 코드 내에 있어 HTML 요소에 대한 추가 정보를 제공합니다. 예를 들어 별 점은 일반적으로 속성에 저장됩니다. 일반적으로 name="value"와 같은 이름/값 쌍으로 제공됩니다. octoparse는 이런 값을 가져오는 데 도움이 될 수 있습니다.

대상 요소(예: 별점)를 클릭하고 OuterHtml을 선택합니다.

데이터 미리 보기 섹션으로 이동하고 데이터 필드 위를 이동한 다음... 추가 버튼을 클릭하고 사용자 지정 필드(customize field)를 선택한 다음 속성 추출에서 대상 속성을 선택합니다.

웹 요소(텍스트, URL, HTML 등)의 속성 추출하기

Go to Octoparse.com

Octoparse DE

Octoparse FR

Octoparse ES

Octoparse JP

다운로드

블로그

API Docs

Intercom 지원 및 커뮤니티 전문가의 답변을 찾고 도움을 받으세요.

메신저를 통해 시작한 대화가 여기에 표시됩니다.

귀하가 생성한 대화가 없습니다

다른 키워드를 사용하거나 오타가 없는지 확인하십시오.

다른 키워드나 필터를 사용해 보십시오.

대화를 찾을 수 없습니다

제목

이 사이트는 당사 및 당사의 제3자 공급업체가 당사 쿠키 정책에 명시된 목적을 위해 귀하, 귀하와 사이트와의 상호 작용(본 콘텐츠, 커서 이동, 화면 녹화 및 채팅 콘텐츠 포함)에 대한 개인 정보를 모니터링하고 기록할 수 있도록 쿠키 및 기타 기술을 사용합니다. 당사의 사이트를 계속 방문하면 당사의 {websiteTermsLink}, {privacyPolicyLink}, {cookiePolicyLink}에 동의하시는 것으로 간주됩니다.

이 사이트는 사이트 운영에 꼭 필요한 경우에만 쿠키 및 유사 기술("쿠키")을 사용합니다. 또한 저희와 저희의 파트너는 사이트 성능 분석, 특정 기능, 광고 및 소셜 미디어 기능을 활성화하기 위해 추가 쿠키를 설정하고자 합니다. 자세한 내용은 {cookiePolicyLink}에서 확인하실 수 있습니다. 쿠키 설정에서 쿠키 기본 설정을 변경할 수 있습니다.

당사는 사이트의 원활한 작동 및 분석, 광고 목적으로 쿠키를 사용합니다. 선택적 쿠키를 원하는 대로 활성화하거나 비활성화할 수 있습니다. 자세한 내용은 {cookiePolicyLink}에서 확인하십시오.

광고 쿠키는 당사의 광고 파트너가 설정하여 시간이 지남에 따라 다양한 브라우저와 장치에서 사이트, 당사 커뮤니케이션 및 기타 온라인 서비스 사용에 대한 정보를 수집합니다. 이 정보를 사용하여 귀하가 관심을 가질 만한 온라인 광고를 표시하고 광고의 성과를 측정합니다. 소셜 미디어 쿠키는 소셜 미디어 플랫폼에 의해 설정되어 귀하가 해당 플랫폼에서 콘텐츠를 공유할 수 있도록 하며, 다른 온라인 서비스에서 귀하의 활동에 대한 정보를 추적하여 해당 플랫폼의 개인정보 보호정책에 설명된 대로 사용할 수 있습니다.

이 쿠키는 웹사이트가 향상된 기능과 개인화 기능을 제공할 수 있도록 합니다. 이 쿠키는 당사 또는 당사 페이지에 서비스를 추가한 제3자 제공업체에 의해 설정될 수 있습니다. 이 쿠키를 허용하지 않으면 관련 서비스의 일부 또는 전부가 제대로 작동하지 않을 수 있습니다.

이 쿠키는 웹사이트가 작동하는 데 필수적이며, 당사 시스템에서 비활성화할 수 없습니다.

이 쿠키는 방문 횟수와 트래픽 소스를 집계하여 사이트 성능을 측정하고 개선할 수 있도록 합니다. 이 쿠키는 가장 인기 있는 페이지와 가장 인기 없는 페이지를 파악하고 방문자가 사이트를 어떻게 이용하는지 알 수 있도록 도와줍니다.

귀하는 귀하의 개인 정보 판매를 거부할 권리가 있습니다. 당사가 귀하의 데이터를 사용하는 방법에 대한 자세한 내용은 {cookiePolicyLink}에서 확인하십시오.

개인정보 보호 선택 사항

당사는 귀하의 경험을 향상시키기 위해 쿠키를 사용합니다. 아래에서 쿠키 기본 설정을 사용자 지정할 수 있습니다. 자세한 내용은 {cookiePolicyLink}에서 확인하십시오.

쿠키 설정

지원 센터 비어 있음

죄송합니다. 해당 페이지가 존재하지 않습니다.

검색 결과

실망

무표정

웃음

생각 중...

소스에서 정보를 검색하는 중...

분석하는 중...

메신저를 통해 제출된 티켓이나 대화 중 지원 상담원이 제출한 티켓이 여기에 표시됩니다.

귀하가 생성한 티켓이 없습니다

티켓을 찾을 수 없음

회사와 관련된 모든 티켓 및 대화의 진행 상황을 추적하세요.

고객 포털.

회사와 관련된 모든 티켓의 진행 상황을 추적하세요.

티켓 포털.

{assigneeName}은(는) 작업 중입니다!

{assigneeName}님이 티켓을 완료했습니다

{assigneeName}님이 곧 픽업할 것입니다

{assigneeName}님이 귀하에 대한 추가 정보를 필요로 합니다

귀하에 대한 추가 정보가 필요합니다

티켓

티켓 포털에 액세스할 수 없습니다

검색

검색을 건너뛰세요. 하고자 하는 일을 설명하고 근거에 입각한 답변을 얻으세요.

이 주제에 대한 자료와 가이드를 찾아보세요.

작업 공간을 만들고 함께 일하는 사람들을 초대하세요.

계정 설정

첫 번째 워크플로를 만들고 엔드투엔드로 실행되는 모습을 확인하세요.

무언가 보내기

팀에서 이미 사용 중인 도구를 연결하여 데이터를 가져오세요.

스택 연결

제품을 빠르게 둘러보며 각 기능이 어디에 있는지 알아보세요.

60초 내 {appName}

이 프로토타입 데모는 귀하가 현재 “{title}”을(를) 읽고 있음을 인식합니다. 현재 자료로 다시 안내할 수는 있지만, 자료를 인식하는 프로덕션 Fin 계약은 아직 후속 작업에 해당합니다.

프로토타입 자료 인식 답변

이미 초대에 대해 문의하셨으므로 이 프로토타입 데모에 다음과 같은 후속 기능을 추가할 수 있습니다: 각 초대를 보내기 전에 역할 선택기를 사용하여 팀원의 책임에 따른 액세스 권한을 제한합니다.

프로토타입 역할 제한 후속 조치

이 프로토타입 데모에서는 작업 공간 프로필에서 시작하고 액세스해야 하는 팀원을 초대한 다음 사용 중인 통합을 연결할 것을 제안합니다.

프로토타입 시작하기 답변

이 프로토타입 데모에서는 작업 공간 설정에서 통합이 구성됩니다. 통합을 선택하고, 계정을 연결하고, 활성화된 권한을 검토하세요.

프로토타입 통합 답변

이 프로토타입 데모에서는 작업 공간 설정에서 팀원을 초대한 다음 초대장을 보내기 전에 각 팀원에게 필요한 액세스 권한을 선택합니다.

프로토타입 팀 초대 답변

이 프로토타입 데모에는 해당 질문에 대한 스크립트된 답변이 아직 없습니다. 팀을 초대하는 방법이나 소스 자료를 여는 방법에 대해 질문해 보세요. 프로덕션 Fin API는 호출되지 않았습니다.

프로토타입 답변을 사용할 수 없습니다

이 페이지를 열어 두었습니다. 무엇이든 물어보시면 문서를 바탕으로 답변해 드리겠습니다.

웹 요소(텍스트, URL, HTML 등)의 속성 추출하기

1. 텍스트 추출

2. (링크 또는 이미지의) URL 추출

2.1 링크의 URL 추출

2.2 이미지 URL 추출

3. 내부/외부 HTML 추출

4. 속성값 추출