본 튜토리얼에서는 로그인 후 데이터를 추출하는 방법과 작업의 워크플로우를 최적화하기 위해 쿠키를 저장하는 방법을 보여줍니다.
1. 로그인 정보 입력
웹 페이지에서 사용자 이름 입력을 위해 텍스트 입력창을 클릭합니다.
팁 패널에서 텍스트 입력을 선택합니다.
사용자 이름을 텍스트 입력창 1에 입력하고 확인을 클릭하면 입력한 사용자 이름이 웹 페이지의 사용자 이름 텍스트 입력창에 자동으로 채워집니다.
계속을 클릭하고 팁 패널에서 클릭 버튼을 선택합니다(암호 창이 이메일/사용자 이름 창 바로 아래에 있는 경우 이를 건너뛸 수 있습니다).
동일한 절차에 따라 비밀번호를 입력합니다.
페이지에서 로그인 버튼을 클릭하고 팁 패널에서 클릭 버튼을 선택합니다.
Octoparse가 이제 웹 사이트에 성공적으로 로그인했습니다!
참고: 쿠키 지우기
모든 웹 사이트에서 쿠키를 다르게 처리하므로 작업 워크플로우가 일관되게 작동하도록 하려면 작업이 실행될 때마다 로그인 단계부터 시작합니다. 이렇게 하려면 로그인 페이지가 로드되기 전에 저장된 쿠키를 지울 수 있습니다. 이렇게 하면 대상 웹 사이트는 항상 사용자를 "잊어버리고" 모든 로그인 정보를 입력할 수 있는 로그인 페이지로 이동합니다.
웹 페이지로 이동을 클릭하고 옵션을 선택합니다.
웹 페이지를 로딩하기 전에 캐시 지우기를 선택합니다.
적용을 클릭합니다.
2. 쿠키를 사용하여 워크플로우 최적화
대부분의 경우 로그인 후 작업에 쿠키를 저장하여 워크플로우를 최적화할 수 있습니다. 이렇게 하면 Octoparse는 저장된 쿠키를 로드하는 동안 웹 사이트로 보내며 웹 사이트가 "당신"을 기억하고 로그인 단계를 생략할 가능성이 높습니다.
브라우저 모드로 전환
일반 브라우저에서와 마찬가지로 웹사이트에 로그인할 수 있습니다.
로그인 후 웹 페이지 이동 작업의 옵션 설정으로 이동하고 쿠키 사용을 선택한 다음 현재 페이지에서 쿠키 사용을 클릭합니다.
적용을 클릭하여 설정을 저장합니다.
이제 웹 페이지는 로그인을 "기억"하고 다음에 크롤러가 실행될 때 로그인 단계를 생략하게 되어 있습니다.
참고:
1. 저장된 쿠키는 만료되기 전에만 유효합니다.
쿠키는 다양한 형태로 제공됩니다. 일부는 특정 만료 시간이 있고, 다른 일부는 브라우저가 닫히면 즉시 만료됩니다. Octoparse에서는 저장된 쿠키가 만료되면 더 이상 작동하지 않습니다. 이를 해결하려면 업데이트된 쿠키를 가져와 저장하려면 브라우저 모드에서 로그인 단계를 다시 한번 거쳐야 합니다.
2. 암호가 잘 보호되어 있습니다.
Octoparse에서는 비밀번호를 입력하면 자신의 계정으로만 접근할 수 있습니다. 태스크를 내보내면 태스크에 저장된 암호가 자동으로 제거됩니다.
저장된 로그인 정보는 작업이 삭제되는 즉시 계정에서 영구적으로 제거됩니다.
3. 로컬 추출을 실행하는 동안 수동으로 캡차 해결할 수 있습니다.
캡차가 발생하면 로컬에서 작업을 실행할 때 캡차를 수동으로 입력할 수 있습니다.
Octoparse는 특정 유형의 캡차를 자동으로 처리할 수 있으며 캡차 해결을 참조할 수 있습니다.