Stai leggendo una guida tutorial per l'ultima versione di Octoparse. Se utilizzi una versione vecchia di Octoparse, ti consigliamo vivamente di aggiornarla perché è una versione più veloce, più semplice e più robusta! Scarica e aggiorna qui!
YouTube è considerato il secondo motore di ricerca più utilizzato nel mondo dopo Google, dove è disponibile un gran numero di video, i cui dati e commenti associati possono essere davvero preziosi.
Octoparse può fare facilmente lo scraping su YouTube con modelli predefiniti. Potresti volerlo controllare qui: Modelli predefiniti di scraping. Basta inserire una parola chiave/URL per estrarre i dati in pochi minuti!
In questo tutorial, ti mostreremo come estrarre informazioni sui video di tendenza da Youtube in soli 3 passaggi con la funzione di rilevamento automatico Octoparse.
Ecco il collegamento al video di tendenza di YouTube che utilizzeremo come esempio.
1. Creare un'azione Go To Web Page: per aprire la pagina web di destinazione
Inserire l'URL di destinazione nella homepage di Octoparse e fare clic su Start
2. Rilevare automaticamente i dati nella pagina web: per creare un flusso di lavoro
Cliccare su Auto-detect web page data e attendere del completamento del rilevamento
Dopo esser completato l'auto-detection, potrebbe essere necessario cliccare su Switch auto-detect results (cambia i risultati del rilevamento automatico) per assicurare che tutti i video vengono selezionati.
Andare all'anterprima dei dati per eliminare i campi dati indesiderati
Fare clic su Edit sotto Add page scrolls per impostare la modalità di scorrimento come scroll to the bottom of the page
Modificare il numero di volte di ripetizione a 20 (è possibile ripetere di più volte per ottenere più video)
Confermare le impostazioni
Cliccare su Create workflow (crea flusso di lavoro)
3. Eseguire l'estrazione: per ottenere i dati che vuoi
Fare clic su Save in alto a destra per salvare l'attività
Cliccare su Run e attendere che venga visualizzata la finestra di esecuzione dell'attività
Scegliere Run on your device (esegui sul tuo dispositivo) per eseguire l'attività sul tuo dispositivo locale o Run in the Cloud (esegui nel cloud) per fare l'estrazione nel cloud (disponibile solo per gli utenti premium).
Ecco i dati di esempio esportati: