L'espressione regolare (RegEx) è una stringa di testo speciale che può definire un modello di ricerca, utilizzato dagli algoritmi di ricerca delle stringhe per le operazioni di "trova" o "trova e sostituisci" sulle stringhe. Puoi acquisire alcune nozioni di base sulle espressioni regolari qui.
In Octoparse, puoi utilizzare RegEx per abbinare/sostituire i caratteri in un valore di campo per perfezionare direttamente i dati estratti.
Lo strumento Octoparse RegEx è uno strumento integrato che offre un modo pratico per generare automaticamente espressioni regolari impostando vari criteri. Quando si sa poco su come creare la sintassi di un'espressione regolare, lo strumento RegEx sarebbe particolarmente utile.
Come accedere allo strumento RegEx
In Octoparse, ci sono due modi per accedere allo strumento RegEx:
1. Tramite il menu Pulisci dati
Selezionare il campo dati che desideri personalizzare.
Fare clic sul pulsante "..." e scegli Pulisci dati.
Fai clic su Aggiungi passaggio e seleziona l'opzione RegEx.
2. Tramite la barra laterale
Individua e fai clic sull'icona Strumenti nella barra di navigazione laterale sinistra.
Comprendere l'interfaccia dello strumento RegEx
Versione 8.8.0 o più recente
1. Pattern RegEx
Si tratta di una libreria di espressioni regolari predefinite e di uso comune. Puoi sfogliare o cercare un pattern adatto alle tue esigenze (ad esempio, per trovare corrispondenze con e-mail, numeri di telefono, URL o formati di data specifici). Questo è il modo più veloce per applicare una RegEx potente senza doverla creare tu stesso.
2. Generatore di RegEx AI
Stanco di scrivere espressioni regolari complesse? Utilizza il nostro Generatore di RegEx AI per crearle all'istante, semplicemente mostrando allo strumento ciò che desideri estrarre.
Come funziona:
Trovare il campo dati che desideri pulire, clicca su Altro >> Pulisci dati per quel campo.
Aggiungere un passaggio "Corrispondenza con espressione regolare" al flusso di lavoro nella sezione dell'anteprima dei dati.
Cliccare su Prova lo strumento RegEx!
Per ogni stringa di prova, evidenzia manualmente solo il testo che desideri trovare (ad esempio, NY nella contea di Suffolk, NY).
Fare clic su "Genera". L'IA analizzerà i tuoi esempi e proporrà un pattern RegEx.
Fare clic "Testa" per verificare che il pattern funzioni con tutti i tuoi campioni.
Fare clic "Applica e salva", assegna un nome al pattern e conferma.
3. Generatore di espressioni regolari
Questa è l'evoluzione della classica scheda Genera. Fornisce un'interfaccia intuitiva basata su form per creare la propria espressione regolare personalizzata selezionando le opzioni e inserendo i parametri (ad esempio, "Inizia con", "Finisce con", "Contiene"). Traduce automaticamente le scelte nella sintassi RegEx corretta, rendendolo perfetto per chi sta imparando o preferisce un approccio visivo.
Come utilizzare Octoparse RegEx Builder?
Qui ti presenterò come ottenere la longitudine dall'url di un'attività su Google Maps.
PASSAGGIO 1:
Selezionare le opzioni e inserire i parametri necessari, in seguito fare clic su Genera per ottenere un'espressione regolare.
"Inizia/Termina con": seleziona il contenuto che inizia o termina con, ma esclude il/i carattere/i inserito/i nella casella.
"Includi Inizio/Fine": questa opzione può essere utilizzata solo con "Inizia/Termina con" selezionata. Una volta selezionata "Includi l'inizio/la fine", il risultato della corrispondenza includerà la stringa di testo inserita.
"Contiene uno": seleziona il contenuto che contiene il/i carattere/i inserito/i.
PASSAGGIO 2:
Dopo applicato l'espressione regolare a quel campo dati, si può comunque provare prima il risultato e Conferma.
PASSAGGIO 3:
Una volta soddisfatti delle corrispondenze visualizzate in anteprima, fare clic sul pulsante "Applica" per confermare e implementare le modifiche.