Mailto-Links werden verwendet, um zu einer E-Mail-Adresse anstelle einer Webseiten-URL weiterzuleiten. Wenn ein*e Benutzer*in auf den Mailto-Link klickt, öffnet sich der Standard-E-Mail-Client auf dem Computer des Besuchers und schlägt vor, eine Nachricht an die im Mailto-Link genannte E-Mail-Adresse zu senden.
Falls eine Webseite „mailto“-Links enthält, ist es möglich, die E-Mail-Adressen daraus anstatt aus der Webseite-Struktur zu scrapen.
Ein standardmäßiger „mailto“-Link sieht im HTML-Quellcode wie folgt aus:
<a href="mailto:email@example.com">Send Email</a>
<a href="mailto:email@example.com, secondemail@example.com">Send Email</a>
Deshalb der folgende XPath funktioniert wahrscheinlich in einigen Fälle gut:
//a[contains(@href,'mailto')]
Notiz: Die obige Anweisung gilt nur für "mailto"-Hyperlinks wie diesen: