メインコンテンツにスキップ

XPathを通して「mailto」リンクから任意のウェブサイト上のメールアドレスを特定する

1年以上前に更新

「mailto」リンクは、ウェブページのURLではなく、電子メールアドレスにリダイレクトするために使用されます。ユーザーが「mailto」リンクをクリックすると、訪問者のコンピューター上のデフォルトのメールクライアントが開き、メールアドレスにメッセージの送信を提案します。

ウェブサイトに「mailto」リンクが含まれている場合、ウェブサイトの構造に関係なく、その中から電子メールアドレスをスクレイピングすることが可能です。

HTMLソースコードでは、標準的な「mailto」リンクは次のようになります:

<a href="mailto:email@example.com">Send Email</a>
<a href="mailto:email@example.com, secondemail@example.com">Send Email</a>

したがって、以下のXPathはいくつかのケースで役立つ可能性があります:

//a[contains(@href,'mailto')]

このXPathをどこに入力するかについては、このチュートリアルを参照してください:要素のXPathをカスタマイズする

注意:上記の指示は、「mailto」ハイパーリンクにのみ適用されます。

email_address_able_to_be_extracted.jpg
こちらの回答で解決しましたか?