Octoparse

正規表現（regex）は、Octoparseでスクレイピングしたデータを整形・フィルタリング・正確に抽出するために利用できる強力なパターンマッチングツールです。本チートシートでは、基本的な構文からスクレイピングに役立つ実用例までをまとめています。

___________________________________________________________

3. グループ &amp; 先読み／否定先読み

例: <code>user@example.com</code>

- 例: <code>user@example.com</code>

- 例: <code>(123) 456-7890</code>

例: <code>03-1234-5678</code>, <code>090-1234-5678</code>

- 例: <code>03-1234-5678</code>, <code>090-1234-5678</code>

例: <code>https://octoparse.com/docs</code>

- 例: <code>https://octoparse.com/docs</code>

例: <code>$19.99</code>, <code>$100</code>

- 例: <code>$19.99</code>, <code>$100</code>

✔ まずテスト: <a href="https://regex101.com/" rel="nofollow noopener noreferrer" target="_blank">Regex101.com</a> でデバッグ ✔ 特殊文字はエスケープ: <code>.</code> や <code>*</code> は <code>\.</code> <code>\*</code> のように ✔ XPathと組み合わせ: <code>//div[matches(text(), '\d+% off')]</code>

5. クイックリファレンステーブル

*「camelCase（キャメルケース）」はプログラミングの命名規則のひとつで、単語をつなぐときに先頭を小文字にし、それ以降の単語の頭文字を大文字にする書き方です（例：userName）。 🐫キャメル＝ラクダのコブのように、大文字が単語の区切れ目になることから名付けられています。

データ抽出のための正規表現（Regex）チートシート

Go to Octoparse.com

Octoparse DE

Octoparse FR

Octoparse ES

Octoparse JP

ダウンロード

ブログ

API Docs

Intercom のサポートやコミュニティのエキスパートに質問し、答えてもらいましょう。

メッセンジャーを介して開始した会話はこちらに表示されます。

作成されている会話はありません

別のキーワードを使用するか、入力ミスがないか確認してみてください。

別のキーワードやフィルタを使用してみてください。

会話が見つかりません

タイトル

このサイトでは、当社および当社の第三者ベンダーが、当社のクッキーポリシーに記載された目的のために、お客様とサイトでのやりとり（閲覧したコンテンツ、カーソルの動き、画面の記録、チャット内容を含む）に関する個人情報を監視および記録するために、クッキーやその他の技術を使用しています。当サイトを引き続きご利用いただくことで、{websiteTermsLink}、{privacyPolicyLink}および{cookiePolicyLink}に同意したことになります。

このサイトでは、サイトの運営に必要不可欠なCookieおよび類似のテクノロジー（以下「Cookie」）を使用します。また、当社とパートナーは、サイトのパフォーマンス分析、機能、広告、ソーシャルメディア機能を有効にするために、追加のクッキーを設定したいと考えています。詳細については、{cookiePolicyLink}をご覧ください。クッキーの設定は、[クッキー設定] で変更することができます。

当社では、ウェブサイトの機能維持、分析、そして広告表示のためにクッキーを使用しています。オプションで必要に応じて希望するクッキーを有効または無効にできます。詳細については、{cookiePolicyLink}をご覧ください。

広告クッキーは、さまざまなブラウザやデバイスで利用されているサイト、コミュニケーション、その他のオンラインサービスの利用状況に関する情報を長期にわたって収集するために、広告パートナーによって設定されます。ここでの情報を使用して、利用者が興味を持つと思われるオンライン広告を表示し、広告のパフォーマンスを測定します。ソーシャルメディアクッキーは、ソーシャルメディアプラットフォームでコンテンツを共有するために当該のソーシャルメディアプラットフォームによって設定されます。また、他のオンラインサービスでの活動情報を追跡し、プライバシーポリシーに記載されている目的で使用することができます。

これらのクッキーにより、ウェブサイトは強化された機能とパーソナライズを提供できるようになります。当社または当社のページにサービスを追加したサードパーティプロバイダーによって設定される場合があり、許可しない場合、これらのサービスの一部またはすべてが正常に機能しない可能性があります。

ウェブサイトが機能するために不可欠なクッキーであり、当社のシステムで無効にすることはできません。

これらのクッキーを使用することで、訪問数やトラフィックソースをカウントし、サイトのパフォーマンスを測定および改善できます。これにより、どのページが最も人気があり、どのページが最も人気がないかを把握し、訪問者がサイト内をどのように移動しているかを確認できます。

お客様には、個人情報の販売をオプトアウトする権利があります。お客様のデータの使用方法について詳しくは、{cookiePolicyLink}をご覧ください。

お客様のプライバシーに関する選択

当社では、お客様の体験を向上させるためにクッキーを使用しています。クッキーの設定は以下でカスタマイズすることができます。詳細については、{cookiePolicyLink}をご覧ください。

クッキー設定

ヘルプセンターは空です

エラーが発生しました。そのページは存在しません。

ホーム

検索結果

がっかり

無表情

笑顔

考えています...

ソースを検索しています...

分析しています...

メッセンジャー経由で送信されたチケット、または会話内でサポートエージェントによって送信されたチケットがここに表示されます。

お客様が作成したチケットはありません

チケットが見つかりませんでした

御社に関連するすべてのチケットと会話の進捗状況を追跡

カスタマーポータル。

御社に関連するすべてのチケットの進捗状況を追跡

チケットポータル。

{assigneeName}さんがこちらに対応中です！

{assigneeName}さんがチケットを完了しました

{assigneeName}さんが近日中に対応する予定です

{assigneeName}さんが詳細情報を必要としています

あなたのチケットは完了しました

チケット

チケットポータルへのアクセス権限がありません

検索

検索をスキップしてください。あなたが何をしようとしているのかを説明し、根拠に基づいた回答を得てください。

このトピックに関する記事やガイドをご覧ください。

ワークスペースを作成し、一緒に働く人たちを招待しましょう。

アカウントを設定してください

最初のワークフローを作成し、それが最初から最後まで実行される様子を見てみましょう。

発送する

チームがすでに使用しているツールと連携して、データを取り込みましょう。

スタックを接続してください

製品内の各機能がどこにあるかをすばやく把握できるツアーです。

60秒で{appName}

このプロトタイプデモは、あなたが「 {title} 」を読んでいることを認識しています。現在の記事に戻ることはできますが、本番環境向けの記事対応 Fin 契約の実装は、まだ今後の課題となっています。

記事対応プロトタイプ版回答

すでに招待についてお尋ねいただいているため、このプロトタイプデモには次の機能を追加できます：各招待を送信する前に役割セレクターを使用して、チームメイトの担当業務に応じてアクセスを制限してください。

プロトタイプの役割制限に関するフォローアップ

このプロトタイプデモでは、まずワークスペースのプロフィールから始め、アクセスが必要なチームメンバーを招待し、その後使用している統合を接続することをお勧めします。

プロトタイプの利用開始に関する回答

このプロトタイプデモでは、統合はワークスペース設定から構成します。統合を選択し、アカウントを接続して、有効になっている権限を確認します。

統合機能プロトタイプ版回答

このプロトタイプデモでは、ワークスペースの設定からチームメイトを招待し、招待を送信する前に、各チームメイトに必要なアクセス権を選択してください。

チーム招待プロトタイプ版回答

このプロトタイプデモには、その質問に対するスクリプト化された回答はまだ含まれていません。チームの招待方法やソース記事の開き方について試しに尋ねてみてください。本番環境の Fin API は呼び出されませんでした。

プロトタイプ版の回答は利用できません

このページを開いています。これについて何でも聞いてください。ドキュメントをもとにお答えします。

パターン	例	マッチする内容
`.`	`a.c`	"abc", "a2c" (任意の1文字)
`\d`	`\d\d`	"42", "01" (数字2桁)
`\w`	`\w+`	"hello", "A1_" (英数字＋アンダースコア)
`\s`	`a\sb`	"a b" (空白文字)
`[abc]`	`[aeiou]`	"a", "e" (母音いずれか)
`[^abc]`	`[^0-9]`	"A", "!" (数字以外)
`^`	`^Hello`	"Hello" （文字列の先頭）
`$`	`world$`	"world" （文字列の末尾）

パターン	例	マッチする内容
*``**	*`ab`**	"b", "aaab" （0回以上の繰り返し）
`+`	`a+b`	"ab", "aaab" （1回以上の繰り返し）
`?`	`colou?r`	"color", "colour" （任意）
`{n}`	`\d{3}`	"123" （ちょうど3回）
`{n,}`	`\w{4,}`	"hello", "regex" （4回以上）
`{n,m}`	`\d{2,4}`	"12", "1234" （2〜4回）

Pattern	Example	Matches
`(abc)`	`(foo)+`	"foo", "foofoo" (キャプチャグループ)
`(?:abc)`	`(?:ab)+`	"abab" (非キャプチャグループ)
`(?=abc)`	`\w+(?=\.com)`	"google" in "google.com" (肯定先読み)
`(?!abc)`	`\d{3}(?!USD)`	"123" in "123EUR" (否定先読み)

タスク	正規表現
ハッシュタグ抽出	`#\w+`
HTMLタグ削除	`<[^>]+>`
日付（YYYY-MM-DD）	`\d{4}-\d{2}-\d{2}`
camelCase（キャメルケース）* 分割	`([a-z])([A-Z])` → `$1 $2`

データ抽出のための正規表現（Regex）チートシート

1. 基本的な正規表現構文

2. 量指定子（繰り返し）

3. グループ & 先読み／否定先読み

4. スクレイピング実用例

A. メールアドレス抽出

B. 電話番号

米国形式

日本形式

C. URLs

D. 価格

プロのヒント

5. クイックリファレンステーブル