メインコンテンツへスキップ
リード獲得はWebスクレイピングの実用性が高い用途です。固定の名簿を買う代わりに、ディレクトリ、地図、マーケットプレイス、検索結果、企業サイト、求人サイト、レビューサイトから最新の公開ビジネス情報を集めます。 重要なのは、ただページを抽出することではありません。どのソースが適切か、どのフィールドが営業判断に必要か、どう検証するか、プライバシーや利用規約上問題がないかを設計することです。

よく使うソース

ソース向いている用途主なフィールド
地図・ローカルディレクトリ地域ビジネスの発見店舗名、住所、電話、Webサイト、カテゴリ、評価、営業時間
業界ディレクトリ特定業界のB2Bターゲティング会社名、専門領域、地域、認証、連絡先URL
マーケットプレイス出品者、代理店、サービス提供者出品者名、プロフィールURL、カテゴリ、レビュー
企業サイト連絡先エンリッチメントemail、電話、SNS、拠点、contact page
求人サイト成長・購買意欲のシグナル募集職種、部署、勤務地、技術スタック
たとえば、地域代理店ならGoogle Mapsで「Austinの歯科医院」を集め、各サイトから公開emailやSNSを補完し、評価、レビュー数、Webサイト品質でスコアリングします。B2B SaaSなら求人情報から、特定の課題や導入意欲を示す企業を見つけられます。

フィールド設計

基本フィールド:
  • 会社/店舗名
  • Webサイト
  • カテゴリ/業界
  • 住所、都市、国
  • 電話番号
  • source URL
  • 取得日時
評価・絞り込みに使うフィールド:
  • rating、review count
  • 従業員数、拠点数
  • 求人情報
  • 使用技術のシグナル
  • SNS URL
  • 最終レビュー日や最近の活動
すべての行にsource URLと取得日時を残します。重複排除、更新、opt-out対応の基礎になります。

エンリッチメントの流れ

  1. 地図、ディレクトリ、検索結果で会社を発見する
  2. 名前、住所、電話、URLを正規化する
  3. 企業サイトから公開email、contact page、SNSを補完する
  4. 求人、レビュー、投稿などのintent signalを追加する
  5. fit、鮮度、地域、完全性でスコアリングする
  6. 条件を満たすものだけCRMへ送る
Google Maps系テンプレートでは、検索語、地域、URL、Place IDを入力し、店名、住所、電話、Webサイト、rating、review count、category、coordinates、hoursなどを出力するものが一般的です。この構造は、発見とエンリッチメントを分けるよいモデルです。

品質とコンプライアンス

  • domain、電話、住所で重複排除する
  • チェーン店の本部と支店を区別する
  • emailは配信可能性と利用目的を確認する
  • 閉店、古い求人、古いレビューを検知する
  • 個人情報や機微情報は最小限にする
  • robots.txt、利用規約、opt-outを尊重する
リードスクレイピングは、同意やプライバシー義務を回避する手段ではありません。収集、保管、営業利用までを一つの管理されたプロセスとして扱う必要があります。 Apify、Bright Data、Octoparseのようなテンプレートやmanaged scraperは、Google Maps、Yelp、求人、会社ページのような定番ソースに向いています。特殊な業界や複数ソースを組み合わせる場合は、カスタムworkflowで発見、補完、検証、スコアリングを分けて設計します。