主なソース
| ソース | データ |
|---|---|
| 物件ポータル | 掲載中物件、賃貸、写真、価格、間取り、面積、説明 |
| 成約履歴 | 売却価格、売却日、過去イベント |
| エージェント/ brokerageページ | 名前、電話、事務所、担当地域、掲載物件 |
| 公的記録 | parcel ID、税、所有者情報など公開範囲 |
| 賃貸サイト | 賃料、設備、空室、契約条件 |
| 地域ページ | 学区、通勤、周辺情報、market trend |
フィールド
- listing URL
- 住所、都市、郵便番号
- 緯度・経度
- sale/rent/sold/pendingなどの状態
- 価格または賃料
- bedrooms、bathrooms、面積、土地面積
- 物件種別、築年
- days on market
- agent、brokerage、電話
- description、image URLs
- first seen / last seen
重複と鮮度
同じ物件が複数ポータルに出ます。住所、coordinates、parcel ID、listing URL、価格、beds/baths、面積を組み合わせて重複排除します。ただしsource別レコードも残します。あるポータルは状態更新が早く、別のポータルは説明や写真が豊富なことがあります。代表的なworkflow
- 投資分析: 対象ZIPの物件を集め、価格/平方フィート、days on market、値下げを比較する
- 賃貸監視: bedroom数ごとの賃料、空室、再掲載を追跡する
- エージェント調査: 公開agentページや物件詳細から担当者、brokerage、掲載量を取得する
- 査定モデル入力: 成約履歴、現行掲載、物件属性、地域情報を組み合わせる