収集対象
- ブランド/評判監視
- creator/influencer discovery
- 公開レビュー・苦情分析
- trend detection
- 採用・企業調査
- community research
- 競合コンテンツ分析
プラットフォーム別の考え方
| プラットフォーム | 公開データ例 | 用途 |
|---|---|---|
| posts、comments、subreddit、score | community research、sentiment | |
| YouTube | video metadata、comments、channels | creator discovery、review mining |
| TikTok | public videos、captions、creator profiles | trend monitoring |
| X/Twitter | posts、profiles、reply/repost/like | news、event monitoring |
| public profiles、companies、jobs、posts | B2B research、hiring signals | |
| Facebook/Instagram | public pages/posts/comments | local business、brand monitoring |
公開データとログインデータ
もっとも重要なのはアクセスレベルです。ログインなしで見える公開データ、ログイン後に見える公開ページ、DMやprivate groupのような非公開データは区別します。非公開・権限付きデータは明示的な許可がない限り避けます。技術的な課題
SNSは無限スクロール、cursor API、削除/編集、engagementの継続変化、personalized search、login prompt、rate limit、IP/fingerprint/behavior/account trustを組み合わせた防御を持ちます。 長期監視ではsnapshotを保存します。後で投稿が消えることがあるため、source timestamp、取得日時、削除対応を設計します。データ品質
- 言語判定
- repost/duplicate検出
- spam/bot account filtering
- time window正規化
- hashtag/mention抽出
- community context
- raw engagementではなくengagement rate