メインコンテンツへスキップ
Amazonは価値が高く、同時に難易度も高いECデータソースです。商品ページには価格、seller、review、variant、rank、画像、specが含まれますが、ページは動的で、地域差があり、強い監視もあります。 最初に決めるべきことは、どのページ種別が必要かです。検索結果、商品詳細、レビューは別workflowとして扱います。
ページ種別向いている用途主なフィールド
検索結果商品発見、rank監視title、URL、image、price、rating、review count、ASIN
カテゴリassortment調査商品カード、順位、カテゴリURL、価格
商品詳細商品情報の深掘りbrand、ASIN、seller、bullets、description、specs、variant、BSR
レビューsentiment/品質分析rating、text、date、verified purchase、helpful count
sellerページmarketplace監視seller name、storefront、rating、出品範囲
Octoparse、Apify、Bright DataのAmazon系テンプレートも、多くは一覧、詳細、レビューを分けています。これはAmazonのページ構造に合っています。

入力の選び方

市場調査ならkeywordやcategoryから始めます。価格監視や既存catalogの更新ならASINや商品URLが安定します。
wireless keyboard
protein powder
https://www.amazon.com/dp/B08...
B08...

一覧データ

検索/カテゴリページでは、title、URL、ASIN、price、rating、review count、image、sponsored/organic、keyword/category、result position、timestampを集めます。順位は価格と同じくらい重要な分析軸になります。

商品詳細

詳細ページでは、brand、feature bullets、description、spec table、variant、seller、fulfillment、best-seller rank、stock/delivery hint、image setを取得します。価格や在庫は配送地域やmarketplace domainで変わるため、regionと取得日時を残します。

レビュー

レビューは別workflowにします。sort order、star filter、language、paginationで結果が変わるためです。rating、title、text、date、reviewer、verified purchase、helpful count、variant、review URLを保存します。

技術上の課題

Amazonでは、A/B test、地域差、CAPTCHA、bot detection、variant固有フィールド、review pagination、sponsored result混在が起こります。慎重なペース、実ブラウザ、安定したproxy/fingerprint、retry logic、cloud subtask分割が重要です。

テンプレートを使う場面

一般的なAmazonフィールドを早く取りたい場合はテンプレートが有効です。listing、product detail、Prime listing、review scrapingなどは定番です。独自SKU照合、社内catalog連携、特殊なalert logicが必要ならcustom workflowを組みます。 Amazonデータにはsellerやreviewer、marketplace ruleが絡みます。robots.txt、利用規約、個人情報、公式API/partner feedの有無を確認し、目的を絞って軽い収集にします。