メインコンテンツへスキップ
Webサイトは、アクセス頻度が高すぎる、通常のブラウザ挙動と異なる、同じIPから繰り返しアクセスしているなどの理由で、自動アクセスを制限または検出することがあります。 Octoparseには失敗を減らすための設定や運用方法がありますが、すべてのサイトでアクセスを保証するものではありません。

よくあるブロック要因

  • 短時間に多すぎるリクエスト
  • 同じIPからの繰り返しアクセス
  • 不自然なブラウザフィンガープリント
  • ログインやCookieの不整合
  • CAPTCHAチャレンジ
  • 地域やロケーションの不一致
  • 不自然な操作パターン
  • 実行中のセッション失効

症状と原因

症状考えられる原因
取得件数が少ないページネーション失敗、読み込み失敗、アクセス制限
CAPTCHAが出る不審なアクセスと判断された
ログインページに戻るセッションやCookieが失効した
クラウドとローカルで挙動が違う実行環境の違いにサイトが反応している
フィールドが空になるページ構造変更またはコンテンツブロック

関連機能

プロキシ

IP、地域、アクセス頻度が問題になる場合に使用します。

ブラウザフィンガープリント

ブラウザ信号が検出に与える影響を理解します。

CAPTCHA

CAPTCHAが表示された場合の対応を確認します。

自動ログイン・Cookie

ログインが必要なサイトでセッションを安定させます。
対象サイトが自動アクセスを明確に禁止している場合や、収集が許可されていないデータの場合は、スクレイピングを行わないでください。