CAPTCHAは、通常ユーザーと自動化された挙動を区別するためにWebサイトが表示する認証チャレンジです。タスク作成中または抽出中にCAPTCHAが表示されると、タスクが一時停止、失敗、または不完全なデータを返すことがあります。
CAPTCHAが出やすいケース
- 短時間に多くのリクエストを送っている
- 同じIPから繰り返しアクセスしている
- ログインやセッション挙動が不自然
- クラウド環境からのアクセスをサイトが信頼していない
- 強いアンチボット対策がある
- 使用しているプロキシやIPの評価が低い
最初に確認すること
ローカルでテストする
CAPTCHAがタスク作成時、ローカル実行時、クラウド実行時のどこで出るか確認します。
ワークフローを遅くする
待機を追加し、頻度を下げ、不要な繰り返し操作を減らします。
ログインとCookieを確認する
ログインが必要な場合はセッションが有効か確認します。
プロキシを確認する
IP評価や地域が原因の場合、適切なプロキシ設定をテストします。
ログを確認する
CAPTCHAが発生するステップと継続可否を確認します。
対応方法
| 方法 | 役立つケース |
|---|
| 待機を追加する | 速すぎる操作に反応している場合 |
| スケジュール頻度を下げる | 実行回数が多すぎる場合 |
| Cookieを安定させる | セッション継続が必要な場合 |
| プロキシを設定する | IPや地域が影響している場合 |
| ローカルで実行する | クラウド環境がブロックされる場合 |
CAPTCHAは自動アクセスを防ぐための仕組みです。サイト規約や法令に反する方法でセキュリティ制御を回避しないでください。