Auto-detectは、OctoparseがWebページをスキャンし、繰り返し表示されるデータパターンを識別して、初期抽出ワークフローを生成する機能です。
リスト、表、検索結果、商品グリッド、ディレクトリなど、繰り返し項目があるページに向いています。
使うべきタイミング
- 商品、リスト、レビュー、検索結果などの繰り返し項目がある
- 素早く初期ワークフローを作りたい
- どの要素を手動選択すべきか分からない
- Octoparseにフィールドやページネーションを提案してほしい
- 後で生成ワークフローを確認・調整する前提で開始したい
動作の流れ
対象ページを開く
抽出したいデータがあるページを開きます。
Auto-detectを実行する
Octoparseにページをスキャンさせ、繰り返しデータ領域を検出します。
検出されたフィールドを確認する
提案フィールドが必要なデータに一致するか確認します。
ページ移動を確認する
ページネーション、スクロール、次ページ操作が適切か確認します。
テスト実行する
本番実行前にサンプル出力を検証します。
検出後に確認すること
| 項目 | 確認内容 |
|---|
| フィールド | 正しい値が取得されているか |
| フィールド名 | 分かりやすい列名か |
| ページネーション | 次ページへ正しく移動するか |
| 詳細ページ | 必要に応じて詳細ページを開けるか |
| 重複 | 不要な要素が含まれていないか |
| 欠損値 | 重要なフィールドが空になっていないか |
Auto-detectの出力をそのまま本番利用しないでください。必ずフィールド、サンプル実行、エクスポート結果を確認してください。