メインコンテンツへスキップ
Auto-detectは、OctoparseがWebページをスキャンし、繰り返し表示されるデータパターンを識別して、初期抽出ワークフローを生成する機能です。 リスト、表、検索結果、商品グリッド、ディレクトリなど、繰り返し項目があるページに向いています。

使うべきタイミング

  • 商品、リスト、レビュー、検索結果などの繰り返し項目がある
  • 素早く初期ワークフローを作りたい
  • どの要素を手動選択すべきか分からない
  • Octoparseにフィールドやページネーションを提案してほしい
  • 後で生成ワークフローを確認・調整する前提で開始したい

動作の流れ

1

対象ページを開く

抽出したいデータがあるページを開きます。
2

Auto-detectを実行する

Octoparseにページをスキャンさせ、繰り返しデータ領域を検出します。
3

検出されたフィールドを確認する

提案フィールドが必要なデータに一致するか確認します。
4

ページ移動を確認する

ページネーション、スクロール、次ページ操作が適切か確認します。
5

テスト実行する

本番実行前にサンプル出力を検証します。

検出後に確認すること

項目確認内容
フィールド正しい値が取得されているか
フィールド名分かりやすい列名か
ページネーション次ページへ正しく移動するか
詳細ページ必要に応じて詳細ページを開けるか
重複不要な要素が含まれていないか
欠損値重要なフィールドが空になっていないか
Auto-detectの出力をそのまま本番利用しないでください。必ずフィールド、サンプル実行、エクスポート結果を確認してください。