ワークフロー概要
タスクを作成する
タスクは、OctoparseがWebサイトとどうやり取りするかを定義します。 作成方法には次があります。- テンプレートを使う
- Auto-detectでページデータを自動検出する
- ノーコードビルダーで要素を手動選択する
- クリック、スクロール、ループ、ページネーション、待機などのアクションを追加する
- エクスポート前にフィールド値を整形する
抽出ロジックをテストする
大規模に実行する前に、小さなサンプルでテストしてください。| 確認項目 | 理由 |
|---|---|
| フィールドが正しい | 間違った値の出力を防ぐため |
| フィールド名が明確 | 下流でデータを使いやすくするため |
| ページネーションが機能する | 複数ページを正しく移動できるか確認するため |
| 詳細ページが開く | リストから詳細ページへ移動するワークフローを確認するため |
| サンプル出力がきれい | エクスポート後の手作業を減らすため |
動的ページ、ログインが必要なページ、無限スクロール、ポップアップ、ユーザー操作後にデータが読み込まれるサイトでは、テストが特に重要です。
ローカルまたはクラウドで実行する
| 実行タイプ | 適した用途 |
|---|---|
| ローカル抽出 | テスト、デバッグ、ローカル環境に依存するタスク |
| クラウド抽出 | スケジュール実行、無人実行、大規模抽出 |
| Boost Mode | 対応しているクラウドタスクで速度や並列性が必要な場合 |
データをエクスポートする
タスク実行後、Octoparseは抽出結果を構造化レコードとして保存します。 一般的な出力先には次があります。- CSV
- Excel
- JSON
- HTML
- XML
- Google Sheets
- データベース
- クラウドストレージ
関連ページ
ローカル実行とクラウド実行
実行環境を比較し、適切な実行モードを選びます。
エクスポート形式
Octoparseが対応する出力形式を確認します。