Octoparseでできること
スクレイピングワークフローの構築
Webページ上のデータを選択し、クリック、ページネーション、スクロールなどの操作を設定して、再利用可能なタスクにします。
データ抽出の実行
Webサイト、タスク設定、自動化要件に応じて、ローカルまたはクラウドでタスクを実行します。
構造化データのエクスポート
CSV、Excel、JSON、Google Sheets、データベース、クラウドストレージなどに結果を出力します。
基本的な流れ
Octoparseのワークフローは、大きく3つの段階で進みます。Octoparseが向いている用途
Octoparseは、Web上にデータは存在するものの、使いやすい構造化形式で提供されていない場合に役立ちます。 一般的な用途は次のとおりです。- 価格モニタリング
- リード獲得
- 市場調査
- 商品・レビュー情報の抽出
- ディレクトリやリスト情報の収集
- 不動産、求人、EC、ソーシャルデータの収集
- 業務レポートや運用フロー向けの定期データ収集
Octoparseではないもの
Octoparseは、汎用的な分析ツール、BIツール、データベースではありません。Webデータの収集と構造化を支援しますが、その後の分析、モデリング、レポート作成は通常ほかのツールで行います。 また、URLを送るだけで標準化されたレスポンスを返すホスト型スクレイピングAPIとも異なります。Octoparseのタスクはワークフローです。サイトの開き方、移動方法、抽出方法、整形方法、エクスポート先を定義します。| Octoparseとは | Octoparseではないもの |
|---|---|
| ノーコードWebデータ抽出プラットフォーム | BIダッシュボードツール |
| スクレイピングタスクの視覚的ワークフロービルダー | あらゆるデスクトップ操作を行う汎用RPA |
| 抽出タスクを実行・自動化するツール | すべてを自動で処理するホスト型スクレイピングAPI |
| 構造化されたWebデータを作るツール | 分析・レポート作成ツールの代替 |
ブラウザベースの抽出
Octoparseには、タスク作成時にWebサイトを操作するための内蔵ブラウザがあります。通常のタスク作成モードでは、クリックで要素を選択し、アクションを作成します。ログイン、ポップアップの閉鎖、チャレンジ対応など手動操作が必要な場合は、Browse Modeで通常のブラウザに近い操作ができます。 このブラウザベースの仕組みは、静的HTMLにデータがないサイトや、ページ操作によって抽出内容が変わるサイトで有効です。タスクの挙動は、Webサイトの構造、タスク設定、抽出モード、ローカル実行かクラウド実行かによって異なります。
次に読むページ
コアコンセプトを理解する
タスク、フィールド、アクション、実行、エクスポートなどの基本要素を学びます。
コードなしでタスクを構築する
Octoparseで視覚的にスクレイピングワークフローを作成する方法を確認します。
ローカル実行とクラウド実行を比較する
いつローカルで実行し、いつクラウドを使うべきかを理解します。
エクスポートオプションを見る
抽出データをどの形式・保存先に出力できるかを確認します。