メインコンテンツへスキップ
Octoparseは、ノーコードのWebデータ抽出プラットフォームです。Webサイト上のコンテンツを、視覚的なスクレイピングワークフロー、ローカル実行またはクラウド実行、ファイル・データベース・クラウドストレージ・外部システムへのエクスポートを通じて、構造化データに変換できます。 カスタムスクレイパーをゼロから開発・保守する代わりに、Octoparseでは「何を収集するか」「サイトをどう移動するか」「抽出データをどこへ送るか」をワークフローとして定義します。

Octoparseでできること

スクレイピングワークフローの構築

Webページ上のデータを選択し、クリック、ページネーション、スクロールなどの操作を設定して、再利用可能なタスクにします。

データ抽出の実行

Webサイト、タスク設定、自動化要件に応じて、ローカルまたはクラウドでタスクを実行します。

構造化データのエクスポート

CSV、Excel、JSON、Google Sheets、データベース、クラウドストレージなどに結果を出力します。

基本的な流れ

Octoparseのワークフローは、大きく3つの段階で進みます。
1

対象サイトを開く

URL、テンプレート、またはカスタムタスクから開始します。Octoparseは内蔵ブラウザでページを読み込み、サイトを確認・操作できるようにします。
2

抽出ロジックを定義する

取得したいデータフィールドを選び、リンクのクリック、ページネーション、スクロール、ログイン、フィールドの整形などのアクションを追加します。
3

実行してエクスポートする

タスクをローカルまたはクラウドで実行し、進行状況を確認したうえで、必要な形式または保存先にデータを出力します。

Octoparseが向いている用途

Octoparseは、Web上にデータは存在するものの、使いやすい構造化形式で提供されていない場合に役立ちます。 一般的な用途は次のとおりです。
  • 価格モニタリング
  • リード獲得
  • 市場調査
  • 商品・レビュー情報の抽出
  • ディレクトリやリスト情報の収集
  • 不動産、求人、EC、ソーシャルデータの収集
  • 業務レポートや運用フロー向けの定期データ収集
クリック、スクロール、詳細ページの展開、動的コンテンツの読み込みなど、ブラウザ操作が必要なサイトで特に有効です。

Octoparseではないもの

Octoparseは、汎用的な分析ツール、BIツール、データベースではありません。Webデータの収集と構造化を支援しますが、その後の分析、モデリング、レポート作成は通常ほかのツールで行います。 また、URLを送るだけで標準化されたレスポンスを返すホスト型スクレイピングAPIとも異なります。Octoparseのタスクはワークフローです。サイトの開き方、移動方法、抽出方法、整形方法、エクスポート先を定義します。
OctoparseとはOctoparseではないもの
ノーコードWebデータ抽出プラットフォームBIダッシュボードツール
スクレイピングタスクの視覚的ワークフロービルダーあらゆるデスクトップ操作を行う汎用RPA
抽出タスクを実行・自動化するツールすべてを自動で処理するホスト型スクレイピングAPI
構造化されたWebデータを作るツール分析・レポート作成ツールの代替

ブラウザベースの抽出

Octoparseには、タスク作成時にWebサイトを操作するための内蔵ブラウザがあります。通常のタスク作成モードでは、クリックで要素を選択し、アクションを作成します。ログイン、ポップアップの閉鎖、チャレンジ対応など手動操作が必要な場合は、Browse Modeで通常のブラウザに近い操作ができます。 このブラウザベースの仕組みは、静的HTMLにデータがないサイトや、ページ操作によって抽出内容が変わるサイトで有効です。
タスクの挙動は、Webサイトの構造、タスク設定、抽出モード、ローカル実行かクラウド実行かによって異なります。

次に読むページ

コアコンセプトを理解する

タスク、フィールド、アクション、実行、エクスポートなどの基本要素を学びます。

コードなしでタスクを構築する

Octoparseで視覚的にスクレイピングワークフローを作成する方法を確認します。

ローカル実行とクラウド実行を比較する

いつローカルで実行し、いつクラウドを使うべきかを理解します。

エクスポートオプションを見る

抽出データをどの形式・保存先に出力できるかを確認します。