メインコンテンツへスキップ
Octoparseは、Webサイトを開き、要素を操作し、抽出ワークフローを構築するためにブラウザベースの環境を使用します。クリック、スクロール、ログイン、JavaScript読み込み後に表示されるデータにも対応しやすくなります。

内蔵ブラウザ

内蔵ブラウザでは、対象サイトを開き、要素を選択し、アクションを作成し、抽出データをプレビューできます。 主な用途:
  • URLを開く
  • テキスト、リンク、画像などの要素を選択する
  • ボタンやメニューをクリックする
  • ページネーションや無限スクロールに対応する
  • ログインが必要なページを設定する
  • ページ読み込みを確認する

選択モードとBrowse Mode

モード用途
選択モードページ要素を選択し、抽出アクションを作成する
Browse Mode通常のブラウザのようにページを操作する
ワークフローテストタスクの動作とサンプル取得を確認する
Browse Modeは、ログイン、ポップアップの閉鎖、メニュー展開など、抽出設定前に手動操作が必要な場合に使います。

動的ページ

多くのサイトでは、初期読み込み後にデータが追加されます。Octoparseでは、待機、スクロール、クリック、ページネーションなどを組み合わせて設定できます。
ブラウザベースのタスクは対象サイトの構造と挙動に依存します。サイトが変わった場合、タスク調整が必要になることがあります。