网络状态全球地区

hello@oxylabs.io

中文 (CN)

中文

English

代理

住宅代理

动态住宅代理

全球1亿多真实家庭住宅代理池用来无IP封锁的抓取

ISP代理

通过可信的ASN绕过艰难目标

移动代理

利用真实移动设备 IP 地址的强大功能

数据中心代理

数据中心代理

高速、成本效益高的数据采集，成功率达99.9%.

静态数据中心代理

市场上性能更佳的代理

高级代理解决方案

网页解锁器

人工智能驱动的代理解决方案，实现无封锁抓取

立减40%

爬虫 API

网络爬虫 API

大多数网站提供的公共数据交付

功能

网络爬虫

探索网站上的所有网页并大规模获取数据

任务管家

以指定频率规划多项抓取解析作业

自定义解析器新内容

通过执行指定解析指令来解析抓取到的文件

价格

代理

数据中心代理

高性价比的解决方案

起售价

0.7美元/IP

免费IP

静态数据中心代理

性能卓越

起售价

1.2美元/IP

动态住宅代理

全球1亿多真实IP

起售价

2.5/GB

ISP代理

无限会话代理

起售价

1.2美元/IP起

移动代理

3G/4G/5G移动代理

起售价

3.5/GB

爬虫 API

网络爬虫 API

数据源自主流网站

起售价

0.25美元/千个结果

高级代理解决方案

网页解锁器

人工智能驱动的代理解决方案

立减40%

起售价

~~5美元~~3美元/GB

可免费试用

教程中心

入门

知识库

阅读有关网络爬虫、代理和更多内容的最新文章

视频教程

查看我们的视频，了解有关数据收集问题和解决方案的更多信息

解决方案

找到最适合您的商业用例的产品

快速入门指南

RP Quick start guide 动态住宅代理快速入门指南

Shared DC Quick start guide 动态数据中心代理快速入门指南

DC Quick start guide 静态数据中心代理快速入门指南

了解更多

无头浏览器

渲染JavaScript并从复杂的网页中提取数据。
配置浏览器指令以自动化用户交互。
自定义浏览器行为以模拟自然用户。

* 无头浏览器是爬虫API和网页解锁器的功能。

JavaScript 渲染

一些网站内容仅在渲染JavaScript时显示。使用Oxylabs爬虫API进行网页抓取时，您可以使用无头浏览器功能执行JavaScript并将更多数据加载到页面上。无头浏览器用一行代码渲染基于JavaScript的页面，以节省时间和资源，用于主要任务——后续数据分析。

自定义浏览器指令

通过设置自定义浏览器指令执行动作序列，完成特定任务。无头浏览器执行鼠标点击、输入文本、滚动页面、等待元素出现等操作。为了自动化需要用户交互的数据提取任务，您应该：

通过检查HTML元素研究网页布局
识别包含目标数据的交互式元素
定义与元素交互并加载所需数据的浏览器指令

{
   "source": "universal",
   "url": "https://www.ebay.com/",
   "render": "html",
   "browser_instructions": [
      {
         "type": "input",
         "value": "pizza boxes",
         "selector": {
            "type": "xpath",
            "value": "//input[@class='gh-tb ui-autocomplete-input']"
         }
      },
      {
         "type": "click",
         "selector": {
            "type": "xpath",
            "value": "//input[@type='submit']"
         }
      },
      {
         "type": "wait",
         "wait_time_s": 5
      }
   ]
}

使用浏览器自动化进行网页抓取

通过设置等待时间和动态元素加载的超时期限，自动化浏览器行为，以便在进行网页抓取之前加载元素。无头浏览器让您专注于数据分析，将基础架构管理和网络数据提取活动（如文档对象模型（DOM）操纵、JavaScript渲染和JavaScript指纹）交给我们。

什么是无头浏览器？

无头浏览器是Oxylabs爬虫API和网页解锁器的功能之一，允许您定义特定于网站的交互以加载动态元素。

第一步

用户向爬虫API/ 网页解锁器提交浏览器指令。

第二步

无头浏览器，是爬虫API或网页解锁器的功能之一，向目标网页发送HTTP(S)请求。

第三步

无头浏览器以用户定义的方式与网页交互，加载所需数据。

第四步

提取的数据以原始HTML或结构化JSON文件的形式传输到用户的存储。

具有无头浏览器功能的解决方案

免费试用我们的爬虫API和网页解锁器，包括无头浏览器的访问权限。

电商爬虫API

抓取电商产品页面并返回随时可用的数据。

1000多家电子商务网站
自适应解析器
JSON格式的结构化数据

最适用于：

定价情报、产品目录映射、竞争者分析。

免费试用

网页爬虫API

可从大多数网站收集可扩展的实时数据。

可定制的请求参数
JavaScript渲染
方便交付

最适用于：

网站更改监控、欺诈防护、旅行费用监控。

免费试用

SERP爬虫API

主要搜索引擎提供的城市级别SERP数据交付。

本地化搜索结果
实时可靠的数据
能很好地适应SERP布局变化

最适用于：

关键词数据收集、品牌监控、广告数据追踪。

49美元起/月

网页解锁器

访问最严密的网站的公共数据。

轻松模仿真实的网站用户
绕过高级反爬虫系统
在网站上表现为自然用户

最适用于：

处理最严密网站的反爬虫和CAPTCHAs。

75美元起/月

免费试用

Aivaras Steponavicius

Oxylabs客户经理

使用无头浏览器，您可以自动化用户交互以加载动态数据进行提取。这个功能节省时间和资源，因为您不必开发和维护自己的无头浏览器解决方案。

Ruta Petronyte

Oxylabs客户经理

无头浏览器极大地简化了使用浏览器指令进行数据提取的整个过程，使我们的客户能够快速地对网站进行交互。

来自您专属客户经理的寄言

购买特定企业套餐，您将拥有专属的客户经理。

实用资源

文档

逐步指南

通过我们的技术文档了解如何设置浏览器指令。

Github

编写浏览器指令

在GitHub上查看教程，并将代码直接复制到无头浏览器。

博客

什么是无头浏览器？

了解无头浏览器：用途、示例和限制。

常见问题

无头浏览器和普通浏览器之间有什么区别？

无头浏览器没有图形用户界面，并通过用户输入的代码进行程序化控制，与常规浏览器相比，具有更多的控制权。

使用无头浏览器的常见用例是什么？

无头浏览器的用例是进行网页自动化以进行数据提取：

在目标网站上执行JavaScript进行数据提取。
在不管理额外基础架构的情况下，抓取JavaScript密集的网站组件。
从需要用户交互的网页中提取数据（加载、滚动、输入文本）。
工作流程优化 – 在结束抓取任务之前自动化等待元素或资源加载的时间。

使用无头浏览器有哪些好处？

与常规浏览器相比，无头浏览器通常在网页浏览器-服务器通信方面提供更多控制权，因为您可以定制所有网页交互的部分。除此之外，无头浏览器具有易于扩展和在没有图形用户界面的情况下在后台运行的优点，利用更少的资源，使所有过程更快。

无头浏览器如何处理JavaScript渲染？

无头浏览器读取网站的HTML代码并执行其中找到的JavaScript代码。 JavaScript代码的一部分可能会使无头浏览器发起HTTP请求以获取其他数据。然后，将其他数据加载到HTML DOM（文档对象模型）上，并作为结果对用户可见。

什么是最好的无头浏览器？

如果您使用Oxylabs的解决方案，如爬虫API或网页解锁器，无头浏览器功能是最佳选择。

根据您的使用情况和对某些软件的熟悉程度，有多种无头浏览器的选择。

无头浏览器有哪些缺点？

没有图形用户界面可能导致渲染差异。在调试时，缺乏可视化表示会使发现网站布局变化变得更加困难，因为读取HTML源代码是唯一的指导。

选择Oxylabs®，业务更上一层楼

联系我们

一般信息:
hello@oxylabs.io
客服团队:
support@oxylabs.io
销售团队:
sales@oxylabs.io

经过认证的数据中心和上游提供商

关注我们

微信公众号
微信号
Oxylabs

公司

代理

高级代理解决方案

网页解锁器

爬虫 API

网络爬虫 API

资源

隐私政策