网络状态全球地区

hello@oxylabs.io

中文 (CN)

中文

English

代理

住宅代理

动态住宅代理

全球1亿多真实家庭住宅代理池用来无IP封锁的抓取

ISP代理

通过可信的ASN绕过艰难目标

移动代理

利用真实移动设备 IP 地址的强大功能

数据中心代理

数据中心代理

高速、成本效益高的数据采集，成功率达99.9%.

静态数据中心代理

市场上性能更佳的代理

高级代理解决方案

网页解锁器

人工智能驱动的代理解决方案，实现无封锁抓取

立减40%

爬虫 API

网络爬虫 API

大多数网站提供的公共数据交付

功能

网络爬虫

探索网站上的所有网页并大规模获取数据

任务管家

以指定频率规划多项抓取解析作业

自定义解析器新内容

通过执行指定解析指令来解析抓取到的文件

价格

代理

数据中心代理

高性价比的解决方案

起售价

0.7美元/IP

免费IP

静态数据中心代理

性能卓越

起售价

1.2美元/IP

动态住宅代理

全球1亿多真实IP

起售价

2.5/GB

ISP代理

无限会话代理

起售价

1.2美元/IP起

移动代理

3G/4G/5G移动代理

起售价

3.5/GB

爬虫 API

网络爬虫 API

数据源自主流网站

起售价

0.25美元/千个结果

高级代理解决方案

网页解锁器

人工智能驱动的代理解决方案

立减40%

起售价

~~5美元~~3美元/GB

可免费试用

教程中心

入门

知识库

阅读有关网络爬虫、代理和更多内容的最新文章

视频教程

查看我们的视频，了解有关数据收集问题和解决方案的更多信息

解决方案

找到最适合您的商业用例的产品

快速入门指南

RP Quick start guide 动态住宅代理快速入门指南

Shared DC Quick start guide 动态数据中心代理快速入门指南

DC Quick start guide 静态数据中心代理快速入门指南

了解更多

网络爬虫

在目标网站探索并收集相关数据
控制抓取的方法和范围；定义最终结果
可以通过解析后数据、一组HTML或URL列表的形式获取结果

*网络爬虫是爬虫API的一项功能

快速从网站上收集相关数据

只需几秒即可在网站中抓取您需要的数据。网络爬虫能够根据您选择的标准有效地爬取任何网站，并顺利地将完整的数据返回给您。

轻松控制范围，定制您的最终结果

有了网络爬虫，您可以完全控制创建和进程。您还可以使用筛选器和抓取参数（如正则表达式、代理地理位置、结果存储等）指定网站的抓取方式。

以指定的格式检索您的结果

根据您的数据需求获得结果。有三种输出格式：一个URL列表（网站地图），一组HTML文件，以及解析后数据。也可以选择让网络爬虫将结果文件上传到您的云存储中。

网络爬虫是如何工作的？

网络爬虫是Oxylabs爬虫API的一个插件，它允许您利用API的抓取和解析功能来实时大规模网站爬取。选择一个起始URL，指定抓取模式，让网络爬虫穿过网站，并在您选择的云存储桶中收到结果。

用户输入

服务用户形成一个确定爬取范围的输入值，指定抓取参数，并向作业启动端点提交请求。

网络爬虫

网络爬虫通过使用页面之间的链接穿过网站，直到它无法再发现符合用户指定模式的新URL。

爬取结果

网络爬虫会将结果文件（网站地图、解析后数据或HTML文档）汇总为一个或多个结果文件，作为最终的输出结果备用。

传输到云端

也可以让网络爬虫将文件上传到客户指定的AWS S3的云存储位置。

具有网络爬虫功能的爬虫API

作为Oxylabs爬虫API的附加功能，网络爬虫允许您使用我们免维护的基础架构，轻松有效地发现和收集数据。

电商爬虫API

抓取电商产品页面并返回随时可用的数据。

1000多家电子商务网站
自适应解析器
JSON格式的结构化数据

最适用于：

定价情报、产品目录映射、竞争者分析。

49美元起/月

免费试用

网页爬虫API

可从大多数网站收集可扩展的实时数据。

可定制的请求参数
JavaScript渲染
方便交付

最适用于：

网站更改监控、欺诈防护、旅行费用监控。

49美元起/月

免费试用

Aivaras Steponavicius

Oxylabs客户经理

当您从一个网站上提取数据之前，您通常需要先做一些网络爬取，以找到您感兴趣的特定URL。网络爬虫可以自动为您解决这个问题。

Ruta Petronyte

Oxylabs客户经理

网络爬虫是对我们的爬虫API的一个很好的补充，它可以让您使用Oxylabs的免维护基础架构高效地探索和收集数据。

来自您专属客户经理的寄言

通过Oxylabs公司和企业套餐，您将获得自己专属的客户经理。

实用资源

文档

网络爬虫文档

查看深入的指南，了解使用网络爬虫的详情。

视频

分步指南

要直观地了解爬取作业的启动过程，请看我们的视频指南。

博客

该从哪里开始及其工作原理

请阅读我们的博客，快速了解使用网络爬虫的技术特点。

常见问题

什么是网络爬虫？

网络爬虫是Oxylabs爬虫API的一项功能，它可以爬取任何网站，选择有用的内容，并完成批量交付。

网络爬虫有何作用？

网络爬虫可以探索网站上的所有页面，并实时大规模数据获取。

该工具将跟踪从最初的网页到其他网页的链接，直到它访问并搜索了在一个特定网站上能找到的所有网页。

爬取网站的行为是否合法？

该答案取决于您目前的具体任务。在爬取之前，应确保您符合所访问特定公共领域的相应法律。我们的团队建议寻求专业的法律指导。

网络爬虫的使用人群包括？

网络爬虫被普遍用于个人和组织 - 任何需要从网站收集数据的人 - 包括但不限于：

搜索引擎对网页进行索引和组织，让用户能够轻松地找到相关信息。
电商公司收集有关其竞争对手的产品、价格和促销活动的信息。
营销专业人士收集目标受众的数据，监测社交媒体上的关注，并跟踪其品牌的在线声誉。
政府机构监督网站的非法或有害内容，并为安全目的收集情报。
网站所有者检查他们网站的搜索引擎排名，找出损坏的链接，并跟踪他们品牌的在线声誉。

选择Oxylabs®，业务更上一层楼

联系我们

一般信息:
hello@oxylabs.io
客服团队:
support@oxylabs.io
销售团队:
sales@oxylabs.io

经过认证的数据中心和上游提供商

关注我们

微信公众号
微信号
Oxylabs

公司

代理

高级代理解决方案

网页解锁器

爬虫 API

网络爬虫 API

资源

隐私政策