当前位置: 首页 > news >正文

easyspider使用教程

EasySpider 一款可视化爬虫软件。使用图形化界面,无代码设计和执行爬虫任务。开发者只需在网页上选择爬取内容,并根据提示框操作,即可完成爬虫设计和执行。

img

实现可视化浏览器自动化测试/数据采集/爬虫软件,可以使用图形化界面,无代码可视化的设计和执行任务。只需要在网页上选择自己想要操作的内容并根据提示框操作即可完成任务的设计和执行。同时软件还可以单独以命令行的方式进行执行,从而可以很方便的嵌入到其他系统中。

img

点击上面个人需要软件版本下载安装即可。

这里我安装了win64版本,解压缩打开软件即为下面界面:

img

可根据自身需要选择合适的选项,比如【使用纯净版浏览器设计】,点击一个【京东】的任务信息:

img

任务选择了京东,点击【执行任务】后会执行脚本,进行列表采集,如下:

img

如果需要爬取别的网页信息可以点击【修改任务】,会有如下的提示框,可以从左侧工具箱内将需要的功能拖入到流程图内,如下图所示:

img

拖动到流程图内的元素可以使用右键来进行节点操作,也可以从最右侧来进行更详细的自定义任务操作。

img

下面以我的网站采集所有的标题名并保存至excel为例:

首先新建一个任务,选择首页,输入自己的网址:www.xinyixx.com,点击标题,选择同类型全部元素,然后根据右下角的提示选择下一页:

img

下面是完整工作流:

img

直到循环结束,那么这个就实现了采集整个网站所有文章标题的任务,跟上面的提示一样,选择【执行任务】,等到【执行完毕】:

img

img

爬取完毕后文件会在软件安装目录下的【data】内显示,路径如下:

img

找到对应时间的Task文件夹,我这里打开csv文件,查看里面的内容:

img

从下图中可以看到,这个网站已经收录了400余篇文章,将所有的文章标题全都整合到一个csv文件内,非常方便。

img

我这里只是举了一个简单的例子,感兴趣的同学可以尝试该工具,试着爬取其他网站的图片或者有需要的信息。

http://www.sczhlp.com/news/403.html

相关文章:

  • 干货来袭!5 分钟学会快速实现责任链,效率直接拉满!
  • AI 赋能的云原生应用:技术趋势与实践
  • 免费云端部署工具
  • 乐高模型开发工具-studio
  • 介绍几个AI绘画网站和AI换脸功能
  • Kaggle入门指南
  • 一些免费的线上学习网站
  • 写一个音乐爬虫
  • 写一个3D旋转的python程序
  • 网页爬虫
  • 能够直接生成矢量图的AI工具
  • PS的AI插件--Alpaca
  • 【旧文】Adobe Express使用教程
  • 点云之间的距离和像素尺寸的大小之间是什么换算关系
  • HCIE学习之路:路由引入
  • HCIE学习之路:MSTP实现负载均衡实验
  • Linux系统安装配置Redis集群
  • TOP10迪士尼动画电影下载_公主系列迪士尼电影大全列表在线观看
  • python中pandas包的基本用法
  • 如何用两年时间面试一个人(by jobleap.cn)
  • 读后感
  • HCIE学习之路:一个NAT实验
  • HCIE学习之路:配置基于静态路由的GRE隧道
  • 2025年PLM合规性管理,6大策略,确保项目合法合规!
  • 国内最值钱 IT 公司排行
  • Fastmcp 案例二(SSE)
  • 编译安装 pg_stat_statements
  • Anaconda历史版本
  • 输入未知数目的数据
  • 常见的结构光编解码算法