当前位置: 首页 > news >正文

使用影刀RPA实现快递信息抓取

最近公司项目有个需求,要求抓取快递单号快递信息,比如签收地点、签收日期等。该项目对应的快递查询网站是一个国外的网站,他们有专门的快递平台可以用于查询。该平台提供了快递接口进行查询,但需要付费。同时也提供了免费的查询窗口,一次最多可以查询25个快递单号。我们的快递单号比较多,有几千个,这时候RPA工具就派上用场啦。

我们的任务很简单,就是根据Excel清单里面提供的快递单号,在对应位置的单元格写入获取到的签收信息即可。涉及到的技术点如下:

读取Excel

这个点需要说明一下,影刀RPA提供了数据表格以及Excel表格。这两个的需求就在于使用Excel表格必须要安装Office,否则无法使用其功能。而数据表格更通用,更像是一个内存型的数据表格,不需要安装Office。

image

模拟批量提交查询快递单号信息

这里需要说明的是,我是25个快递单号一组提交查询,抓取到信息保存,再提交25个新的快递单号查询,这样反复循环。格式上面要求每一个快递单号一行,最多25行。如图所示,最后一行的时候多一个换行,可以加个按键BackSpace,去除最后一行的换行,然后提交查询。

image

抓取带分页的快递信息

有两点需要注意:

  1. 首先要选择多页,此外要指定抓取的页数,因为我是25个一批,页面每页显示5个快递信息,那么就是5页。

  2. 我勾选了保存至数据表格,那么我也可以操作这个数据表格写入Excel。

image

写入Excel

抓取数据到数据表格后,就可以操作数据表格,写入Excel。

image

当然上图中,我也是25个一组获取到快递信息后,就及时写入Excel。这样保证如果中途中断,之前抓取过的信息仍然会保留。

上面用到的pitch2是一个插入Python代码段。影刀RPA就是这个好处,可以直接使用Python的能力嵌入到影刀中,开发非常方便。

image

总结

其实我之前是想通过爬虫程序去完成的,但是自从用了RPA工具就发现RPA做这类数据抓取的应用,效率更高。因为RPA跟爬虫的区别就在于,RPA最大化的模拟了人的鼠标点击和键盘操作,让对方的网站感觉是一个人在操作,而不是什么程序,这样被封杀的概率会降低。

http://www.sczhlp.com/news/13428/

相关文章:

  • 04_根据不同的值选择不同的执行语句
  • abc419
  • 0103_开闭原则
  • 在K8S中,Secret有哪些使用方式?
  • 2025.8.16打卡
  • AtCoder-Beginner-Contest-419
  • abc419 G Count Simple Paths 2 题解
  • 2025 暑期模拟赛题目选记
  • pytorch查询变量类型(字节数)
  • 第五周假期进度报告(8.10 - 8.16)
  • 对百度千帆AI大模型的认识
  • BZOJ杂题选记(8.11-8.16)
  • 在AI技术快速落地的时代,挖掘机器人控制的新需求成为关键——某知名人形机器人敏捷控制框架需求分析
  • 给水系统设计是建筑或工业项目中的一个重要部分,涉及到水源的获取、分配、使用以及废水的处理。对于初学者来说,了解整个设计流程和相关的基本知识是非常必要的。以下是一个简化的大纲,可以帮助你入门:
  • 串口调试经验杂谈
  • 2025.8.15 CSP-S模拟赛35
  • USB转TTL模块无法被PC识别问题解决
  • 初级排水系统设计主要关注基本的排水需求和系统稳定性,适用于一般居民区、商用区和小规模工业区的项目。设计方案强调排水能力的合理配置、经济性、可维护性和基础设施的环保要求。
  • MyBatis相关面试题
  • 2025.8.16总结 - A
  • 学习了
  • 代码随想录算法训练营第九天(栈与队列篇)|Leetcode232用栈实现队列,Leetcode225用队列实现栈,Leetcode20有效的括号,Leetcode1047删除字符串中的所有相邻重复项
  • 浅谈 - 百度千帆 AI 大模型
  • 串口通信ESP8266NodeMCU与STM32F106C8T6-Arduino平台
  • 20250816
  • 在K8S中,PodSecurityPolicy机制有何作用?
  • 8月16日
  • 吐槽国产厂商
  • 微服务面试
  • 好久没写博客了