当前位置: 首页 > news >正文

做外贸球衣用什么网站手机开发者选项怎么打开

做外贸球衣用什么网站,手机开发者选项怎么打开,网站建设与管理用什么软件有哪些,郑州网站建设公司有哪些前言 最近在学习Python爬虫的知识,既然眼睛会了难免忍不住要实践一把。 不废话直接上主题 代码不复杂,简单的例子奉上: import requests from lxml import etreecookie 浏览器F12网络请求标头里有 user_agent 浏览器F12网络请求标头里有…

前言

最近在学习Python爬虫的知识,既然眼睛会了难免忍不住要实践一把。

不废话直接上主题

代码不复杂,简单的例子奉上:

import requests
from lxml import etreecookie = '浏览器F12网络请求标头里有'
user_agent = '浏览器F12网络请求标头里有'
# 具体的方法网上有很多这里不是叙述的重点headers= {'User-Agent': user_agent,'Cookie': cookie,'Host': 'fanqienovel.com','Connection': 'keep-alive'
}url = "https://****"# 使用get方法请求网页
resp = requests.get(url, headers=headers)# 将网页内容按utf-8规范解码为文本形式
content = resp.content.decode('utf-8')# 将文本内容创建为可解析元素
html = etree.HTML(content)# 获取1
title1 = html.xpath('//*[@id="app"]/div/div[2]/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]# 获取2
title2 = html.xpath('//*[@id="app"]/div/div/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]

“获取1”是页面打开后直接复制的XPath路径,但根据这个路径获取不到数据,见截图。

但content是有内容的,参阅网上的方案都未决解,但提供了思路。

是网站做了反爬虫处理,复制的XPath不准确导致的,想了个办法将content的内容复制到txt文档,然后修改为html的后缀用浏览器打开,在新的网页下重新复制XPath就得到了“获取2”的路径,可以发现1和2路径是有差异的。

问题到这就解决了。

http://www.sczhlp.com/news/149772/

相关文章:

  • 外贸海外网站推广网站开发中网页上传和发布
  • 崇州园区营销网站建设莱芜金点子最新招工招聘启事
  • 东莞企业网站建立报价一台vps可以做几个网站
  • 好发信息网网站建设wordpress免登录发布接口
  • 微信网站开发平台服务器网站建设维护
  • 装饰设计网站大全广州专业的网站建设公司
  • 河南专业网站建设公司首选小程序开发课程
  • 住房和城乡建设部的网站阳江保安招聘网
  • 今科网站建设淘宝的网络营销模式
  • 服务周到的网站建站DZ做的网站
  • 百度网游排行榜seo优化一般包括哪些内容()。
  • 东营网站开发公司四川省建设厅官方网站三内人员
  • 定制高端网站建设报价在线logo设计生成器
  • 电子商务网站开发实务石道元优酷视频放到网站上怎么做
  • 心理网站模板四川住房城乡建设厅官网
  • 内部券网站怎么做大岭山镇仿做网站
  • python做网站后台网站开发英文
  • 福田附件网站建设公司wordpress角色模板
  • 网站域名后缀代表什么优书网有官方app吗
  • 图片任意切割工具(Python 3.8 实现)
  • chaincd wordpressseo文章范文
  • 携程网站开发网页图片加载失败
  • 写字就能赚钱做网站wordpress建站用什么意思
  • 域名备案与网站不一致单页销售网站源码
  • 南京传销是以网站开发用vs2008做的网站前台脚本是什么
  • 高端网站建设 杭州如何做网络营销推广ppt
  • 成都工信部网站apache wordpress 404
  • 360网站弹窗推广怎么做的西安网站设设
  • 有经验的大良网站建设泾川县住房和城乡建设局网站
  • 商业网站在规划与设计时应着重考虑哪些因素高端网站建设搭建