当前位置: 首页 > news >正文

第一个爬虫程序的开发

要点:

  1. 先要进行调用urlopen函数
  2. 设置网址的变量
  3. 内容获取:
    1.直接获只会得到源代码,是html文件
    2.若需要以网页的形式进行展示,需要将源代码以html的文件进行保存,并保存到本地,再执行命令
点击查看代码
from idlelib.iomenu import encoding
from urllib.request import urlopen  # 在url这个库里面请求模块里调用一个urlopen这个函数  模拟浏览器url = "http://www.baidu.com"   # 网址resp = urlopen(url) # 获取网页内容# print(resp.read().decode("UTF-8"))  # 打印内容.decode是为了字节解码,需要填写字符集(搜索charset,可以找出字符集),可以拿到页码面源代码with open("mybaidyu.html",mode = "w",encoding = "utf-8") as f:f.write(resp.read().decode("UTF-8")) #将源代码以html文件的形式存放在本地,之后可以打开,注意这是自己的网址,从页面源代码中提取内容到自己的网址
http://www.sczhlp.com/news/62665/

相关文章:

  • 在GNU/Linux环境中为网卡安装驱动:以Intel BE201为例
  • 怎么通过所有的网站推广广告怎么用2级目录做网站
  • 搭建网站是什么工作网站公司怎么做的好
  • 郴州做网站的百度引擎搜索
  • 泌阳县住房建设局网站网站建设套模
  • wordpress图床网站申请域名就可以做网站了吗
  • 网站备案取消 后果电信网站备案查询系统
  • 遵义网站建设有限公司常州网站公司
  • 影视网站模板搜索引擎营销包括
  • 电影分享网站源码h5免费制作网站有哪些
  • 网站推广的四个阶段是指外贸网站 字体
  • wordpress删除评论关闭seo技术培训宁波
  • cpp-mcp说明
  • malloc二维数组
  • 榆林电商网站建设网站开发2008
  • 电话销售网站建设话术文字变形logo设计生成器
  • 网站平台做期货卡一卡二三免视频
  • 公司做网站比较好的平台深圳建设发展有限公司
  • 重庆江津网站设计公司哪家好深圳手机商城网站设计公司
  • 网站规划设计的一般流程服务器上的网站怎么做301
  • 多元网站成都网站建设定制开发服务
  • 备份整个网站长春平原网站建设
  • 制作网站的模板上海市住房与城乡建设部网站
  • 网站建设 镇江规划网站建设的主要工作流程
  • 如何做餐饮的网站营销类型网站怎么建设
  • php网站建设步骤网站上传空间的ip地址
  • 技术的本质与边界:何时成功何时失败
  • AT_apc001_f XOR Tree
  • 2025.9.2 - 呓语
  • 给单位做网站需要多少钱网页传奇链接