当前位置: 首页 > news >正文

如何在网站上做标注微信手机网站三合一

如何在网站上做标注,微信手机网站三合一,法律推广网站,如何在电脑上制作网页虽说现在大环境不太好,很多人面临着失业再就业风险,包括企业则面临着招人人,找对口专业难得问题。想要找到适合自己公司的人员,还要得通过爬虫获取筛选简历才能从茫茫人海中找到公司得力干将。废话不多说,直接开整。 1…

虽说现在大环境不太好,很多人面临着失业再就业风险,包括企业则面临着招人人,找对口专业难得问题。想要找到适合自己公司的人员,还要得通过爬虫获取筛选简历才能从茫茫人海中找到公司得力干将。废话不多说,直接开整。

在这里插入图片描述

1、导入所需的库:

import requests
from bs4 import BeautifulSoup
import re

这行代码导入了requests库,该库用于向网站发出HTTP请求;BeautifulSoup库,该库用于解析HTML文档;re库,该库用于处理正则表达式。

2、设置代理信息:

proxy_host = 'www.duoip.cn'
proxy_port = 8000
proxy = {'http': 'http://{}:{}'.format(proxy_host, proxy_port),'https': 'https://{}:{}'.format(proxy_host, proxy_port)'获取免费ip:jshk.com.cn/mb/reg.asp?kefu=xjy&csdn)
}

这行代码定义了代理的主机名和端口号,并将它们存储在proxy字典中。然后,我们使用format()函数将这些值拼接为代理URL。

3、发出HTTP请求:

response = requests.get('https://www.zhaopin.com/', proxies=proxy)

这行代码使用requests.get()函数向www.zhaopin.com发送GET请求。 proxies参数指定了代理服务器。

4、解析HTML文档:

soup = BeautifulSoup(response.text, 'html.parser')

这行代码使用BeautifulSoup库解析response.text(即HTTP响应的文本内容)。

5、获取招聘信息的HTML元素:

job_info = soup.find_all('div', attrs={'class': 'job-item'})

这行代码使用BeautifulSoup库的find_all()函数查找所有class为’job-item’的div元素(即招聘信息的HTML元素)。

6、循环遍历招聘信息:

for info in job_info:job_title = info.find('h2', attrs={'class': 'job-title'}).textcompany_name = info.find('span', attrs={'class': 'company'}).textlink = info.find('a')['href']print('职位名称:', job_title)print('公司名称:', company_name)print('链接:', link)print('-------------------------')

这行代码循环遍历job_info列表中的每一个元素,并使用find()函数查找职位名称、公司名称和链接。text参数用于获取元素的文本内容,而[‘href’]参数用于获取链接。然后,我们打印出这些信息。

7、整个爬虫程序的运行:

if __name__ == '__main__':proxy_host = 'www.duoip.cn'proxy_port = 8000proxy = {'http': 'http://{}:{}'.format(proxy_host, proxy_port),'https': 'https://{}:{}'.format(proxy_host, proxy_port)}response = requests.get('https://www.zhaopin.com/', proxies=proxy)soup = BeautifulSoup(response.text, 'html.parser')job_info = soup.find_all('div', attrs={'class': 'job-item'})for info in job_info:job_title = info.find('h2', attrs={'class': 'job-title'}).textcompany_name = info.find('span', attrs={'class': 'company'}).textlink = info.find('a')['href']print('职位名称:', job_title)print('公司名称:', company_name)print('链接:', link)print('-------------------------')

这行代码为整个爬虫程序的入口。当程序运行时,它会首先设置代理信息,然后发出HTTP请求,解析HTML文档,获取招聘信息的HTML元素,循环遍历招聘信息,并打印出这些信息。

以上就是爬取智联、无忧简历采集系统内容的Python代码。请注意,这只是一个基本的爬虫程序,实际的爬虫程序需要处理更多的复杂情况,例如处理网站的反爬虫策略、处理可能存在的网页结构变化、处理可能存在的错误等。因此,在编写实际的爬虫程序时,需要根据实际情况进行适当的调整和优化。

上面就是有关爬虫获取招聘信息的一些简易的代码,虽说过程很复杂,一旦跑通了,使用还是非常的方便。如果各位大佬有更好的建议,欢迎评论区交流讨论。

http://www.sczhlp.com/news/50378/

相关文章:

  • 福州企业建站系统模板西安博网站建设
  • 龙岗网站建设哪家技术好阜阳网站建设公司
  • 网站建设有几种方案培训班网页设计
  • 梧州专业网站推广网站建设600元全包
  • 建设内网网站流程百度自动驾驶技术
  • 在线做网站wordpress 加密
  • 网站详细设计天眼网查个人
  • 哪个网站可以做免费商业推广百度上做推广怎么做
  • 阆中网站建设01hl做企业网站必须要座机吗
  • 山楂树建站公司优化方案的格式及范文
  • CSP-2023 游记 + AFO记
  • 3. LangChain4j + 低阶 和 高阶 API的详细说明 - Rainbow
  • 网站开发技术现状地税局网站怎么做变更
  • 做网站敲代码的图片做h5的网站页面
  • 外贸的网站有哪些平面设计素材网站哪个好
  • 网站销售需要注册公司吗jeykll和wordpress
  • 网站改版前端流程经验室内设计师联盟网官网
  • CF344B Simple Molecules - 题解
  • CMake构建学习笔记22-libxml2库的构建
  • CF81B Sequence Formatting - 题解
  • CF394A Counting Sticks - 题解
  • 10.3.2 Off-policy 策略梯度定理
  • 网站建设细化流程怎么注册wordpress账号
  • 校园网站建设多少钱海洋牧场网站建设
  • 山东网站建设排行榜可以做数据图的的网站
  • 小程序网站开发怎么样甘孜建设机械网站首页
  • 网站 解析网页设计结课报告
  • 做微信的网站秀客中色十二冶金建设集团有限公司网站
  • 怎么上传文章网站wordpress重建缩略图
  • 做网站月薪设计网站公司都选亿企邦