当前位置: 首页 > news >正文

网站信息登记表四川刚刚发布的最新新闻

网站信息登记表,四川刚刚发布的最新新闻,wordpress怎么设置两个域名,wordpress自定义分类法前言 使用正则表达式处理数据,可进行字符串匹配、提取和替换等操作。在python中,通过re库完成正则匹配的操作。 一、正则语法规则 1.常用匹配符 模式描述^匹配字符串开头$匹配字符串结尾.匹配任意字符*匹配前面的字符零次或多次匹配前面的字符一次或多…

前言

使用正则表达式处理数据,可进行字符串匹配、提取和替换等操作。在python中,通过re库完成正则匹配的操作。


一、正则语法规则

1.常用匹配符

模式描述
^匹配字符串开头
$匹配字符串结尾
.匹配任意字符
*匹配前面的字符零次或多次
+匹配前面的字符一次或多次
?匹配前面的字符零次或一次
[]匹配括号中列举的任意一个字符
[^]匹配除了括号中列举的字符以外的任意一个字符

2.常用匹配函数

函数 描述
re.match从开始位置开始匹配,如果开头没有则无,语法: re.match(pattern, string)
re.search搜索整个字符语法: re.search(pattern, string)
re.findall搜索整个字符串,返回一个list 语法: re.findall (pattern, string)

3.常用修饰符

修饰符描述
re.I使匹配对大小写不敏感
re.M多行匹配,影响 ^ 和 $
re.S使 . 匹配包括换行在内的所有字符
re.U根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.L做本地化识别(locale-aware)匹配
re.X该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解

二、正则表达式的应用

1.引入库

代码如下(示例):

import re

2.提取数据

代码如下(示例):

import  re
content = '''
<div>
<a href="https://baike.baidu.com/item/%E5%B9%BF%E4%B8%9C%E7%9C%81/132473" title="广东省">广东省介绍</a>
<a href="https://baike.baidu.com/item/%E6%B1%9F%E8%A5%BF%E7%9C%81/19438118" title="江西省">江西省介绍</a>
</div>
'''
# 获取链接文本内容
part = r'<a.*?>(.*?)</a>'
topic = re.findall(part,content)
print(topic )
# 获取完整链接内容
url_part = r'<a.*?href=.*?</a>'
urls = re.findall(url_part,content,re.I|re.S|re.M)
for i in urls:print(i)# 获取单个链接
res_url = r'href="(.*?)"'
url = re.findall(res_url,content,re.I|re.S|re.M)
print(url)
for i in url:print(i)

3.返回结果

['广东省介绍', '江西省介绍']
<a href="https://baike.baidu.com/item/%E5%B9%BF%E4%B8%9C%E7%9C%81/132473" title="广东省">广东省介绍</a>
<a href="https://baike.baidu.com/item/%E6%B1%9F%E8%A5%BF%E7%9C%81/19438118" title="江西省">江西省介绍</a>
['https://baike.baidu.com/item/%E5%B9%BF%E4%B8%9C%E7%9C%81/132473', 'https://baike.baidu.com/item/%E6%B1%9F%E8%A5%BF%E7%9C%81/19438118']
https://baike.baidu.com/item/%E5%B9%BF%E4%B8%9C%E7%9C%81/132473
https://baike.baidu.com/item/%E6%B1%9F%E8%A5%BF%E7%9C%81/19438118

在这里插入图片描述


http://www.sczhlp.com/news/40106/

相关文章:

  • 电子商务 独立网站巨量引擎app
  • 做网站的怎么找客户友情链接检测结果
  • 网站建设需要哪些成本网址域名注册
  • 简述网站制作的流程qq群引流推广平台免费
  • 网站建设宣传文案锦州网站seo
  • linux系统打开wordpress桔子seo网
  • 网站开发的硬件设备华为云速建站
  • 用dede做的网站结构优化是什么意思
  • Vue 词云图 echart-wordCloud
  • 深入理解 JavaScript 的 Promise:异步编程的核心
  • 1 线性模型
  • 网站做图尺寸大小朋友圈推广
  • 深圳网站建设外包公司seo技术培训海南
  • 开源门户网站源码网站维护中
  • 四川网站备案福州seo建站
  • 做网站需要什么开发语言如何自己弄一个网站
  • 适配器模式实战:简化Java接口实现
  • gdb调试如何屏蔽SIGUSR1
  • 为什么做域名跳转网站样式不见了百度seo关键词排名优化
  • vs网站毕业设计怎么做百度seo排名优化软件分类
  • 郑州制作网站的基本流程免费聊天软件
  • 营销型网站需要备案吗百度词条
  • 渭南网站建设风尚网络软件定制
  • 微信公众号文章怎么转wordpressseo排名软件有用吗
  • wordpress 站点转移游戏推广员判几年
  • 做设计找参考的设计网站有那些网络营销推广方案策划
  • 语音AI工程与科学的融合创新
  • TWCMS分类栏目标题显示当前页码的解决方法
  • AI 超聚合系统:一站式 AI 功能解决方案,依托微擎高效部署
  • open jdk下载地址