当前位置: 首页 > news >正文

吉安做网站的公司seo优化服务商

吉安做网站的公司,seo优化服务商,苏州一日游最佳攻略,织梦做视频网站知识图谱数据预处理笔记 0. 引言1. 笔记1-1. \的转义1-2. 特殊符号的清理1-3. 检查结尾是否正常1-4. 检查<>是否存在1-5. 两端空格的清理1-6. 检查object内容长时是否以<开始 0. 引言 最近学习知识图谱&#xff0c;发现数据有很多问题&#xff0c;这篇笔记记录遇到的…

知识图谱数据预处理笔记

  • 0. 引言
  • 1. 笔记
    • 1-1. `\`的转义
    • 1-2. 特殊符号的清理
    • 1-3. 检查结尾是否正常
    • 1-4. 检查`<>`是否存在
    • 1-5. 两端空格的清理
    • 1-6. 检查object内容长时是否以`<`开始

0. 引言

最近学习知识图谱,发现数据有很多问题,这篇笔记记录遇到的一些问题。

1. 笔记

1-1. \的转义

line = line.replace('\\', '\\\\')

1-2. 特殊符号的清理

line.replace('特殊符号', '')

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

由于特殊符号在文章上无法粘贴显示,所以采取截图的形式

1-3. 检查结尾是否正常

        for line in input_file:last_four = line[-4:]last_three = line[-3:]if last_four == '> .\n' or last_four == '" .\n':output_file1.write(line)elif last_three == '>.\n' or last_three == '".\n':output_file1.write(line)else:output_file2.write(line)

1-4. 检查<>是否存在

                if '<>' in line:output_file3.write(line)

1-5. 两端空格的清理

line = line.strip()

1-6. 检查object内容长时是否以<开始

           if len(object) > 10 and object[0] == '<':output_file3.write(line)continue

未完待续!!!

http://www.sczhlp.com/news/22015/

相关文章:

  • 做网站那个搜索引擎好我是新手如何做电商
  • wordpress 清空回收站最新国际新闻
  • 网站服务合同用交印花税吗软文范文
  • 京东网店怎么开外贸seo软文发布平台
  • o2o网站源码appseo研究
  • 8/15/2025
  • PHP超级全局变量
  • 狂揽43K+Star!这款笔记神器太顶了!专属我的云端私事小屋
  • 南京网站开发南京乐识不错网站seo排名优化工具
  • 代理网名大全seo知识培训
  • php粉色系列美女图片网站源码网络营销的基本特征
  • 皮肤自做头像的网站技术短期培训班
  • 基于MFCC特征提取和DTW算法的孤立字词识别
  • Rancher怎么重置管理员密码
  • 安卓app快速开发工具seo外链建设的方法有
  • 公司网址格式win7优化大师官方免费下载
  • 个人门户网站备案2023年中国进入一级战备状态了吗
  • 想建个网站什么代码都是自己写百度灰色关键词技术
  • 南京网站建设公司有哪些网络营销与直播电商就业前景
  • 猎头网站 做猎头的流程杭州百度推广公司有几家
  • 提供做网站费用品牌推广策划
  • java做网站的权限管理上海专业优化排名工具
  • 网站优化方案模板推广策划方案模板
  • 网站首页的导航栏信息流广告哪个平台好
  • 做网站必须学php吗网站seo优化检测
  • 外围系统读取SAP采购信息程序(怎么把单值或者表里的值转换为SQL里where里的多条件值)
  • 网站文章不显示竞价托管如何托管
  • 单页网站仿制教程查看域名每日ip访问量
  • 找人做方案的网站千锋教育官网
  • 自媒体平台账号泰州网站优化公司