当前位置: 首页 > news >正文

企业做网站电话约见客户的对话wordpress头部导航栏代码

企业做网站电话约见客户的对话,wordpress头部导航栏代码,毕业设计(论文)-潮州美食网网站建设.doc 免费下载,dede苗木网站模板用于机器学习的文本有一种最简单的方法#xff0c;也是最有效且最常用的方法#xff0c;就是使用词袋表示。使用这种表示方法时#xff0c;我们舍弃了输入文本中的大部分结构#xff0c;比如章节、段落、句子和格式#xff0c;只计算语料库中#xff0c;只计算语料库中每…用于机器学习的文本有一种最简单的方法也是最有效且最常用的方法就是使用词袋表示。使用这种表示方法时我们舍弃了输入文本中的大部分结构比如章节、段落、句子和格式只计算语料库中只计算语料库中每个单词在每个文本中出现的频次。舍弃结构并仅计算单词出现的次数这会让脑海中出现将文本表示为“袋”的画面。 对于文档语料库计算词袋表示包括以下三个步骤 1、分词。将每个文档划分为出现在其中的单词称为词例 token比如按空格和标点划分。 2、构建词表。收集一个词表里面包含出现在任意文档中的所有词并对它们进行编号。 3、编码。对于每个文档计算词表中每个单词在该文档中出现的频次。 在步骤1和步骤2涉及一些细微之处。我们来看一下如何利用scikit-learn来应用词袋处理过程。词袋的输出是包含每个文档中单词计数的一个向量。对于词表中的每个单词我们都有它在每个文档中出现的次数。也就是说整个数据集中的每个唯一单词都对应于这中数值表示的一个特征。要注意原始字符串中的单词顺序与词袋特征表示完全无关。 将词袋应用于玩具数据集 词袋表示是在CountVectorizer中实现的它是一个变换器transformer。我们首先将它应用于包含两个样本的玩具数据集来看一下它的工作原理 bards_words[the fool doth think he is wise,but then wise man knows himself to be a fool] 我们导入CountVectorizer并将其实例化然后对玩具数据进行拟合如下所示 bards_words[the fool doth think he is wise,but then wise man knows himself to be a fool] vectCountVectorizer() vect.fit(bards_words) 拟合CountVectorizer包括训练数据的分词与词表的构建我们可以通过vocabulary_属性来访问词表 print(词表大小{}.format(len(vect.vocabulary_))) print(词表{}.format(vect.vocabulary_)) 词表一个包含14个单词从“be”到“wise”。 我们可以调用transform方法来创建训练数据的词袋表示 bag_of_wordsvect.transform(bards_words) print(词袋表示{}.format(repr(bag_of_words))) 词袋表示保存在一个SciPy系数矩阵中这种数据格式只保存非零元素。这个矩阵的形状为2*13每行对应于两个数据点之一每个特征对应于词表中的一个单词。这里使用稀疏矩阵是因为大多数文档斗志包含次表中的一小部分单词也就是说特征数组的大部分元素都为0因为保存0的代价很高也浪费内存。要想查看稀疏矩阵的实际内容可以使用toarray方法将其转换为“密集的”NumPy数组保存所有0元素 但是这里之所以可行是因为我们使用的是仅包含13个单词的小型数据集。对于任何真实数据集来说这将会导致内存报错。 print(矩阵实际数组内容{}.format(bag_of_words.toarray())) 我们可以看到每个单词的计数都是0或1.bards_words中的两个字符串都没有包含相同的单词。 我们来看一下如何阅读这些特征向量第一个字符串被视为第一行对于词表中第一个单词“be”出现0次第二个词0次第三个次1次以此类推。 访问词表的另一种方法是使用向量器的get_funture_name方法它将返回一个列表每个元素对应一个特征 feature_namevect.get_feature_names_out() print(特征数量:{}.format(len(feature_name))) print(前20个特征{}.format(feature_name[:20]))
http://www.sczhlp.com/news/186774/

相关文章:

  • 网站和网页的区别wordpress jekyll
  • 金华建设局网站珠海电视台app下载
  • 服务号网站建设ios aso优化工具
  • 怎么建自己公司网站浙江公司网站建设制作
  • 兰州网站移动端优化中国建设部网站关于资质
  • 哈尔滨网站开发建设公司免费制作网站的软件
  • 营销网站的渠道构成基本包括黄骅贴吧海鲜城
  • 网站登记备案查询计算机it培训班
  • 网站开发制作公司排行网站架构设计师工资水平
  • 90设计网站创建时间宣传推广文案
  • 河南响应式建站示范校建设专题网站
  • 宁波高端网站设计公司天津seo排名费用
  • 云盘网站如何做企业网站推广策划方法
  • 哪些公司可以做网站厦门网页建站申请比较好
  • 北京海岸设计公司网站网站开发网页gif设计公司
  • 济南做网站最好的单位企业一般用哪个erp系统
  • 珠海哪个建设网站建设好国内网站是cn还是com
  • 网站生成静态页面工具树状结构wordpress模板
  • 我建设的网站打开很慢wordpress编辑文本框
  • 您的网站未备案电商网站的多选菜单插件
  • 怎样用前端知识制作企业网站西宁北京网站建设
  • 设计网站费用多少本地app软件制作公司
  • 目前个人网站做地最好是哪几家上海门户网站论坛
  • 网站备案空间备案吗网站空间费价格
  • 网站建设与网页制作做词做曲网站
  • 做个人网站要注意什么长春财经学院全国排名
  • 安亭网站建设做设计最好的参考网站
  • 广州app开发网站建设公司响应式网站建设平台
  • 广州做啊里巴巴网站多少钱友情链接交换网
  • 西部网站邮箱登录广东深圳市宝安区