当前位置: 首页 > news >正文

漯河网站建设茂睿科技郑州网站建设代理商

漯河网站建设茂睿科技,郑州网站建设代理商,怎么跟客户介绍网站建设,东莞seo项目优化方法文章目录综述效果展示去标签化,清理数据构建索引用户查询综述 该项目使用了BS架构,实现了用户对Boost库进行站内搜索的功能, 用户输入关键字使用http协议通过ajax将数据发送给后端服务器,后端进行分词, 通过倒排索引…

文章目录

  • 综述
  • 效果展示
  • 去标签化,清理数据
  • 构建索引
  • 用户查询

综述

该项目使用了BS架构,实现了用户对Boost库进行站内搜索的功能,

用户输入关键字使用http协议通过ajax将数据发送给后端服务器,后端进行分词,

通过倒排索引和正排索引获得若干个文档,

每个文档按照一定权重进行排序,拼接成一个网页反馈给用户,

每个搜索结果包括文档标题,简介,URL,并可以通过点击标题跳转到特定的网址中

请添加图片描述

效果展示

请添加图片描述

请添加图片描述

请添加图片描述

请添加图片描述
请添加图片描述

去标签化,清理数据

请添加图片描述

将爬虫和下载的boost库的文件,进行提炼,去标签化,保留里面的有效数据

  • 提取html文件
  • 将提取到的html文件进行提炼有效数据
  • 将有效数据的集合写入到一个文件中

构建索引

请添加图片描述

  • 根据将去标签化后构建的内容集合在内存中 构建正排索引,形成对应的文档结构体
  • 将形成的文档结构体在内存中 构建倒排索引,根据关键词找到对应的 倒排拉链(一系列和该关键字相光的文档集合)
    • 根据 Jieba分词对 titlecontent进行分词同时划定权重,构建倒排拉链
    • 每个倒排索引中都包含权重,之后我们就能够使用权重对文档优先级进行排序

用户查询

请添加图片描述

  • 用户输入搜索关键字后,先进行 JieBa分词
  • 通过 倒排索引获得对应的 倒排拉链
  • 倒排拉链中通过 正排索引获得对应一系列的文档内容
  • 根据索引中的权重按高到低进行排序,组合成一个网页反馈给用户
http://www.sczhlp.com/news/126002/

相关文章:

  • 做app一定要做网站吗社群电商平台排名
  • 如何做网站平台关注音乐网站答辩
  • 做投票的网站做直播网站一定要idc吗
  • 宁海企业网站建设网站模板去哪要
  • 公司制作网站费用怎么做分录建网页用什么软件
  • mall项目学习笔记
  • 实用指南:通义DeepResearch论文六连发全面解读
  • glTF/glb:现在和未来
  • 南宁网站建设长春贺州市住房和城乡建设局网站
  • 网站快排网站建设的方向和任务
  • 做网站友情链接都写什么ui设计工具
  • 网站设计与制作说明小程序模板做视频网站
  • 哪些网站做推广鹰潭网站建设公司
  • 体现网站特色标识牌设计
  • iphone开发网站游戏网页版点击即玩
  • 心理咨询 网站模版网站页面组成
  • 深圳企业网站制作推广运营百度竞价推广收费标准
  • 专业网站制作的地方亚马逊的免费网站
  • 存储多边形网格的文件格式:OBJ、FBX、RenderMan、glTF、USD 等。
  • 安防监控中常见的报警类型有哪些?国标GB28181平台EasyGBS的报警能力解析
  • Notepad++8.6免费版下载及安装教程(附安装包)2025最新整理
  • 做网站头视频wordpress手机pc分开模板
  • 网站项目开发流程图物业管理系统功能
  • wordpress群站网站重大建设项目公开发布制度
  • 郑州市制作网站的公司网页特效的定义
  • 主题网站的设计方案网上外贸网站怎么做
  • 还有那个网站可以做兼职呢做美瞳网站需要什么资质
  • 2022年没封网站直接进入海西网站建设
  • python做网站的实例网站宽度设置
  • 专业微网站建设公司首选公司烟台公司做网站