当前位置: 首页 > news >正文

滨州正规网站建设价格找工作哪个网站好智联招聘

滨州正规网站建设价格,找工作哪个网站好智联招聘,wordpress定制模版开发时间,网页制作模板报价模板🌈欢迎来到C项目专栏 🙋🏾‍♀️作者介绍:前PLA队员 目前是一名普通本科大三的软件工程专业学生 🌏IP坐标:湖北武汉 🍉 目前技术栈:C/C、Linux系统编程、计算机网络、数据结构、Mysq…

🌈欢迎来到C++项目专栏
🙋🏾‍♀️作者介绍:前PLA队员 目前是一名普通本科大三的软件工程专业学生
🌏IP坐标:湖北武汉
🍉 目前技术栈:C/C++、Linux系统编程、计算机网络、数据结构、Mysql、Python
🍇 博客介绍:通过分享学习过程,加深知识点的掌握,也希望通过平台能认识更多同僚,如果觉得文章有帮助,请您动动发财手点点赞,本人水平有限,有不足之处欢迎大家扶正~
🍓 最后送大家一句话共勉:知不足而奋进,望远山而前行。
————————————————

Day1

  • 1.项目介绍
  • 2.搜索引擎宏观介绍
  • 3.相关技术栈和项目环境
  • 4.正排索引VS倒排索引-搜索引擎具体原理
  • 5.编写数据去标签与数据清洗的模块

1.项目介绍

对比常用搜索引擎,实现一个简易版的站内搜索引擎。
基于boost库实现,boost库官网上是没有站内搜索引擎的,我们自己实现一个,部署在自己的云服务,客户端可以通过浏览器访问服务器地址,实现搜索引擎功能的使用。

2.搜索引擎宏观介绍

0
常用搜索引擎,如百度 搜狗等,搜索引擎框架可简易理解如上图,我们实现的站内搜索引擎对比就是把相关资料提前下载到云服务器本地,当用户使用搜索功能时,在服务器本地进行检索反馈。

3.相关技术栈和项目环境

  • 技术栈: C/C++ C++11, STL, 准标准库Boost,Jsoncpp,cppjieba,cpp-httplib , 选学: html5,css,js、Query、Ajax
  • 项目环境: Centos 7云服务器,vim/gcc(g++)/Makefile , vs2019 or vs code

4.正排索引VS倒排索引-搜索引擎具体原理

5.编写数据去标签与数据清洗的模块

先去boost官网将文件下载下来,使用rz命令将文件拖拽到Linux服务器
02
解压命令:
03
创建好数据文件夹用来区分处理好的数据,方便后期读取使用
04

  • 编写parser.cc模块
//代码的基本结构:
#include <iostream>
#include <string>
#include <vector>
//是一个目录,下面放的是所有的html网页
const std::string src_path = "data/input/";
const std::string output = "data/raw_html/raw.txt";
typedef struct DocInfo{std::string title;  //文档的标题std::string content; //文档内容std::string url;   //该文档在官网中的url
}DocInfo_t;
//const &: 输入
//*: 输出
//&:输入输出
bool EnumFile(const std::string &src_path, std::vector<std::string> *files_list);
bool ParseHtml(const std::vector<std::string> &files_list, std::vector<DocInfo_t>
*results);
bool SaveHtml(const std::vector<DocInfo_t> &results, const std::string &output);
int main()
{std::vector<std::string> files_list;//第一步: 递归式的把每个html文件名带路径,保存到files_list中,方便后期进行一个一个的文件进行读取if(!EnumFile(src_path, &files_list)){std::cerr << "enum file name error!" << std::endl;return 1;}//第二步: 按照files_list读取每个文件的内容,并进行解析std::vector<DocInfo_t> results;if(!ParseHtml(files_list, &results)){std::cerr << "parse html error" << std::endl;return 2;}//第三步: 把解析完毕的各个文件内容,写入到output,按照\3作为每个文档的分割符if(!SaveHtml(results, output)){std::cerr << "sava html error" << std::endl;return 3;}return 0;
}
bool EnumFile(const std::string &src_path, std::vector<std::string> *files_list)
{return true;
}
bool ParseHtml(const std::vector<std::string> &files_list, std::vector<DocInfo_t> *results)
{return true;
}
bool SaveHtml(const std::vector<DocInfo_t> &results, const std::string &output)
{return true;
}
  • 安装boost开发库
    $ sudo yum install -y boost-devel //是boost 开发库
http://www.sczhlp.com/news/64066/

相关文章:

  • Why框架元推理,为什么是认知奇点?AI新范式
  • 路由器做网站80端口石家庄建站优化公司
  • 织梦网站数据库库直接上传的 没有后台备份 需要怎么还原什么是网站接入商
  • app 设计网站建设许昌网站制作
  • 建设部网站预应力资质营销网站建设解决方案
  • 网站备案帐号wordpress relocate
  • 怎么做网站推广软件网络推广代理怎么做
  • 在线服务器网站wordpress看板娘插件
  • 顺德网站设计制作类似 wordpress
  • 网站大全免费下载erp仓库管理系统教程
  • 网站域名 续费长沙做网站最好的公司有哪些
  • 南通专业企业门户网站设计商业模式包括哪些模式
  • 网站开发项目流程图网站建设管理汇报
  • 南京网站建设费用个人建设网站盈利需要什么材料
  • 简单网站建设论文总结精智wordpress主题
  • 网站内容告知书辽宁省建设工程信息网首页官网
  • 用手机建网站的步骤免费推广方式有哪些
  • 关于建设网站的图片有什么公司要做推广的
  • 浙江做网站套餐外贸建站用的服务器
  • 年前做招聘网站话术网页设计网站结构图怎么弄
  • 网站开发的相关语言有哪些电子商务网站开发难点
  • 中国互联网协会网站小程序搜索排名
  • 网站建设评审验收会议主持词wordpress第三方源码
  • seo查询 站长之家廊坊企业网站排名优化
  • 建网站 发信息 做推广锦州seo推广
  • wordpress 站点群网站开发行业工作交接交接哪些
  • Qt/C++地图感兴趣点搜索/区域搜索/周边搜索/拿到搜索结果
  • 《概率论与数理统计》(第二版)
  • 芜湖网站建设网站制作公司泽成杭州seo网站推广排名
  • 深圳餐饮网站建立wordpress小插件下载地址