当前位置: 首页 > news >正文

深圳网站制作进入百度一下官网

深圳网站制作,进入百度一下官网,网页设计师培训多少钱,深圳市福田招聘1.数据预处理 根据自己或者学校系统预制的数据 使用less sogou.txt可查看 wc -l sogou.txt 能够查看总行数 2.数据扩展部分 我的数据位置存放在 /data/bigfiles 点击q退出 将一个文件的内容传递到另一个目录文件下 原数据在 /data/bigfiles ->传递 到/data/workspac…

1.数据预处理

根据自己或者学校系统预制的数据

使用less sogou.txt可查看

wc -l sogou.txt 能够查看总行数

2.数据扩展部分

我的数据位置存放在 /data/bigfiles

点击q退出

将一个文件的内容传递到另一个目录文件下

原数据在 /data/bigfiles  ->传递 到/data/workspace

awk -F '\t' '{print $0 "\t" substr($1,1,4) "\t" substr($1,5,2) "\t" substr($1,7,2) "\t" substr($1,9,2)}' /data/bigfiles/sub_sogou.txt>/data/workspace/sub_sogou-ext.txt

继续使用less命令可以查看数据扩展结果

3.数据加载

将数据加载到HDFS

hdfs dfs -mkdir -p /sogou/20111230

hdfs dfs -put /data/workspace/sub_sogou.txt /sogou/20111230

hdfs dfs -mkdir -p /sogou_ext/20111230

hdfs dfs -put /data/workspace/sub_sogou.txt /sogou_ext/20111230

 基于Hive构建日志数据的数据仓库

要记得启动hive

接下来的操作均在hive客户端完成

1.基本操作

查看数据库的命令:show databases;

创建数据库sogou:create database if not exists sogou;

接下来使用数据库:use sogoul

查看表名:show tables;

创建外部表sogou_22106128用于加载sogou.txt的数据

CREATE EXTERNAL TABLE sogou.sogou_22106128 (ts STRING,uid STRING,keyword STRING,rank INT,order_num INT, url STRING
)
COMMENT 'This is the sogou search data of one day'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE
LOCATION '/sogou/22106128';

 desc sogou_22106128可查看相关字段和类型

2.创建分区(按照年、月、日、小时)

创建四个字段数据的外部表

CREATE EXTERNAL TABLE sogou.sogou_ext_22106128 (ts STRING,uid STRING,keyword STRING,rank INT,order1 INT, url STRING,year INT,month INT,day INT,hour INT
)
COMMENT 'this is the sogou search data of extend'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t' 
STORED AS TEXTFILE
LOCATION '/sogou_ext/22106128'; 

 创建好后创建分区表:

CREATE EXTERNAL TABLE sogou.sogou_partition (ts STRING,uid STRING,keyword STRING,rank INT,order1 INT, url STRING
)
PARTITIONED BY (year INT, month INT, day INT, hour INT)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'  
STORED AS TEXTFILE
LOCATION '/path/to/sogou_partition'; 

 最后向分区表sogou_partition中载入数据:

set hive.exec.dynamic.partition.mode=nonstrict; //开启动态分区模式为非严格的

这部分参考的老师的代码:

 

http://www.sczhlp.com/news/28476/

相关文章:

  • 怎么做网站的站点地图miy188coo免费入口
  • 新万网seo外包顾问
  • 站长工具综合查询站长工具怎么建网页
  • 做门户网站怎么赚钱热门推广平台
  • dw做网站 如何设置转动淘词神器
  • asp网站开发培训谷歌seo站内优化
  • 电脑咋建网站做一个公司网站需要多少钱
  • 平湖市建设局网站扬州百度seo公司
  • 六安服装网站建设地址百度网页版下载安装
  • 做网站导航按钮怎么做厦门seo俱乐部
  • 外贸专业网站成功营销案例分享
  • 同版本pg数据迁移
  • 图论1011
  • 金融行业AI原生转型经典案例—某商业银行
  • Xcpc训练题目若干(二)
  • 分治
  • 直播平台网站建设如何建立个人网站的步骤
  • 帝国做的网站广州市新闻最新消息
  • b2b商务网单页网站怎么优化
  • 怎么用手机做一个网站微网站建站平台
  • 有服务器怎么做网站seo综合查询
  • 柳市做网站百度链接收录提交入口
  • 怎么自己在百度上做网站app推广方式
  • 广东省 政府网站 建设方案杭州seo招聘
  • 网站首页的提交怎么做怎么看百度指数
  • 二道网站建设微信公众号推广2元一个
  • 数据结构与算法完全指南:从基础到实战应用
  • 装修做劳务去哪个网站找工地安卓优化大师破解版
  • 网站引导页利弊最近新闻有哪些
  • 深圳网站设计是什么河南网站优化公司