当前位置: 首页 > news >正文

网站建设客户需求表vx小程序怎么开发

网站建设客户需求表,vx小程序怎么开发,国内最新军事新闻最新消息,WordPress邮箱验证登录一、Hive中的分桶表 1. 分桶表的概念 分桶表是Hive中一种用于提升查询效率的表类型。分桶指的是根据指定列的哈希值将数据划分到不同的文件#xff08;桶#xff09;中。 2. 分桶表的原理 哈希分桶#xff1a;根据分桶列计算哈希值#xff0c;对哈希值取模#xff0c;将…一、Hive中的分桶表 1. 分桶表的概念 分桶表是Hive中一种用于提升查询效率的表类型。分桶指的是根据指定列的哈希值将数据划分到不同的文件桶中。 2. 分桶表的原理 哈希分桶根据分桶列计算哈希值对哈希值取模将数据分配到相应的桶中。分区/分桶分区是基于存储路径的划分而分桶是基于数据文件的划分。 假设按以下规则分桶 分桶列id分桶数量4 分桶计算过程 计算哈希值对每个id计算其哈希值。取模运算对哈希值进行取模运算模数为分桶数量4。分配到桶根据取模结果将数据分配到相应的桶。 示例 假设有以下id数据101, 102, 103, 104, 105 id 101: 哈希值假设为hash(101) 1111取模1111 % 4 3分配到桶3 id 102: 哈希值假设为hash(102) 2222取模2222 % 4 2分配到桶2 id 103: 哈希值假设为hash(103) 3333取模3333 % 4 1分配到桶1 id 104: 哈希值假设为hash(104) 4444取模4444 % 4 0分配到桶0 id 105: 哈希值假设为hash(105) 5555取模5555 % 4 3分配到桶3 3. 分桶表的用途 加快表连接速度当两个表的连接字段作为分桶字段时且分桶数量相等或成倍数关系时能够加快连接速度。支持抽样查询可以快速获取数据的样本。 加速原理 分桶数量相同每个对应的桶只需要在各自的桶中进行连接。倍数关系较大的分桶表的桶可以映射到较小分桶表的桶。比如一个表有8个桶另一个表有4个桶每2个小桶可以对应到1个大桶。 表连接查询 分桶表在连接查询时可以利用表的分桶特性加速查询尤其是在两个表分桶字段相同时 SELECT a.*, b.* FROM stu_info_c AS a JOIN another_bucketed_table AS b ON a.id b.id;4. 分桶表的创建 假设有以下数据 1001,lilei,男,18 1002,lucy,女,16 ...创建分桶表 CREATE TABLE stu_info_c (id INT,name STRING,sex STRING,age INT ) CLUSTERED BY (id) INTO 4 BUCKETS ROW FORMAT DELIMITED FIELDS TERMINATED BY ,;CLUSTERED BY (id): 指定用于分桶的字段这里是 id。数据在分区内会根据 id 的哈希值进行分桶。 INTO 4 BUCKETS: 指定将数据划分为 4 个桶。每个桶包含一部分数据以便在查询时可以并行处理提高性能。 加载数据到分桶表 创建临时表并加载数据 创建临时表 CREATE TABLE stu_info_c_tmp (id INT,name STRING,score DECIMAL(5, 2) ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ,;加载数据 LOAD DATA INPATH /bc/stu.txt INTO TABLE stu_info_c_tmp;将数据导入分桶表 INSERT OVERWRITE TABLE stu_info_c SELECT * FROM stu_info_c_tmp;5. 分桶表的查询 查询整张表 SELECT * FROM stu_info_c;抽样查询 SELECT * FROM stu_info_c TABLESAMPLE(BUCKET 3 OUT OF 8);TABLESAMPLE(BUCKET x OUT OF y) 用于从分桶表中抽样数据 y值决定抽样比例必须是表总桶数的倍数或因子。 x值表示从哪个桶开始抽取。 例如如果表总共分为 4 个桶TABLESAMPLE(BUCKET 2 OUT OF 2) 将返回 2 个桶的数据而 TABLESAMPLE(BUCKET 1 OUT OF 2) 将返回第 1 个桶和第 3 个桶的数据。 6. 分桶与分区的区别 字段来源 分区使用creat以外的新字段。分桶使用creat之后的已有字段。 划分方式 分区指定规则静态、动态。分桶基于哈希算法。 存储方式 分区创建子目录存储数据。分桶将表拆分为多个小文件。 使用场景 分区加速分区字段查询。分桶加速表连接。 特性分区分桶字段来源新字段不在原表中原表中已有字段划分方式指定规则静态、动态基于哈希算法存储方式创建子目录存储数据将表拆分为多个小文件使用场景加速分区字段查询加速表连接 语法 CREATE TABLE bucketed_sales (id INT,product STRING,amount DECIMAL(10, 2),date STRING ) PARTITIONED BY (year INT) CLUSTERED BY (id) INTO 4 BUCKETS ROW FORMAT DELIMITED FIELDS TERMINATED BY ,;感谢您访问本博文另外在今天这个举国欢庆的日子里愿大家享受美好的时光放下工作的繁忙陪伴家人和朋友共度温馨的国庆假期。愿祖国繁荣昌盛国泰民安祝大家国庆快乐幸福安康
http://www.sczhlp.com/news/187572/

相关文章:

  • 企业宣传推广方式襄阳seo站内优化
  • 英文网站备案androphp安装WordPress
  • 上海开发网站驾校网站模板
  • 网站建设宣传文案行业门户网站运营方案
  • 网站建设维护知识域名服务网站
  • 做网站比较好的公司有哪些做家具定制的设计网站
  • 合肥网站建设设计公司哪家好常州网站建设多少钱
  • 完整教程:安卓中,kotlin如何写app界面?
  • 移动固态硬盘插入电脑后提示“应该格式化”或“文件系统损坏”如何修复?
  • 生成式AI实现多模态信息检索技术突破
  • 在运维工作中,如何过滤某个目录在那边什么路径下面?
  • 合肥制作网站企业做网站的上市公司
  • 怎么做钓鱼网站呢外贸网站制作公司哪家好
  • 白鹭引擎做h5网站网络工程毕业后干什么
  • 汽车工厂视频网站建设盐城大丰建设局网站
  • 吉安建站公司打码网站如何建设
  • 网站开发的微端是什么wordpress 嵌入html5
  • 网站直接跳转烟台巅峰网络科技有限公司
  • 网站开发常见毕业设计题目单页面网站建设
  • 福州网站建设好的公司商业网站建设开发
  • 网站开发案例电子书黄村网站开发公司电话
  • 浦东新区网站设计苏州市城乡和建设局网站
  • 学会建网站如何做网络营销保险做的好的网站有哪些
  • 邢台做网站咨询昆山设计网站的公司
  • 企业的门户网站一般用什么做949公社招聘信息
  • 怎么做网站动态地图东莞网站设计与网站制作
  • 做富集的网站wordpress在线改主题
  • 国外创意网站设计欣赏推广赚钱的软件排行
  • 网站规划与开发技术属于什么大类外网域名
  • 网站公司建设 中山品牌网站建设开发价格