浅议Hive开源云计算系统 - 新闻中心 - 福州哈唐网络-福建IDC企业!专注云主机及服务器租用托管13年!

新闻中心

首页 > 新闻中心 > 行业新闻 >

浅议Hive开源云计算系统

时间:2017-12-28 09:32:47   阅读:

  Hive起源于Facebook,是一个基于Hadoop的数据仓库工具,同时也是Hadoop的一个主要子项目。Hive提供了一系列的工具,可以用来进行数据的提取、转换和加载(ETL),同时可以实现对Hadoop中大规模数据的存储、查询和分析。Hive定义了一种简单的类似SQL语言——HiveQL。

 HiveQL使熟悉SQL的用户可以很方便地在Hadoop中査询数据。同时Hive还有很强的灵活性,没有将用户限制在一个框架中,主要表现在当Hive内建的Mapper和Reducer不能满足用户的需求时,用户可以通过Map/Reduce将自己开发的Mapper和Reducer加入到Hive,以满足用户特殊的需求。
 
  Hive云计算系统没有定义所谓的Hive格式的数据,可以在Thift上很好地工作,控制分隔符,甚至可以自己定义数据格式。
 
  作为Hadoop的主要子项目,Hive秉承开源的精神,在不断地发展中,不断有新的特性加入其中。现在已经增加和森要增加的一些新特性如下:
 
  (1)增加了用于收集分区和列的水平统计数值的命令;
 
  (2)支持在Partition级别去更改Bucket的数量;
 
  (3)在Hive中实现检索;.
 
  (4)为班仰增加并发模型;
 
  (5)支持在两个或两个以上列中的差别选择;
 
  (6)利用bloom过滤器提高连接的效果;
 
  (7)建立Hive的授权结构和认证结构;
 
  (8)在Hive中使用位图检索。
 
  Hive正在不断发展,哈唐网络下节课将从整体构架、数据模型、使用语言等几个方面对Hive云计算系统做一个简要介绍。

相关推荐:2U服务器托管一般都是怎么收费的?



闽公网安备 35010002000114号