!12 完善hive组件的介绍文档

From: @chenjunbiao-001 
Reviewed-by: @wuzeyi1 
Signed-off-by: @wuzeyi1
This commit is contained in:
openeuler-ci-bot 2022-03-04 02:20:02 +00:00 committed by Gitee
commit ad7f1fa17e
No known key found for this signature in database
GPG Key ID: 173E9B9CA92EEF8F

View File

@ -1,10 +1,15 @@
# hive
#### 介绍
The Apache Hive (TM) data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.
Apache Hive 是可实现大规模分析的分布式容错数据仓库系统。该数据仓库集中存储信息您可以轻松对此类信息进行分析从而做出明智的数据驱动决策。Hive 让用户可以利用 SQL 读取、写入和管理 PB 级数据。
Hive 建立在 Apache Hadoop 基础之上后者是一种开源框架可被用于高效存储与处理大型数据集。因此Hive 与 Hadoop 紧密集成,其设计可快速对 PB 级数据进行操作。Hive 的与众不同之处在于它可以利用 Apache Tez 或 MapReduce 通过类似于 SQL 的界面查询大型数据集。
#### 软件架构
软件架构说明
Hive主要包含的组件有DriverMetadata库用户接口CLI接口JDBC/ODBC接口和Thrift Server接口等。
- Driver组件Hive的核心Hive被称为解析器的根本所在包含编译器Complier优化器Optimizer和执行器Executor主要负责对Hive SQL语句进行解析编译优化生成相应的执行计划然后交给底层的mapreduce框架完成计算输出结果。
- Metadata存储Hive的元数据即描述数据的数据就是Hive有哪些表表内有什么字段在什么DB对应什么文件等等默认的元数据库是Derby库只能允许一个会话连接即单用户模式基本不实用为了支持多用户基本需要将元数据库改配成MySQL或者Oracle等数据库中。
- 用户接口包含CLICommand Line Interface 命令行接口、JDBC/ODBC接口和Web UI接口。实现客户端与服务端的交互。
- Thrift Server和JDBC/ODBC可扩展可跨语言服务接口Thrift Server提供了JDBC和ODBC连接实现不同语言调用Hive的接口。
#### 安装教程