重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
本篇内容介绍了“hive组件构架是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
目前成都创新互联已为成百上千的企业提供了网站建设、域名、网络空间、绵阳服务器托管、企业网站设计、甘谷网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。
Hive执行流程图:
【Pratical Hive.pdf】学习笔记,各章节做主线辅以官网资料整理完成。
组件架构
客户端组件
Hive-cli,
JDBC/ODBC
Toad or SQuirreL
HCatalog
元数据管理组件,主要作用如下
官方介绍
• Provides a common schema environment for multiple tools
• Allows for connectors to tools to read data from and write data to Hive’s warehouse
• Lets users share data across tools
• Creates a relational structure to Hadoop data
• Abstracts away the how and where of data storage
• Hides schema and storage changes from users
hiveServer2
接口服务组件
Execution-Engine
MR
执行引擎组件
Tez
执行引擎组件,省略shuffle过程
Tez avoids disk IO by avoiding expensive shuffle and shorts while leveraging more efficient map side joins. Tez also utilizes a costbased optimizer, which helps produce faster execution plans. Combine this with the ORC file format geared
toward SQL performance and you have a query engine performing up to 100x faster than native MapReduce–
Hive-on-Spark
Storage: Hadoop
基于hdfs文件存储http://www.0398hfyy.com
“hive组件构架是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!