- 1、本文档共91页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
项目7Hive函数大连理工大学出版社DALIANUNIVERSITYOFTECHNOLOGYPRESS《Hive数据仓库应用教程》
目录/CONTENTS任务7-1内置函数行业PPT模板/hangye/任务7-2其他常用函数123任务7-3自定义函数
内置函数任务7-1《Hive数据仓库应用教程》
7.1.1任务描述Hive数据库同MySQL、Oracle等传统关系型数据库一样,都含有大量的内置函数,用户可以直接使用,同时也支持用户自定义函数以满足实际应用的特殊需求。函数是Hive数据库中非常重要的一-部分,使用函数可以极大地提高对数据库的管理效率。Hive内部提供了大量丰富的函数供用户使用,这些函数从功能上主要分为算术函数、聚合函数、日期时间函数、条件函数以及字符串函数,这些函数被称为内置函数。通过Hive内置函数对数据进行处理,可以提高程序灵活性、可读性及执行速度。本任务将详细介绍Hive内置函数的使用方法。
7.1.2任务准备知识1.算术函数算术函数主要用来处理数值数据方面的运算,Hive中常用的算术函数主要有绝对值函数、三角函数、对数函数、随机函数等。Hive中常用的算术函数及作用见下表。算术函数返回值类型作用ABS(x)DOUBLE返回x的绝对值ACOS(x)DOUBLE求x的反余弦值(参数是弧度)ASIN(x)DOUBLE求反正弦值(参数是弧度)ATAN(x)DOUBLE求反正切值(参数是弧度)CEIL(x)BIGINT返回大于或等于x的最小整数COS(x)DOUBLE求余弦值(参数是弧度)E()DOUBLE返回自然常数e的值EXP(x)DOUBLE返回自然常数e的x次方FLOOR(x)BIGINT返回小于或等于x的最大整数GREATEST(e1,e2,...)T返回列表中的最大值,若参数中有NULL,则最大值为NULL,参数可是值或列,若为列,则返回列中每行最大值LEAST(e1,e2,...)T返回列表中的最小值,若参数中有NULL,则最小值为NULL,参数可是值或列,若为列,则返回列中每行最小值(x)DOUBLE返回以自然常数e为底x的对数值LOG(base,x)DOUBLE返回以base为底x的对数值LOG2(x)返回以2为底x的对数值LOG10(x)返回以10为底x的对数值NEGATIVE(x)INT/DOUBLE返回x的相反值PI()DOUBLE返回圆周率PI的值POW(x,y)DOUBLE返回x的y次方RAND()DOUBLE返回0到1的随机数RAND(x)通过随机因子x返回0到1的随机值ROUND(x)DOUBLE返回x四舍五入后的值ROUND(x,y),返回x四舍五入后的值,保留小数位数y位SIGN(x)DOUBLE返回x的符号,若x是负数、0、正数则分别返回-1、0和1SIN(x)DOUBLE求正弦值(参数是弧度)SQRT(x)DOUBLE返回x的平方根TAN(x)DOUBLE求正切值(参数是弧度)
7.1.2任务准备知识2.聚合函数聚合函数主要按照特定条件对一组值进行计算,并返回单个值,以便总结出关于组的结论。因此,聚合函数通常与SELECT语句的GROUPBY子句在一起使用,可以针对某一组数据进行计算。如果某个聚合列的值中有null,则包含该null的行将在聚合时被忽略(除了COUNT函数以外)。Hive中常用的聚合函数及作用见下表。聚合函数返回值类型作用AVG(x)DOUBLEAVG(col)计算指定列的平均值AVG(DISTINCTcol)计算指定列中不重复值的平均值COUNT(x)BIGINTCOUNT(*)统计行的总数COUNT(col)统计指定列中非空值的个数COUNT(DISTINCT)统计指定列非空且不重复值的个数COVAR_POP(col1,col2)DOUBLE返回组内两个数字列的总体协方差COVAR_SAMP(col1,col2)DOUBLE返回组内两个数字列的样本协方差CORR(col1,col2)BIGINT返回组内两个数字列的皮尔逊相关系数COLLECT_SET(col)ARRAY将指定列中的数据组合为数组,去重复数据COLLECT_LIST(col)ARRAY将指定列中的数据组合为数组,不去重复数据MIN(col)DOUBLE计算指定列的最小值MAX(col)DOUBLE计算指定列的最大值SUM(x)DOUBLESUM(col)计算指定列的总和SUM(DISTINCTcol)计算指定列不重复值的总和VAR_POP(col)DOUBLE返回组内某个数字列的方差VAR_SAMP(col)DOUBLE返回组内某个数字列
您可能关注的文档
- Hive数据仓库应用教程项目1 认识Hive.pptx
- Hive数据仓库应用教程项目2 Hive环境搭建.pptx
- Hive数据仓库应用教程项目3 Hive基本语法.pptx
- Hive数据仓库应用教程项目4 Hive数据定义.pptx
- Hive数据仓库应用教程项目5 数据的导入与导出.pptx
- Hive数据仓库应用教程项目6 Hive数据查询.pptx
- Hive数据仓库应用教程项目8 Hive优化.pptx
- Hive数据仓库应用教程项目9 综合案例.pptx
- 建筑设备安装识图与施工1. 项目一任务一 建筑室内给水系统识读.pptx
- 建筑设备安装识图与施工2.项目一任务二 建筑室内排水系统识读.pptx
- 2024年江西省寻乌县九上数学开学复习检测模拟试题【含答案】.doc
- 2024年江西省省宜春市袁州区数学九上开学学业水平测试模拟试题【含答案】.doc
- 《GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语》.pdf
- 中国国家标准 GB/T 44275.2-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第2部分:术语.pdf
- GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- 《GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构》.pdf
- 中国国家标准 GB/T 44285.1-2024卡及身份识别安全设备 通过移动设备进行身份管理的构件 第1部分:移动电子身份系统的通用系统架构.pdf
- GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 中国国家标准 GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南.pdf
- 《GB/T 44275.11-2024工业自动化系统与集成 开放技术字典及其在主数据中的应用 第11部分:术语制定指南》.pdf
文档评论(0)