栏目分类:
子分类:
返回
终身学习网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
终身学习网 > IT > 前沿技术 > 大数据 > 大数据系统

hive sql动态拆解时分秒

大数据系统 更新时间:发布时间: 百科书网 趣学号

从上游爬取的时间字段responseDuration,有三种显示,例如:2小时37分55秒,或者37分55秒,再或者55秒

字段的值是动态的,时分秒,分秒,或者秒,要把这个字段的值拆解,然后换算成秒

思路:考虑使用正则表达式替换函数regexp_replace,把时分秒,先替换成' ', 然后split(间隔符是' ')拆成数组,
然后小时的数乘以3600,分钟的数乘以60

步骤:
1、先替换小时和分,小时和分有可能有,也有可能没有: regexp_replace(responseDuration,'小时|分',' ')

2、秒是一定有的:regexp_replace(regexp_replace(avgResponseDuration,'小时|分',' '),'秒','')

3、如果responseDuration的值是2小时37分55秒,那么替换后的结果是'2 37 55'

4、下一步拆解这个数字串,并利用size函数获取时、分、秒对应的数,然后对应的数乘以对应的秒数

秒是一定有的,则秒是split(time, ' ') [size(split(time, ' ')) -1]
分不一定有,如果为NULL,则置为0,nvl(split(time, ' ') [size(split(time, ' ')) -2], 0) * 60
小时不一定有,如果为NULL,则置为0,nvl(split(time, ' ') [size(split(time, ' ')) -3],0) * 3600


5、综上所述,代码如下:

(select split(time, ' ') [size(split(time, ' ')) -1] 
    + nvl(split(time, ' ') [size(split(time, ' ')) -2], 0) * 60 
    + nvl(split(time, ' ') [size(split(time, ' ')) -3],0) * 3600
from (

select regexp_replace(regexp_replace(responseDuration,'小时|分',' '),'秒','') as time ) 

) as responseDuration,


 

转载请注明:文章转载自 www.051e.com
本文地址:http://www.051e.com/it/280729.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 ©2023-2025 051e.com

ICP备案号:京ICP备12030808号