行轉列和列轉行(重點)
行轉列(split + explode + laterview)
列轉行 ( concat_ws + collect_list/set )
Hive排名函數
row_number不并列不跳過: 1 2 3 4
dense_rank并列(lie)不跳過: 1 1 2 3
rank并列跳過: 1 1 3 4
Hive分析函數:Ntile
效果:
排(pai)序并分桶 ntile(3) over(partition by A order by B) => {1,2,3}->1,{4,5,6}->2,{7,8,9}->3 可用(yong)于取(qu)前50%數據(ju)統計、取(qu)中間三分之一統計等需求。