Hadoop实战项目之网站数据点击流分析(转载分析)
本文轉(zhuǎn)載于csdn博主‘一直不懂’
一,項目業(yè)務(wù)背景
https://blog.csdn.net/shenchaohao12321/article/details/82958936
二,整體技術(shù)流程及架構(gòu)
https://blog.csdn.net/shenchaohao12321/article/details/82959255
三,數(shù)據(jù)采集
https://blog.csdn.net/shenchaohao12321/article/details/82959322
四,數(shù)據(jù)預(yù)處理
https://blog.csdn.net/shenchaohao12321/article/details/82959444
五,數(shù)據(jù)倉庫設(shè)計
https://blog.csdn.net/shenchaohao12321/article/details/82960513
六,ETL
https://blog.csdn.net/shenchaohao12321/article/details/82961265
七,統(tǒng)計分析
https://blog.csdn.net/shenchaohao12321/article/details/82975362
八,結(jié)果導(dǎo)出
https://blog.csdn.net/shenchaohao12321/article/details/83020556
九,工作流調(diào)度
https://blog.csdn.net/shenchaohao12321/article/details/83020574
十,數(shù)據(jù)展示
https://blog.csdn.net/shenchaohao12321/article/details/83020653
十一,項目代碼
https://blog.csdn.net/shenchaohao12321/article/details/83020719
十二,有關(guān)hql語句的注意事項
count(1)里面的數(shù)字表示對第幾列的數(shù)據(jù)進行統(tǒng)計計數(shù)。
group by? 分組可以去重。
having 與group by 一起使用 ,跟where的用處一樣。
row_number() over (partition by clumn_a? order by column_b asc/desc) as rn?
對表的每行標定行數(shù)
partition by clumn_a相當于表的分組,order by 相當于對表的排序,rn 行數(shù)序號的字段。
concat(字段,字段)? 表示將兩個字段和為一個字段。
distinct去重
cast(......as int) 表示對字段的類型轉(zhuǎn)換為int類型。
select? '2018-11-11' as date......為每一個查詢的行的表結(jié)構(gòu)第一位加上字段名為date數(shù)據(jù)為'2018-11-11' 的列。
轉(zhuǎn)載于:https://www.cnblogs.com/songweideboke/p/9868886.html
總結(jié)
以上是生活随笔為你收集整理的Hadoop实战项目之网站数据点击流分析(转载分析)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: nupkg格式_nupkg文件怎么打开(
- 下一篇: GB28181协议——对接摄像机