當前位置:
首頁 >
Pig股票交易数据处理
發(fā)布時間:2024/1/18
48
豆豆
生活随笔
收集整理的這篇文章主要介紹了
Pig股票交易数据处理
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
實訓目的
實訓內(nèi)容
1. 認識數(shù)據(jù)
- 文件daily_stocks.csv文件中保存的是65020條股票交易數(shù)據(jù),各列說明如下。
2. 環(huán)境準備
- 安裝pig
教程推薦 https://blog.csdn.net/qq_42881421/article/details/84331794
- 啟動hadoop環(huán)境
- 啟動grunt shell。
3. 數(shù)據(jù)上傳
- 將數(shù)據(jù)文件daily_stocks.csv上傳到HDFS的/pig_input目錄下,并查看是否上傳成功。
4. 加載數(shù)據(jù)
- 將daily_stocks.csv中的數(shù)據(jù)加載到名為stock的關(guān)系中,
- 在grunt shell中輸入如下命令:
- 并查看數(shù)據(jù)的前十行:
5. 數(shù)據(jù)分組
- 按交易所(exchange)進行分組,將結(jié)果保存到名為stock_exc_grp的關(guān)系中并檢查分組結(jié)果:
6. 統(tǒng)計交易所數(shù)量
- 根據(jù)分組后的數(shù)據(jù),統(tǒng)計出每只股票有幾家交易所可進行交易:
- 顯示結(jié)果
7. 統(tǒng)計平均開盤收盤價
- 將stock關(guān)系按照股票代碼(symbol)進行分組,并統(tǒng)計每只股票的平均開盤與收盤價格:
8. 統(tǒng)計平均最高最低價
- 統(tǒng)計每只股票的平均最高和最低價格
9. 導出數(shù)據(jù)
- 將avg_stock_price_high_low, avg_stock_price_opens_closes 和 unique_symbols導出HDFS
文件系統(tǒng)中
- 查看導出的數(shù)據(jù)
實訓總結(jié)
- Pig包括兩部分:用于描述數(shù)據(jù)流的語言,稱為Pig Latin;和用于運行Pig Latin程序的執(zhí)行環(huán)境。
- Pig不適合所有的數(shù)據(jù)處理任務,和MapReduce一樣,它是為數(shù)據(jù)批處理而設計的。如果只想查詢大數(shù)據(jù)集中的一小部分數(shù)據(jù),pig的實現(xiàn)不會很好,因為它要掃描整個數(shù)據(jù)集或絕大部分。
- Pig Latin 程序有一系列語句構(gòu)成。操作和命令是大小寫無關(guān)的,而別名和函數(shù)名是大小寫敏感的。
- Pig處理多行語句時,在整個程序邏輯計劃沒有構(gòu)造完畢前,pig并不處理數(shù)據(jù)。
總結(jié)
以上是生活随笔為你收集整理的Pig股票交易数据处理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 初闻噩耗... ...
- 下一篇: 不幸