【大数据论文笔记】大数据技术研究综述
大數(shù)據(jù)的基本概念:
1.大數(shù)據(jù)的產(chǎn)生
?????? a.科學(xué)研究
?????? b.物聯(lián)網(wǎng)的應(yīng)用
?????? c.海量網(wǎng)絡(luò)信息的產(chǎn)生
2.大數(shù)據(jù)概念的提出
3.大數(shù)據(jù)的“4V”特征
??????? a.Volume(容量大):大數(shù)據(jù)巨大的數(shù)據(jù)量與數(shù)據(jù)完整性
??????? b.Variety(種類多):要在海量、種類繁多的數(shù)據(jù)間發(fā)現(xiàn)其內(nèi)在關(guān)聯(lián)
??????? c.Velocity(速度快):更快地滿足實(shí)時(shí)性需求
??????? d.Value(價(jià)值密度低):將信息轉(zhuǎn)化為知識(shí)
4.大數(shù)據(jù)的應(yīng)用領(lǐng)域
??????? a.商業(yè)
??????? b.金融
??????? c.醫(yī)療
??????? d.制造業(yè)
大數(shù)據(jù)的處理流程
?
1.數(shù)據(jù)采集
2.數(shù)據(jù)處理與集成(過濾)
3.數(shù)據(jù)分析(核心)
4.數(shù)據(jù)解釋(數(shù)據(jù)可視化)
大數(shù)據(jù)關(guān)鍵技術(shù)
1.云計(jì)算和MapReduce
云計(jì)算:
?????? a.服務(wù)IaaS
?????? b.平臺(tái)即服務(wù)PaaS
?????? c.軟件即服務(wù)SaaS
MapReduce:
?
2.分布式文件系統(tǒng)
GFS:主要采取主從結(jié)構(gòu)(Master-Slave),通過數(shù)據(jù)分塊、追加更新等方式實(shí)現(xiàn)海量數(shù)據(jù)的高速存儲(chǔ)
3.分布式并行數(shù)據(jù)庫
BigTable:
NOSQL:
4.開源實(shí)現(xiàn)平臺(tái)Hadoop
5.大數(shù)據(jù)可視化
?
大數(shù)據(jù)帶來的挑戰(zhàn):
1.大數(shù)據(jù)的安全與隱私問題
2.大數(shù)據(jù)的集成與管理問題
??????? a.數(shù)據(jù)存儲(chǔ)
??????? b.數(shù)據(jù)清洗
3.大數(shù)據(jù)的IT技術(shù)架構(gòu)問題
??????? a.大數(shù)據(jù)分析技術(shù)
??????? b.數(shù)據(jù)融合
??????? c.大數(shù)據(jù)能耗問題
4.大數(shù)據(jù)的生態(tài)環(huán)境問題
轉(zhuǎn)載于:https://www.cnblogs.com/XBWer/p/4016114.html
總結(jié)
以上是生活随笔為你收集整理的【大数据论文笔记】大数据技术研究综述的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: S3C2440时钟系统详解
- 下一篇: UVA 10273 Eat or not