什么是大数据,大数据的特点
大數據 :指數據集的大小超過了現有典型的數據庫軟件和工具的處理能力的數據。
大數據的主要特點:? 海量化(Volume)多樣化(Variety)快速化(Velocity)? 高價值(Value)
? ? ? ? ? ? ? ? ??海量化:? ?數據量從TB到PB級別
? ? ? ? ? ? ? ? ? 多樣化:? ?數據類型復雜,超過80%的數據是非結構化的
? ? ? ? ? ? ? ? ??快速化:? ?數據量在持續增加(兩位數的年增長率) 數據的處理速度要求高
? ? ? ? ? ? ? ? ??高價值:? ? 在海量多樣數據的快速分析下能夠發揮出更高的數據價值
大數據能做什么:海量數據背景下 ?? ?
? ? ? ? ? ? ? ? ? 快速查詢 ? - ? 全量查詢 ?? ?
? ? ? ? ? ? ? ? ? 數據存儲 ? - ? 量大、文件大 ?? ?
? ? ? ? ? ? ? ? ? 快速計算 ? - ? 對比傳統方案 ?? ?
? ? ? ? ? ? ? ? ? 實時計算 ? - ? 最新數據 ??
? ? ? ? ? ? ? ? ? 數據挖掘 ? - ? 新價值
海量數據快速查詢 :? ? 在海量數據的背景下,進行數據的快速查找、快速提取。(快速指 ?? ?查找或提取效率3秒內) ? ? ? ?
? ? ? ? ?例如:每個用戶查詢上月手機流量記錄或上月通話明細。都是在海量用戶 ?? ?中查詢某一個人的記錄,三秒內出結果。
海量數據存儲 :? A:大數據能夠存儲海量數據 ?? ?大數據時代數據量巨大,1TB=1024*1G 約26萬首歌(一首歌4M) 1PB=1024*1024*1G 約2.68億首歌 (一首歌4M) ? ? ? ? ? ? ?
? ? ? ? ? ? ? ? ? ? ? ? ? B:大數據能夠存儲單個大文件。 ?? ?目前市面上最大的單個硬盤大小約為10T左右。若有一個文件20T,將?? ?無法存儲。大數據可以存儲單個20T文件,甚至更大。
海量數據快速計算(離線):? 能夠在海量數據的基礎上進行快速計算,這里的“快速”是與傳統計算方案對比。海量數據背景下,使用傳統方案計算可能需要一星期時間。使用大數據?? ?技術計算只需要30分鐘。 ? ? ? ?
? ? ? ? ? ? 例如:計算全國移動用戶(全國數據量大),全年內通話總時間(每個人?? ?一年通話總和)大于1萬分鐘的人,按照從多到少順序。
海量數據實時計算(實時): 在海量數據的背景下,對于實時生成的最新數據,需要立刻、馬上傳遞 ?? ?到大數據環境,并立刻、馬上進行相關業務指標的分析,并把分析完的 ?? ?結果立刻、馬上展示給用戶或者領導。 ? ? ? ?
? ? ? ? ?例如:欠費的手機充話費,充值完成后,手機幾秒鐘后就能使用。 ? ? ? 例如:雙十一實時交易大屏
挖掘前所未有的新的價值點:? ?原始企業內數據無法計算出的結果,使用大數據能夠計算出。 ? ? ? ?
? ? ? ? ?例如:啤酒和尿不濕。超市原始數據沒有計算出兩者之間的關系,使用大數 ?? ?據計算后,發現將兩者放的很近后,兩者的銷量都會有有大幅提升。 ?? ?原因在于,國外大部分買尿不濕的都是男性,男性喜好和啤酒,買尿 ?? ?不濕時順便那些啤酒很愜意。
挖掘(算法)有價值的數據? :? ?在海量數據背景下,使用數據挖掘算法,挖掘有價值的指標(不使用這 ?? ?些算法無法算出)? ? ? ? ? ? ? ? ?例如:通過數據挖掘算法計算花的種類。 ?? ?通過算法識別出這些花是玫瑰花?百合?茉莉花?菊花?桂花?
大數據內容 簡單可以稱為動物園
?
?
?
?
?
?
?
?
?
?
?
?
?
?
總結
以上是生活随笔為你收集整理的什么是大数据,大数据的特点的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 保护您的AWS网站免受DDoS攻击
- 下一篇: 十一、项目实战一