2021年大数据基础(一):大数据概念
2021大數(shù)據(jù)領(lǐng)域優(yōu)質(zhì)創(chuàng)作博客,帶你從入門到精通,該博客每天更新,逐漸完善大數(shù)據(jù)各個(gè)知識(shí)體系的文章,幫助大家更高效學(xué)習(xí)。
有對(duì)大數(shù)據(jù)感興趣的可以關(guān)注微信公眾號(hào):三幫大數(shù)據(jù)
目錄
大數(shù)據(jù)概念
數(shù)據(jù)
常見數(shù)據(jù)存儲(chǔ)單位
大數(shù)據(jù)
大數(shù)據(jù)概念
最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,大數(shù)據(jù)是當(dāng)前很熱的一個(gè)詞。這幾年來,云計(jì)算、繼而大數(shù)據(jù),成了整個(gè)社會(huì)的熱點(diǎn),大數(shù)據(jù)究竟是什么東西?有哪些相關(guān)技術(shù)?對(duì)普通人的生活會(huì)有怎樣的影響?我們來一步步弄清這些問題。
在講什么是大數(shù)據(jù)之前,我們首先需要厘清數(shù)據(jù)的基本概念。
數(shù)據(jù)
數(shù)據(jù)是可以獲取和存儲(chǔ)的信息,直觀而言,表達(dá)某種客觀事實(shí)的數(shù)值是最容易被人們識(shí)別的數(shù)據(jù)(因?yàn)槟鞘恰皵?shù)”)。但實(shí)際上,人類的一切語言文字、圖形圖畫、音像記錄,所有感官可以察覺的事物,只要能被記下來,能夠查詢到,就都是數(shù)據(jù)(data)。
隨著互聯(lián)網(wǎng)快速發(fā)展、智能手機(jī)以及“可佩帶”計(jì)算設(shè)備的出現(xiàn),我們的行為、位置,甚至身體生理數(shù)據(jù)等每一點(diǎn)變化都成為了可被記錄和分析的數(shù)據(jù)。這些新技術(shù)推動(dòng)著大數(shù)據(jù)時(shí)代的來臨,各行各業(yè)每天都在產(chǎn)生數(shù)量巨大的數(shù)據(jù)碎片,數(shù)據(jù)計(jì)量單位已從Byte、KB、MB、GB、TB發(fā)展到PB、EB、ZB、YB甚至BB來衡量。
常見數(shù)據(jù)存儲(chǔ)單位
1Byte = 8bit ???1K(千)= 1024Byte ?1MB(兆)=1024K ?1G(吉) = 1024M
1T(太)=1024G ??1P(拍)=1024T ????1E(艾)=1024P ????1Z(澤)=1024E
1Y (堯)=1024Z ??1B(布)=1024Y ????1N(諾)=1024B ???1D(刀)=1024N
大數(shù)據(jù)
大數(shù)據(jù)(big data),是指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
數(shù)據(jù)分析的前提是有數(shù)據(jù),數(shù)據(jù)存儲(chǔ)的目的是支撐數(shù)據(jù)分析。究竟怎么去存儲(chǔ)龐大的數(shù)據(jù)量,是開展數(shù)據(jù)分析的企業(yè)在當(dāng)下面臨的一個(gè)問題。傳統(tǒng)的數(shù)據(jù)存儲(chǔ)模式存儲(chǔ)容量是有大小限制或者空間局限限制的,怎么去設(shè)計(jì)出一個(gè)可以支撐大量數(shù)據(jù)的存儲(chǔ)方案是開展數(shù)據(jù)分析的首要前提。
當(dāng)解決了海量數(shù)據(jù)的存儲(chǔ)問題,接下來面臨的海量數(shù)據(jù)的計(jì)算問題也是比較讓人頭疼,因?yàn)槠髽I(yè)不僅追求可以計(jì)算,還會(huì)追求計(jì)算的速度、效率。
以目前互聯(lián)網(wǎng)行業(yè)產(chǎn)生的數(shù)據(jù)量級(jí)別,要處理這些數(shù)據(jù),就需要一個(gè)更好、更便捷的分析計(jì)算方式了。傳統(tǒng)的顯然力不從心了,而且效率也會(huì)非常低下。這正是傳統(tǒng)數(shù)據(jù)分析領(lǐng)域面臨的另一個(gè)挑戰(zhàn),如何讓去分析、計(jì)算。這個(gè)時(shí)候就需要有新的技術(shù)去解決這些問題,這個(gè)技術(shù)就是大數(shù)據(jù)。
大數(shù)據(jù)主要解決的問題: 海量數(shù)據(jù)的存儲(chǔ)和海量數(shù)據(jù)的計(jì)算問題
總結(jié)
以上是生活随笔為你收集整理的2021年大数据基础(一):大数据概念的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年大数据ZooKeeper(六)
- 下一篇: 2021年大数据基础(三):