當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

大数据统计分析毕业设计_大数据分析与传统统计分析的区别

發(fā)布時(shí)間：2024/8/5 编程问答 60 豆豆

生活随笔收集整理的這篇文章主要介紹了大数据统计分析毕业设计_大数据分析与传统统计分析的区别小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

大數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計(jì)分析的區(qū)別：其一是數(shù)據(jù)分析時(shí)不再進(jìn)行抽樣，而是采用全樣本(n=all)；其二是分析方法，不再采用傳統(tǒng)的假設(shè)檢驗(yàn)。

一、統(tǒng)計(jì)方法：

大數(shù)據(jù)的應(yīng)用，解決了一般統(tǒng)計(jì)方法上主要誤差來(lái)源：抽取樣本以及假設(shè)檢驗(yàn)中使用的前提假設(shè)。

一般統(tǒng)計(jì)方法中依據(jù)的中值定理和大數(shù)定律闡明我們可以通過(guò)增大樣本容量，且多次抽取樣本使得結(jié)果更加精確，但這一結(jié)論成立的條件在于所有樣本的抽取滿足i.i.d.(independent and identically distributed，即假設(shè)變量分布獨(dú)立且相同)，而這一假設(shè)在現(xiàn)實(shí)中很難滿足。樣本的選擇很難做到完全隨機(jī)。一般商業(yè)案例中采用的隔多少位抽取樣本的方法在統(tǒng)計(jì)學(xué)意義上不滿足隨機(jī)要求，所得結(jié)果誤差在所難免。

類似，多大的樣本才算足夠大也存在爭(zhēng)議，而大數(shù)據(jù)直接采用全樣本(population)來(lái)進(jìn)行分析可以消除這一部分造成的誤差。

二、分析方法：

傳統(tǒng)分析方法是對(duì)需要回答的問(wèn)題作出一定的假設(shè)，例如教育背景對(duì)保險(xiǎn)購(gòu)買(mǎi)金額有影響，然后根據(jù)這一假設(shè)在所抽取的樣本上進(jìn)行檢驗(yàn)。而檢驗(yàn)假設(shè)這一方法就充滿著現(xiàn)實(shí)數(shù)據(jù)不滿足的前提假設(shè)，比如最著名的正態(tài)分布。正態(tài)分布是一個(gè)很好的假設(shè)，因?yàn)樗芎?jiǎn)化計(jì)算，而且通過(guò)對(duì)數(shù)據(jù)的各種變形，基本上也可以在一定置信區(qū)間內(nèi)勉勉強(qiáng)強(qiáng)算為正態(tài)分布。

再次，假設(shè)檢驗(yàn)的結(jié)果只能不否認(rèn)原假設(shè)，并不能得出完全支持的結(jié)論。

但大數(shù)據(jù)的情況就不一樣。對(duì)大數(shù)據(jù)進(jìn)行分析時(shí)，我們并不需要對(duì)問(wèn)題提出假設(shè)，而是通過(guò)算法找出變量之間的相關(guān)度。以上例子中，如果教育背景和保險(xiǎn)購(gòu)買(mǎi)額這兩個(gè)變量間相關(guān)度高(e.g. 接近1)，那么保險(xiǎn)公司就應(yīng)該更主要針對(duì)高教育背景的人推銷保險(xiǎn)。

大數(shù)據(jù)的應(yīng)用可以說(shuō)是在減少人類處理數(shù)據(jù)時(shí)帶入的主觀假設(shè)的影響，而完全依靠數(shù)據(jù)間的相關(guān)性來(lái)闡述。而由于消除人為因素帶入的誤差，已經(jīng)分析人員作出假設(shè)的限制(如果教育背景和保險(xiǎn)購(gòu)買(mǎi)額是相關(guān)的，而分析人員沒(méi)想到，那這個(gè)結(jié)論就不會(huì)被分析出來(lái)，這在實(shí)際案例中是很容易發(fā)生的)，大數(shù)據(jù)的核心也就在于它能更充分的發(fā)掘數(shù)據(jù)的全部真實(shí)含義。

原文鏈接：

https://www.zhihu.com/question/23273263/answer/90758820

薦：

【中國(guó)風(fēng)動(dòng)漫】除了《哪吒》，這些良心國(guó)產(chǎn)動(dòng)畫(huà)也應(yīng)該被更多人知道！

聲明

來(lái)源：知乎，RAD極客會(huì)(ID:RAD_Geek_Club)推薦閱讀，不代表RAD極客會(huì)立場(chǎng)，轉(zhuǎn)載請(qǐng)注明，如涉及作品版權(quán)問(wèn)題，請(qǐng)聯(lián)系我們刪除或做相關(guān)處理！

人工智能產(chǎn)業(yè)鏈聯(lián)盟

總結(jié)

以上是生活随笔為你收集整理的大数据统计分析毕业设计_大数据分析与传统统计分析的区别的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：奥拉星2如何快速升级100级奥拉星2快
下一篇：思科交换机ping得通 tracerou

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

大数据统计分析毕业设计_大数据分析与传统统计分析的区别

【中國(guó)風(fēng)動(dòng)漫】除了《哪吒》，這些良心國(guó)產(chǎn)動(dòng)畫(huà)也應(yīng)該被更多人知道！

總結(jié)