日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

大数据统计分析毕业设计_大数据分析与传统统计分析的区别

發(fā)布時(shí)間:2024/8/5 编程问答 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 大数据统计分析毕业设计_大数据分析与传统统计分析的区别 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

大數(shù)據(jù)分析與傳統(tǒng)統(tǒng)計(jì)分析的區(qū)別:其一是數(shù)據(jù)分析時(shí)不再進(jìn)行抽樣,而是采用全樣本(n=all);其二是分析方法,不再采用傳統(tǒng)的假設(shè)檢驗(yàn)。

一、統(tǒng)計(jì)方法:

大數(shù)據(jù)的應(yīng)用,解決了一般統(tǒng)計(jì)方法上主要誤差來(lái)源:抽取樣本以及假設(shè)檢驗(yàn)中使用的前提假設(shè)。

一般統(tǒng)計(jì)方法中依據(jù)的中值定理和大數(shù)定律闡明我們可以通過(guò)增大樣本容量,且多次抽取樣本使得結(jié)果更加精確,但這一結(jié)論成立的條件在于所有樣本的抽取滿足i.i.d.(independent and identically distributed,即假設(shè)變量分布獨(dú)立且相同),而這一假設(shè)在現(xiàn)實(shí)中很難滿足。樣本的選擇很難做到完全隨機(jī)。一般商業(yè)案例中采用的隔多少位抽取樣本的方法在統(tǒng)計(jì)學(xué)意義上不滿足隨機(jī)要求,所得結(jié)果誤差在所難免。

類似,多大的樣本才算足夠大也存在爭(zhēng)議,而大數(shù)據(jù)直接采用全樣本(population)來(lái)進(jìn)行分析可以消除這一部分造成的誤差。

二、分析方法:

傳統(tǒng)分析方法是對(duì)需要回答的問(wèn)題作出一定的假設(shè),例如教育背景對(duì)保險(xiǎn)購(gòu)買金額有影響,然后根據(jù)這一假設(shè)在所抽取的樣本上進(jìn)行檢驗(yàn)。而檢驗(yàn)假設(shè)這一方法就充滿著現(xiàn)實(shí)數(shù)據(jù)不滿足的前提假設(shè),比如最著名的正態(tài)分布。正態(tài)分布是一個(gè)很好的假設(shè),因?yàn)樗芎?jiǎn)化計(jì)算,而且通過(guò)對(duì)數(shù)據(jù)的各種變形,基本上也可以在一定置信區(qū)間內(nèi)勉勉強(qiáng)強(qiáng)算為正態(tài)分布。

再次,假設(shè)檢驗(yàn)的結(jié)果只能不否認(rèn)原假設(shè),并不能得出完全支持的結(jié)論。

但大數(shù)據(jù)的情況就不一樣。對(duì)大數(shù)據(jù)進(jìn)行分析時(shí),我們并不需要對(duì)問(wèn)題提出假設(shè),而是通過(guò)算法找出變量之間的相關(guān)度。以上例子中,如果教育背景和保險(xiǎn)購(gòu)買額這兩個(gè)變量間相關(guān)度高(e.g. 接近1),那么保險(xiǎn)公司就應(yīng)該更主要針對(duì)高教育背景的人推銷保險(xiǎn)。

大數(shù)據(jù)的應(yīng)用可以說(shuō)是在減少人類處理數(shù)據(jù)時(shí)帶入的主觀假設(shè)的影響,而完全依靠數(shù)據(jù)間的相關(guān)性來(lái)闡述。而由于消除人為因素帶入的誤差,已經(jīng)分析人員作出假設(shè)的限制(如果教育背景和保險(xiǎn)購(gòu)買額是相關(guān)的,而分析人員沒(méi)想到,那這個(gè)結(jié)論就不會(huì)被分析出來(lái),這在實(shí)際案例中是很容易發(fā)生的),大數(shù)據(jù)的核心也就在于它能更充分的發(fā)掘數(shù)據(jù)的全部真實(shí)含義。

原文鏈接:

https://www.zhihu.com/question/23273263/answer/90758820

薦:

【中國(guó)風(fēng)動(dòng)漫】除了《哪吒》,這些良心國(guó)產(chǎn)動(dòng)畫也應(yīng)該被更多人知道!

聲明

來(lái)源:知乎,RAD極客會(huì)(ID:RAD_Geek_Club)推薦閱讀,不代表RAD極客會(huì)立場(chǎng),轉(zhuǎn)載請(qǐng)注明,如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系我們刪除或做相關(guān)處理!

人工智能產(chǎn)業(yè)鏈聯(lián)盟

總結(jié)

以上是生活随笔為你收集整理的大数据统计分析毕业设计_大数据分析与传统统计分析的区别的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。