當(dāng)前位置:
首頁 >
前出塞数据挖掘的一些必须了解的概念
發(fā)布時間:2025/3/15
27
豆豆
生活随笔
收集整理的這篇文章主要介紹了
前出塞数据挖掘的一些必须了解的概念
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
前出塞現(xiàn)在使用了數(shù)據(jù)挖掘,下面跟大家一起討論下數(shù)據(jù)挖掘的概念。從龐雜的數(shù)據(jù)背后挖掘、分析用戶的行為習(xí)慣和喜好,找出更符合用戶「口味」的產(chǎn)品和服務(wù),并結(jié)合用戶需求有針對性地調(diào)整和優(yōu)化自身,就是大數(shù)據(jù)的價值。?
對于大數(shù)據(jù)在商業(yè)上的用途,這句話說得很清楚。前半句是重點,了解用戶的行為習(xí)慣和愛好,這就是大數(shù)據(jù)的核心價值。
1. 元數(shù)據(jù)(Metadata)的概念
簡單說,元數(shù)據(jù)是對數(shù)據(jù)本身進行描述的數(shù)據(jù),或者說,它不是對象本身,它只描述對象的屬性。
比如,一幅畫本身,是數(shù)據(jù)。而這幅畫的作者、完成時間、尺寸、價格、類型等等,就是它的元數(shù)據(jù)。
再比如,你媽逼你結(jié)婚,找了個男的讓你相親。你并不認識他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛好特長,你心里也就對他有了印象。即便你還不認識他。
元數(shù)據(jù)的價值,第一是能夠從側(cè)面描述對象,第二點就是可以結(jié)構(gòu)化、信息化。
什么意思呢?
比如,我們要判斷一幅畫的價值,除了專家直接通過畫的藝術(shù)性來評價,還可以通過元數(shù)據(jù)來判斷。
這幅畫是名家的還是二流畫家的?這幅畫是作者在他創(chuàng)作鼎盛時期的作品,還是在年輕時的作品?這幅畫是作者擅長的類型還是他不熟悉的?
用這些描述的信息,我們居然就能把這幅畫的價值算得八九不離十。雖然肯定會存在誤差,但同樣是科學(xué)合理的方法。
那用元數(shù)據(jù)而非數(shù)據(jù)本身描述對象的意義何在?
這就是在大數(shù)據(jù)上產(chǎn)生的價值了:對于非結(jié)構(gòu)化的、非量化的對象本身,結(jié)構(gòu)化的元數(shù)據(jù)可以用以快速計算和判斷。
比如,你媽拿了 100 個單身男的資料,你要是一個一個去仔細翻閱,那幾天都翻不完。但你告訴你媽,高學(xué)歷的可能意味著素質(zhì)很高,高收入的可能意味著能力很強,所以先把低學(xué)歷低收入的篩掉,剩下的再依據(jù)身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會有失誤的,說不定真愛就在被篩掉的人里。但這樣的概率微乎其微。
相親里似乎還不太明顯,但大數(shù)據(jù)在真正產(chǎn)品應(yīng)用中,產(chǎn)生的效果就天翻地覆了。(待續(xù)。。。)
對于大數(shù)據(jù)在商業(yè)上的用途,這句話說得很清楚。前半句是重點,了解用戶的行為習(xí)慣和愛好,這就是大數(shù)據(jù)的核心價值。
1. 元數(shù)據(jù)(Metadata)的概念
簡單說,元數(shù)據(jù)是對數(shù)據(jù)本身進行描述的數(shù)據(jù),或者說,它不是對象本身,它只描述對象的屬性。
比如,一幅畫本身,是數(shù)據(jù)。而這幅畫的作者、完成時間、尺寸、價格、類型等等,就是它的元數(shù)據(jù)。
再比如,你媽逼你結(jié)婚,找了個男的讓你相親。你并不認識他,但你媽告訴你他的年齡、身高、體重、體貌特征、家庭背景、收入、愛好特長,你心里也就對他有了印象。即便你還不認識他。
元數(shù)據(jù)的價值,第一是能夠從側(cè)面描述對象,第二點就是可以結(jié)構(gòu)化、信息化。
什么意思呢?
比如,我們要判斷一幅畫的價值,除了專家直接通過畫的藝術(shù)性來評價,還可以通過元數(shù)據(jù)來判斷。
這幅畫是名家的還是二流畫家的?這幅畫是作者在他創(chuàng)作鼎盛時期的作品,還是在年輕時的作品?這幅畫是作者擅長的類型還是他不熟悉的?
用這些描述的信息,我們居然就能把這幅畫的價值算得八九不離十。雖然肯定會存在誤差,但同樣是科學(xué)合理的方法。
那用元數(shù)據(jù)而非數(shù)據(jù)本身描述對象的意義何在?
這就是在大數(shù)據(jù)上產(chǎn)生的價值了:對于非結(jié)構(gòu)化的、非量化的對象本身,結(jié)構(gòu)化的元數(shù)據(jù)可以用以快速計算和判斷。
比如,你媽拿了 100 個單身男的資料,你要是一個一個去仔細翻閱,那幾天都翻不完。但你告訴你媽,高學(xué)歷的可能意味著素質(zhì)很高,高收入的可能意味著能力很強,所以先把低學(xué)歷低收入的篩掉,剩下的再依據(jù)身高體重年齡這些信息排序,那效率就高得多了。
注意,這樣的方法仍然會有失誤的,說不定真愛就在被篩掉的人里。但這樣的概率微乎其微。
相親里似乎還不太明顯,但大數(shù)據(jù)在真正產(chǎn)品應(yīng)用中,產(chǎn)生的效果就天翻地覆了。(待續(xù)。。。)
總結(jié)
以上是生活随笔為你收集整理的前出塞数据挖掘的一些必须了解的概念的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jquery validate 中文教程
- 下一篇: 大数据?人工智能?揭秘银行数据仓库发展趋