数据分析与挖掘理论-概述
生活随笔
收集整理的這篇文章主要介紹了
数据分析与挖掘理论-概述
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
數(shù)據(jù)分析與挖掘
- 個(gè)人理解
- 數(shù)據(jù)分析和數(shù)據(jù)挖掘是最近幾年才出現(xiàn)的一個(gè)名詞,其歸根到底的目的就是經(jīng)過(guò)一系列手段處理數(shù)據(jù)(集)得到一個(gè)適合的建模數(shù)據(jù),利用建模數(shù)據(jù)建立模型分析挖掘已有數(shù)據(jù)的隱含價(jià)值。
- 一般步驟(詳細(xì)內(nèi)容子目錄有敘述,且后面的實(shí)戰(zhàn)項(xiàng)目我會(huì)嚴(yán)格按照這個(gè)步驟進(jìn)行,后面會(huì)詳細(xì)介紹下面的主要步驟)
- 數(shù)據(jù)獲取
- 利用各種手段獲取數(shù)據(jù),數(shù)據(jù)樣式不限制,但一般而言是形如excel或者csv這樣的表格格式。
- 數(shù)據(jù)探索
- 對(duì)數(shù)據(jù)進(jìn)行初步探索,得到數(shù)據(jù)特征(如每一列的平均值,分位數(shù),最大最小值,空值數(shù)目)。
- 數(shù)據(jù)預(yù)處理
- 毫不夸張的說(shuō),這是整個(gè)數(shù)據(jù)挖掘過(guò)程中最費(fèi)時(shí)間的部分。
- 對(duì)原始數(shù)據(jù)進(jìn)行處理,得到合適的建模數(shù)據(jù)(如處理異常值,屬性規(guī)約,數(shù)據(jù)清洗,數(shù)據(jù)變換,數(shù)據(jù)標(biāo)準(zhǔn)化)。
- 數(shù)據(jù)挖掘建模
- 如果任務(wù)明確,模型的選擇是指定的,但是算法的優(yōu)化,準(zhǔn)確率的考究等是需要處理的。(如分類預(yù)測(cè)、關(guān)聯(lián)規(guī)則獲取。
- 后續(xù)處理
- 一般是指模型實(shí)際應(yīng)用。
- 數(shù)據(jù)獲取
總結(jié)
以上是生活随笔為你收集整理的数据分析与挖掘理论-概述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 排序算法-02直接插入(python实现
- 下一篇: 数据分析与挖掘理论-数据探索