数据分析与挖掘理论-概述
生活随笔
收集整理的這篇文章主要介紹了
数据分析与挖掘理论-概述
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據分析與挖掘
- 個人理解
- 數據分析和數據挖掘是最近幾年才出現的一個名詞,其歸根到底的目的就是經過一系列手段處理數據(集)得到一個適合的建模數據,利用建模數據建立模型分析挖掘已有數據的隱含價值。
- 一般步驟(詳細內容子目錄有敘述,且后面的實戰項目我會嚴格按照這個步驟進行,后面會詳細介紹下面的主要步驟)
- 數據獲取
- 利用各種手段獲取數據,數據樣式不限制,但一般而言是形如excel或者csv這樣的表格格式。
- 數據探索
- 對數據進行初步探索,得到數據特征(如每一列的平均值,分位數,最大最小值,空值數目)。
- 數據預處理
- 毫不夸張的說,這是整個數據挖掘過程中最費時間的部分。
- 對原始數據進行處理,得到合適的建模數據(如處理異常值,屬性規約,數據清洗,數據變換,數據標準化)。
- 數據挖掘建模
- 如果任務明確,模型的選擇是指定的,但是算法的優化,準確率的考究等是需要處理的。(如分類預測、關聯規則獲取。
- 后續處理
- 一般是指模型實際應用。
- 數據獲取
總結
以上是生活随笔為你收集整理的数据分析与挖掘理论-概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 排序算法-02直接插入(python实现
- 下一篇: 数据分析与挖掘理论-数据探索