日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据挖掘知识清单

發(fā)布時間:2024/10/8 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据挖掘知识清单 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

數(shù)據(jù)挖掘的基本流程

數(shù)據(jù)挖掘的六個步驟分析:

1.商業(yè)理解:數(shù)據(jù)挖掘不是我們的目的,我們的目的是更好地幫助業(yè)務(wù),所以第一步我們要從商業(yè)的角度理解項目需求,在這個基礎(chǔ)上,再對數(shù)據(jù)挖掘的目標進行定義。2.數(shù)據(jù)理解:嘗試收集部分數(shù)據(jù),然后對數(shù)據(jù)進行探索,包括數(shù)據(jù)描述、數(shù)據(jù)質(zhì)量驗證等。這有助于你對收集的數(shù)據(jù)有個初步的認知。3.數(shù)據(jù)準備:開始收集數(shù)據(jù),并對數(shù)據(jù)進行清洗、數(shù)據(jù)集成等操作,完成數(shù)據(jù)挖掘前的準備工作。4.模型建立:選擇和應(yīng)用各種數(shù)據(jù)挖掘模型,并進行優(yōu)化,以便得到更好的分類結(jié)果。5.模型評估:對模型進行評價,并檢查構(gòu)建模型的每個步驟,確認模型是否實現(xiàn)了預(yù)定的商業(yè)目標。6.上線發(fā)布:模型的作用是從數(shù)據(jù)中找到金礦,也就是我們所說的“知識”,獲得的知識需要轉(zhuǎn)化成用戶可以使用的方式,呈現(xiàn)的形式可以是一份報告,也可以是實現(xiàn)一個比較復(fù)雜的、可重復(fù)的數(shù)據(jù)挖掘過程。數(shù)據(jù)挖掘結(jié)果如果是日常運營的一部分,那么后續(xù)的監(jiān)控和維護就會變得重要。

數(shù)據(jù)挖掘的十大算法

歸類為4類算法

分類算法:c4.5、樸素貝葉斯算法、SVM、KNN、Adaboost、CART聚類算法:K-Means、EM關(guān)系分析:Apriori連接分析:PageRank1. C4.5C4.5 算法是得票最高的算法,可以說是十大算法之首。C4.5 是決策樹的算法,它創(chuàng)造性地在決策樹構(gòu)造過程中就進行了剪枝,并且可以處理連續(xù)的屬性,也能對不完整的數(shù)據(jù)進行處理。它可以說是決策樹分類中,具有里程碑式意

總結(jié)

以上是生活随笔為你收集整理的数据挖掘知识清单的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。