数据挖掘与python实践心得体会_数据挖掘心得体会
數(shù)據(jù)挖掘心得體會
【篇一:數(shù)據(jù)挖掘課程體會】
數(shù)據(jù)挖掘課程體會
學(xué)習(xí)數(shù)據(jù)挖掘這門課程已經(jīng)有一個(gè)學(xué)期了,在這十余周的學(xué)習(xí)過程
中,我對數(shù)據(jù)挖掘這門課程的一些技術(shù)有了一定的了解,并明確了
一些容易混淆的概念,以下主要談一下我的心得體會。
近年來,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關(guān)注,其主要原因是存
在大量數(shù)據(jù),可以廣泛使用,并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用
的信息和知識。數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中,抽取出潛在的、有
價(jià)值的知識、模型或規(guī)則的過程。作為一類深層次的數(shù)據(jù)分析方法,
它利用了數(shù)據(jù)庫、人工智能和數(shù)理統(tǒng)計(jì)等多方面的技術(shù)。
要將龐大的數(shù)據(jù)轉(zhuǎn)換成為有用的信息,必須先有效率地收集信息。
隨著科技的進(jìn)步,功能完善的數(shù)據(jù)庫系統(tǒng)就成了最好的收集數(shù)據(jù)的
工具。數(shù)據(jù)倉庫,簡單地說,就是搜集來自其它系統(tǒng)的有用數(shù)據(jù),
存放在一整合的儲存區(qū)內(nèi)。所以其實(shí)就是一個(gè)經(jīng)過處理整合,且容
量特別大的關(guān)系型數(shù)據(jù)庫,用以儲存決策支持系統(tǒng)所需的數(shù)據(jù),供
決策支持或數(shù)據(jù)分析使用。
數(shù)據(jù)挖掘的研究領(lǐng)域非常廣泛,主要包括數(shù)據(jù)庫系統(tǒng)、基于知識的
系統(tǒng)、人工智能、機(jī)器學(xué)習(xí)、知識獲取、統(tǒng)計(jì)學(xué)、空間數(shù)據(jù)庫和數(shù)
據(jù)可視化等領(lǐng)域。主要是可以做以下幾件事:分類、估計(jì)、預(yù)測、
關(guān)聯(lián)分析、聚類分析、描述和可視化、復(fù)雜數(shù)據(jù)類型挖掘。在這里
就不一一介紹了。
在學(xué)習(xí)關(guān)聯(lián)規(guī)則的時(shí)候,提出了一個(gè)關(guān)于啤酒與紙尿布的故事:在
一家超市里,紙尿布與啤酒被擺在一起出售,但是這個(gè)奇怪的舉措
卻使得啤酒和紙尿布的銷量雙雙增加了。其實(shí),這是由于這家超市
對其顧客的購物行為進(jìn)行購物籃分析,在這些原始交易數(shù)據(jù)的基礎(chǔ)
上,利用數(shù)據(jù)挖掘方法對這些數(shù)據(jù)進(jìn)行分析和挖掘。從而意外的發(fā)
現(xiàn)跟紙尿布一起購買最多的商品竟是啤酒。按我們的常規(guī)思維,啤
酒與紙尿布是兩個(gè)毫無關(guān)聯(lián)的商品,但是借助數(shù)據(jù)挖掘技術(shù)對大量
交易數(shù)據(jù)進(jìn)行挖掘分析后,卻可以尋求到這一有價(jià)值的規(guī)律。這個(gè)
故事在一定程度上說明了數(shù)據(jù)挖掘技術(shù)的巨大價(jià)值。
總之,非常感謝周教員在這十余周的精彩授課,讓我受益匪淺,我
會繼續(xù)學(xué)習(xí)這門課程,努力為今后的課題研究或論文打好基礎(chǔ)。
【篇二:數(shù)據(jù)挖掘講課心得體會】
總結(jié)
以上是生活随笔為你收集整理的数据挖掘与python实践心得体会_数据挖掘心得体会的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HTML---HTML简介
- 下一篇: 基于Python分析实现酒店评论的中文情