机器学习、数据挖掘及其他
? 機器學習、數據挖掘及其他
在本書中,我們不斷地提及“智能”,到底什么是“智能”?我們說的是人工智能嗎?或者是機器學習?它跟數據挖掘和軟計算有什么關系?在學術界,對于本書中所介紹的內容的精確定義也已經爭論了好幾年。從實踐的角度看,這些概念并沒有實質性的區別,更多的是指應用環境的不同。本書融合了上述所有領域的精華,讓我們逐個來看看吧。
以其首字母縮寫AI而廣為人知的人工智能是一個起源于20世紀50年代的計算領域。最初,AI的目標是極具野心的,試圖開發出能像人類一樣思考的機器(Russell and Norvig, 2002; Buchanan, 2005)。隨著時間的推移,目標變得更加可行和具體。遙不可及的目標不得不屈服于殘酷的現實,但是我們之前提及的很多領域都源自人工智能,比如機器學習、數據挖掘、軟計算等。
現在,即使是最先進的計算智能系統也無法理解四歲小孩所閱讀的小故事。所以,如果我們無法讓計算機“思考”,是否能讓計算機“學習”呢?可以教會計算機根據動物的特征來判斷物種嗎?識別不良的次級房貸呢?更復雜的事情,諸如語音識別并用自然語言答復,計算機能做到嗎?所有這些問題的答案都是肯定的。然而你有可能會好奇,“這些問題到底說明了什么?”。解決上面這些問題,一個最簡單的方法就是在計算機中構建一個龐大的數據表,把所有可能的問題的答案都存放在里面,然后在回答問題時只需在表中搜索現成的答案即可。
當然,這個查詢數據表的方法是可行的,但其中也有一些問題。首先,在實際的產品系統中,包含所有問題和答案的表肯定是非常大的。所以,從效率的角度考慮,這肯定不是一個最優的解決方案。其次,如果數據庫中沒有某個問題的答案,就無法給出回答,如果真有用戶問這些問題,你就只能用“敏感詞”來搪塞他了。最后,還必須安排人來構建和維護這個查詢表,而且隨著表的增長,所需的人數也會不斷增長,這估計會讓公司的財務部門比較惱火。所以,查詢表并不是一個好辦法,我們需要更好的解決方案。
機器學習指的是軟件系統能從已有的經驗中抽象出普遍的規則,然后利用這些規則回答各種問題,包括曾經遇到過的和不曾見過的。有些算法對于人類是透明的,意思就是說,人類可以理解算法所抽象出來的規則。透明算法的典型例子有決策樹,以及所有基于規則的學習方法。還有一類算法對人類是不透明的,例如,神經網絡和支持向量機(SVM)就屬于這一類算法。
時刻要記住,跟人類智能一樣,機器智能也是不可靠的。在智能應用領域,你將學會如何處理不確定性和模糊性。就像真實世界一樣,所有問題的答案都有一個可信度,而不是絕對可靠的。雖然在我們的日常生活中,我們總是簡單地假設某些事情是一定會發生的。正因為如此,在使用智能應用時,我們需要解決可信度、有效性以及錯誤代價等方面的問題。
?
本文節選自《智能WEB算法》一書。
圖書詳細信息:http://www.cnblogs.com/broadview/archive/2011/08/19/2145944.html
總結
以上是生活随笔為你收集整理的机器学习、数据挖掘及其他的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AcWing 243. 一个简单的整数
- 下一篇: 2009最新网络歌曲《孟婆的碗》夏鸣专辑