《集体智慧编程》——第一章导读
為什么80%的碼農(nóng)都做不了架構(gòu)師?>>> ??
- 什么是集體智慧
其含義是指:為了長早新的想法,而將一群人的行為、偏好或思想組合在一起。
完成這項工作的一種最為基礎(chǔ)的方法,便是使用調(diào)查問卷或普查。從一大群人中搜集的答案可以使我們得出關(guān)于群組的統(tǒng)計結(jié)論:組中的個體成員將會被忽視。從獨(dú)立的數(shù)據(jù)提供者那里得出新的結(jié)論,是集體智慧所真正關(guān)注的。
一直以來,人們都是利用Internet來購買所需、搜集信息、尋求娛樂,以及架設(shè)自己的Web站點。所有的這些行為都可以得到監(jiān)控,并且不必要讓用戶放下手頭的工作而進(jìn)行詢問,可以從他們的行文中得到信息,挖掘出有價值的結(jié)論。已經(jīng)有大量的方法可以對這些信息進(jìn)行加工和解釋。有兩個例子:wikipedia和Google搜索。wikipedia是通過所有用戶共同編輯來創(chuàng)建或編輯詞條,雖然存在惡意用戶,但大多數(shù)的主題都會被認(rèn)為是準(zhǔn)確的。Google搜索是從web內(nèi)容的創(chuàng)建者對自己網(wǎng)站的操作中提取關(guān)鍵詞,并且利用這些信息為Google的使用者設(shè)定各個網(wǎng)站的分值。
但這本《集體智慧編程》關(guān)注的不是像wikipedia歸功于提供內(nèi)容的用戶,而在于算法,這其中包括了Google的PageRank算法。該算法會搜集用戶的數(shù)據(jù),對數(shù)據(jù)進(jìn)行計算分析,并從中創(chuàng)造出可以增強(qiáng)用戶體驗的新信息。數(shù)據(jù)的獲取有兩種方式:第一種是明確搜集,例如需要用戶投票打分的方式;第二種是偶然搜集,如觀察用戶的購買行為。通過搜集信息后,還有通過一種智能化的方式對這些信息進(jìn)行處理,并產(chǎn)生出有用的新信息來。
而這本書,就是告訴我們?nèi)绾卫瞄_放的API來搜集數(shù)據(jù),同時還會討論到各種機(jī)器學(xué)習(xí)算法和統(tǒng)計方法。將二者結(jié)合起來,可以借助集體智慧的相關(guān)方法,對由自己編寫的應(yīng)用程序搜集得到的數(shù)據(jù)進(jìn)行分析;同時,可以從其他地方搜集數(shù)據(jù),并對數(shù)據(jù)進(jìn)行試驗。
- 什么是機(jī)器學(xué)習(xí)
缺點:受限于大量模式上的歸納能力,而一個模式如果不同于算法先前所曾見到過得任何其他模式,那么它很有可能被“誤解”。也有過度歸納的可能性。
轉(zhuǎn)載于:https://my.oschina.net/gzckj/blog/100799
總結(jié)
以上是生活随笔為你收集整理的《集体智慧编程》——第一章导读的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [转]一个人脸检测器
- 下一篇: iPhone开发笔记[1/50]:初学i