数据意识上的“代沟”
數據意識上的“代溝”
2017-06-02 16:24:52來源: 財新網作者:張小彥責任編輯:張帆 2017年06月02日 16:24 來源于 財新網- 3發表評論
- 分享到微信朋友圈
- 騰訊轉發
- 新浪轉發
【財新網】(專欄作家 張小彥)每個有青春期孩子的父母都知道什么是“代溝”。每個青少年也都體會到與父母之間理念和思維上的距離。兩代人之間的溝通是一個十分頭痛但必須面對的問題。在今天這個新技術層出不窮、生活日新月異的世界,“代溝”尤其明顯。這個“代溝”不僅存在于家庭里,它在競爭激烈的職場、市場、公司、機構、組織之間也是無所不在。以數據意識為例,不同時代的人(包括數據分析專業人員)、不同類型的公司和機構之間就有很深的“代溝”。
記得幾年前我在大學讀書的女兒回家過圣誕節。上了我的車后第一句話就問“車上有沒有Wifi ?”接下來是“有沒有藍牙(Blue Tooth)?”。得到肯定答復后不到一分鐘車里就響起了女兒喜愛的流行歌曲。原來她已經用蘋果手機通過藍牙連接了車上的音響,通過Wifi聯通到流行歌曲網站(Spotify)。對她這樣伴隨互聯網和智能手機成長起來的一代人,整個世界都是通過無形網絡連在一起的。數據、信息、娛樂、購物等都在“云里”,通過互聯網加谷歌搜索,一切都隨手可得。沒有手機和互聯網,這代人將不知道如何生活。難怪有人在馬斯洛的需求金字塔的底層加上了Wifi(見下圖)。
馬斯洛需求金字塔
| ? |
在判斷某一事物的好壞上,孩子們第一想到的是其在網上的點擊量、點贊次數和轉發率。父母一代卻常常會提醒他們任何事都要經得起時間的考驗,對事要有自己的判斷,不能只看點擊數據等等。
即使與數據分析專業人員交談,也能體會到數據意識上的“代溝”。很多傳統統計學家對大數據就格格不入。他們常說的一句話是“垃圾進,垃圾出”,對雜亂無章的多源、多類、半結構、無結構的數據不以為然。相比之下,伴隨互聯網、網上銷售、社會網絡成長起來的新一代數據人員,通過對自然積累、源源不斷的網絡、臉譜、推特等數據分析挖掘來獲取信息和智能則成為天經地義的習慣動作。他們就是要通過對看似垃圾的無結構數據分類、打標簽、梳理、應用機器學習等方法挖掘出有含金量的智能。大數據技術使他們能高速有效地從稻草堆里尋找金針。
不同時代的公司和部門在數據意識上的“代溝”也是明顯的。隨著互聯網應運而生的新一代商業巨頭如谷歌、亞馬遜、臉譜、百度、騰訊、阿里巴巴等從誕生那一天就與數據打交道。源源不斷自動積累的數碼化記錄是公司運營的組成部分。以數據為驅動的決策和管理是來自于基因的文化。每個員工都有數據意識。面對源源不斷的數據流,他們在問“今天的數據又在告訴我們什么?”網上電商隨時注意著點擊和銷售的比率;100次、50次,還是5次點擊能產生一個交易,這個時時都可獲取的數據成了公司的生命線。數據在不斷地挑戰傳統的經營理念。新一代的公司勇于接受挑戰,讓數據揭示新的機遇。無數據不決策的理念貫徹到公司運營的每一個環節。
相比之下,傳統公司有多年形成和沿用的決策程序。數據是為管理需要而定向采集的注冊、登記、監測、行政數據以及支持決策的調研數據。管理人員和決策者根據經驗和智慧提出方案,然后用數據來檢測以選擇最佳方案。這個過程中,經驗和智慧是主導,數據是輔助。認識到不同時代公司和機構在數據意識上的代溝可以幫助我們理解為什么在傳統企業中推動大數據和數據科學如此步履維艱。
盡管數據意識上有代溝,但在數據分析的目的是決策支持這一點是共同的。數據分析和決策過程中的三要素是一致的。數據科學家都知道,理論、方法、數據是數據分析中的“金三角”,缺少哪一樣都不行。數據提煉成信息需要科學的方法,信息需要理論來解釋才有意義。傳統的數據意識是先有理論,再尋找驗證理論的最佳方法,然后設計問卷(或數據采集工具)采集數據來驗證理論假設。在數碼化數據實時產生和高速積累的今天,大數據技術使高速處理和分析海量數據成為可能。因此新的數據意識是從數據開始,然后制定最佳數據處理和分析方法,最后尋求和創造理論來理解和解釋數據分析的結果。在現實生活中,兩種數據意識是并存的,各有各的用途。有智慧的數據科學家知道什么情況下應選擇哪條路,并且在數據分析金三角中取得平衡
總結
以上是生活随笔為你收集整理的数据意识上的“代沟”的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 模拟上帝之手的对抗博弈——GAN背后的数
- 下一篇: 李嘉诚亲自指导:阿尔法狗战何洁