一天大数据生活
4月24日,百度在北京舉辦大數據引擎技術論壇。百度董事長兼CEO李彥宏難得一見出現在論壇上。他在十分鐘的演講里,最讓我印象深刻的是他提到一個觀點,即互聯網在逐個改變傳統行業,但誰來改變互聯網?他給出的答案是技術。那么這個技術會是什么?李彥宏的答案是大數據技術。
大數據這個概念火了好幾年了。最早的時候我看過一本叫做《大數據時代》的書,里面列舉了一些大數據的應用。印象中有這么一個例子,記得不是特別準確,大致意思說的是,在美國,某個當爹的有一天收到一個電商公司寄來的關于嬰幼兒產品的廣告信息。他很憤怒地,覺得這種垃圾廣告騷擾到了自己。他甚至找到這個電商公司理論。結果幾個月之后,他知道自己的女兒未婚先孕,他要當外公了。而電商公司之所以能提前預測到他對嬰幼兒產品的需求,是因為根據他女兒此前的購物、搜索和社交網絡等信息所作出的猜測。
推薦購物。這是很多人對于大數據應用的了解。那么幾年過去了,大數據技術的應用到底發展到一個怎樣的層次和水平?今天新聞觀止就結合百度大叔就搜索引擎上幾個嘉賓提到的案例,通過虛擬一天的大數據生活,來讓大家對大數據這個技術有更多直觀的了解。
大家準備好了嗎?來吧,大數據的一天開始了。
一早上,你被手機鬧鐘叫醒。昨晚你帶著一款小型可穿戴設備睡覺的。這個設備連接著你手機里的一款大數據的APP,你打開它。就可以看到昨晚你睡覺時候的身材狀況。比如你是什么時候晨勃的,勃起了幾次。另外你昨晚睡覺翻身了幾次,心跳和血壓狀況都有一個詳細的統計告訴你。最后這個軟件會告訴你,根據昨晚你的身體狀況,建議你今天出門之前喝點什么,或者回家的時候記得去藥店帶回點維生素之類的營養品。
現在已經有很多可穿戴設備能夠24小時每天監控我們的健康狀況,包括了我們的血壓、心跳、睡眠狀況、運動狀況。檢測我們汗液、血液,監測我們身體情況。當我們把24小時檢測數據上傳到大數據中心,跟醫院關聯以后,就會產生新的價值點出來。
用心臟病做一個例子,我們每年有幾百萬人得了心臟病,如果我們的大數據中心具有很好的計算能力,我們能夠從這幾百萬患者的24小時監控數據里頭找到它的共性。我們提前兩天給人發預警,如果你再這樣下去就有可能得心臟病,由醫院給人群發出警告。
在大數據時代,便攜式的可穿戴傳感器會越來越多,設備越來越多。原來在醫院做,現在都可以在家做。這個帶來的變化是你可以7*24小時對身體的進行監測。在西方有個非常時髦的術語叫量化自我,時刻想知道自己身體上的變化。在美國量化自我的先鋒們,每兩周做一次核磁共振,然后去做血的檢查。這些設備產生出來所有的數據,全部都存儲在云端,它的數據慢慢在云端去積累,當量達到一定階段就是數據的量變了。
大數據對于醫生和醫院都將帶來改變。百度搜索研發部副總監高亮舉個了例子,他一個同學岳母,年輕時候一直在協和醫院看病,到今天為止已經80歲了。到醫院慢慢積累這個病例,這個病例也就是牛皮紙這么厚,這么大一個袋子,大概250px厚,這是一個人一生的醫療數據。
現在這些紙質的數據慢慢變成了電子化。但這個數據太大,大到你沒有傳統辦法去看,去分析,去識別。僅僅是三個月醫療數據,讓醫生看一下,醫生可能都沒有辦法,也沒有時間看,他一定需要一些工具才把特征提取出來,輔助他做出診斷。
此外,對醫院來說,數據大了帶來兩個問題,醫院現有IT系統比較難存儲,試想一個人一生數據在幾個T的話,價錢最好的電腦可能也就只能存一部分。這個成本在醫院來說是比較高的。
所以,這些數據持續膨脹的問題給傳統行業帶來而來挑戰。這些挑戰大數據可以解決。比如百度就提供了百度開放云,百度數據工廠等數據解決方案。
洗漱完之后,你想起今天要帶一個來北京的朋友去逛逛故宮。你打開百度的大數據產品百度預測,看看北京故宮今天預計會有多少人。再看看北京今天的交通預測。百度預測通過每天幾十億次用戶向百度請求定位信息,計算出景區熱地圖。
百度的大數據產品百度大腦已經能夠預測到兩個星期以內的城市旅游熱度,這些旅游人會從哪一個城市過來,百度能提供兩星期的預測,如果把這個更細一點,在城市景點,百度能預測兩天景點擁擠程度。4月24日,玉淵潭和陶然亭哪個公園更擁擠,也可以運用百度大腦計算出來。
到了單位后,如果你是個名人,估計想知道今天你昨天是否被人偷拍了。你用手機給自己拍了一張照片,上傳到百度搜圖網頁上,通過以圖搜圖和圖片識別技術,就能把以前關于你的新聞圖片全部搜尋出來。
到了中午你到一個餐館用餐。大數據軟件,你可以告訴你餐館附近多少車位,算出你可能會遇到的擁堵時間,到了是否還有多少車位等可能性。你在用餐的時候,可以提前看到餐館的視頻環境。看看是否人多。大數據還可以把你臉的部分打成馬賽克,你不用擔心個人信息泄露。
吃完中飯,你收到催繳電話費短信。你很好奇自己過去三年每個月的消費記錄。但過去運營商都是只能讓你查到六個月以內的消費信息。為什么?因為中國移動至少有5億用戶,每天至少能產生10次以上計費記錄。每天50億的計費記錄,包括上短信,打電話之了,一年下來就是1800億條記錄。這是一個大大數據的存儲和歸納技術難題。在大數據時代,過去幾年的電話通訊信息都可以查到了。
下班回家的路上,你再也看不到路邊電線杠上貼的嫌疑犯通緝圖。警察叔叔們使用先進的以圖搜圖功能,在海量監控視頻中,就很快可以通過比對把嫌犯找到。最近嫌犯在哪個城市,哪條街道,哪個商店出現過,就不用上街貼照片。
看過美劇《疑犯追蹤》的人,應該對于大數據對于阻止犯罪的作用印象深刻。這部美劇中,軟件天才Finch發明了一個程序,通過觀測已有的模式來識別有可能進行暴力犯罪的罪犯,他雇用了一位被推定死亡的前美國特種部隊綠色貝雷帽隊員和前CIA探員Reese,二人使用國家級的監測技術,加以Reese的專業技能和Finch的無限財富,開始“法外執法”,力圖在犯罪發生前就對其加以阻止。
當你回到家的時候,你的可穿戴設備告訴你,今天你在室內和室外的時間分別都是多少,你一天內吸入了多少霧霾。
晚上睡覺的時候,你的孩子哭鬧起來。你把孩子的哭聲錄入一個大數據軟件中。軟件能告訴你孩子為什么哭。是餓了,還是哪里不舒服,還是說想撒撒嬌。
為什么能做到這點?很簡單。百度大腦把海量的嬰兒聲紋,上傳到大數據中心提取特征學習,從而幫助到年輕父母,錄下嬰兒哭聲上網比對,就知道孩子因為什么哭,讓沒有帶孩子經驗的父母得到幫助。
總結
- 上一篇: 心田花开:二年级语文阅读《黄山奇石》附答
- 下一篇: NumPy学习笔记前言