日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

【干货】吴甘沙:你是数据,我即生意

發布時間:2024/4/17 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【干货】吴甘沙:你是数据,我即生意 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

講座全文:


今天我會跟大家講一個非常特別的話題,關于個人數據的問題。過去講了很多的大數據,更多是在企業、互聯網,前面兩年花了很多時間講開放數據創新,講政府應該把數據開放出來,現在大家已經看到中國的政府,尤其是一些地方政府已經開始把數據開放出來。當然,我不是說我呼吁數據開放與今天這個結果有因果關系,這是大數據的相關性。


我覺得現在是時候開始講一種新的大數據,就是個人數據。大家看這個題目有點拗口,叫做“你是數據,我即生意”。


什么意思呢?


你也許現在已經不是物理的存在,而是你的數據呈現出來的你。而我在某種意義上不再是某個公司的員工,我自己就是一個生意,我是我自己的CEO,我能夠去貨幣化自己的數據,我做我自己數據的生意。這是一個比較獨特的話題,如果你能認真聽完我的演講,這對你來說或許是一個新的商機。


首先,我想跟大家探討幾個問題。



第一個問題,就是你是不是真正的擁有你自己的數據?


我這邊用的這個英文詞叫own,它有幾層意思,先用它的第一層意思,你是不是真正擁有你自己的數據?可能有不同的答案,很多人回答說我并不真正擁有我自己的數據。





為什么呢?大家不是說數據是石油,數據是資產,數據是貨幣,數據是原材料,數據是值錢的東西。但問題是,這是誰的資產?誰的貨幣?誰的原材料?我感覺不是我的。我的數據不是我的資產,這是現在大家很多人有的這么一個考慮。




當然還有很大一部分人回答說,我真正確實是擁有我自己的數據。但這不是好事,懷璧其罪,我因為擁有我的數據,體驗到很多的麻煩,這些數據給我帶來了困擾。


比如說隱私的問題,我們現在跟很多年輕人談隱私,他們不能感覺到這對他來說是一個問題。他覺得我又不是一個愛看A片的中年大叔,我也沒有同性戀,沒有HIV,我又擔心什么呢?但事實上,你換一個角度去看,也許你就能夠理解到隱私對你的影響。


比如說你在用你的電腦時,有個人在你的背后看著,你是否會感到不舒適?這就是一個隱私的問題。事實上,當你在互聯網上沖浪,在使用手機,在到處行走時,你留下了數字足跡,這里面有你的很多隱私。所以隱私的問題,給大家帶來了困擾。




當我在網上購物時,留下了很多信用卡的信息,這可能是一個financial risk。很多人目前并不那么認為,我給大家講一個故事。我有一次到一個地方去開會,住在一個很高大上的酒店,把信用卡給服務員預授權,把東西放到樓上以后,就去酒店的餐廳吃飯,吃完飯以后,在付款的時候,我突然腦子里面出現了三種選擇,第一種選擇是拿現金付款。


第二種選擇是我拿信用卡付,同一張信用卡,或者是說計入房費,第三種選擇是用另外一張信用卡付。為什么會出現這種考慮呢?我用現金付款,我的隱私泄漏最少,但是少掉了一些信用的點數。


如果計入房費呢?也不錯,但是這個酒店更多的了解了我的行為,他不但知道我入住的行為,還知道我用餐的偏好。如果我用另外一張信用卡付呢,無論是連鎖酒店還是每個信用卡公司,它對我的了解都比較片面,沒辦法給我提供更貼心的服務。


可能是我搞技術比較迂腐,但這確實是生活中數字時代的用戶面臨的不同選擇。我回來以后跟我團隊的人探討這個問題,有少數人選擇現金。有一半非常注重隱私的人,他就選擇了用另外一張信用卡。而另外一半希望得到更好服務的人,選擇計入房費。不同的人在這個上面有不同的考慮。




另一個困擾是SPAM,英文有兩層意思,一層意思是午餐肉罐頭,還有一個是垃圾郵件,垃圾短信。這也是人類數字歷史上非常重要的發明,應該是在上世紀70年代發明的一種新的營銷方式,那時候互聯網還沒出來,是ARPANET,在90年代的時候,SPAM一度占了網絡流量的很大一部分。


當然現在比SPAM更先進的是精準營銷。商家說我不是胡亂地給你發東西,我是基于我對你行為的理解,基于我對你的畫像,來對你進行精準營銷,microtargeting。


這按理說也是很好的事情,但問題就在于剛才Chris說的,親密感(intimacy)和令人發指(creepy)之間這條紅線怎么劃分。這個廣告的retargeting讓我很煩惱,我瀏覽網店的時候,把某個貨物放到購物車里面,但沒有去買。


后面我瀏覽任何網頁的時候,總有一個廣告老是跟著我,在問你是不是對這個東西感興趣,希望你再去買。但它不知道,事實上我可能已經在另一個地方買了,這就是對我們帶來的困擾。




問題就來了,你到底在乎嗎?不在乎嗎?



先看這個,即使在技術圈子里面知道的人也不多,叫Do Bot Track,這是瀏覽器的一個功能,最早是在開源的瀏覽器里面。


后面微軟的跟進,最后Google也開始支持。當然Google是很不情愿,一旦把這個打開了以后,它的廣告就沒辦法對你進行精準的營銷了。但問題是在于,圈子里面很多人都不知道這個功能,事實上知道這些功能的人,他也沒有打開。




另外,大家知道現在量化自我這么一個運動非常火。很多人都戴上手環,這是一個非常著名的手環的隱私條款,它說我會把你的信息給其他服務商。而且我不能百分之百保證你信息的安全性。


但是用戶是不是真正在意呢?


用戶看都沒看,就點接受了。所以從這兩個例子上看,是不是我們大家對于隱私,對于這個數據是不是屬于我,對于數據的安全真正很在意呢?好像是不太在意。


確實也有牛人支持這種觀點,凱文·凱利就說在這個互聯的時代里面,把自己藏起來是要付出代價的,你把自己的隱私送出去越多,那你獲得的服務就越好,這就代表了一個很普遍的觀點。




當然也有持不同觀點的,比如杰倫·拉尼爾,他是虛擬現實的先驅者,他說你以為你把自己的數據給了那些人,就能獲得更好的服務嗎?


如果這個在線書店能夠更多地了解你,了解其他人,我就可以做差異化的定價,你買這個東西可能要付出的錢,要比其他人買付出的錢要更多。所以他了解了你,并不一定說你能夠獲得更好的服務,你也許要多付錢,這是兩個完全不同的觀點。但這是思想家的觀點。




我們再看看普通人,這是美國賓夕法尼亞大學做的研究。三個問題,第一個問題,如果說這個商家愿意給你折扣,你愿不愿意無條件地把你的數據給這個商家?這是第一個問題。我想了解一下在座的各位不同意的舉個手?可能有一小半朋友在獲得折扣后,還是愿意把你的數據給這個商家的。


第二個問題,如果說這個商家愿意給你提供免費的wifi,比如說星巴克給你提供免費的wifi,它會跟蹤你上網的行為,來了解你的一些偏好,你愿意還是不愿意?請不愿意的舉一下手?也差不多接近一半。


第三個問題,我這個商家是希望給你畫像、給你提供更好的服務,所以我可能是需要能夠了解一下你的一些數據,估計大家的接受度也是差不多一半。


看看美國的調研,絕大多數普通人事實上是對于自己的數據還是很在意的,并不是因為你商家提供一些小恩小惠,它就愿意把自己的數據無條件地給出來。


所以我今天這個演講的目的,就是希望大家能夠端正一個態度——在大數據時代的一個人生態度,對于自己數據的失控,你不要又不愿意又去忍受,甚至是還有些人有斯德哥爾摩綜合癥,你應該有一種新的態度,這里再一次用了own這個詞,但意思不是擁有,而是負責。你對你自己的數據負責,這是你的數據,你要對你自己負責!




這個態度核心就是兩個,一個叫面子,一個叫里子。面子就是你要真正地去在意你的身份問題,而里子呢,你對你的數據生意是能做主的、是可以從中賺錢的。




先說面子的問題,也就是我標題的前一半,你就是你的數據。你的物理外貌不是特別重要,真正重要的是你的數據呈現出來的你是什么樣子。




我們現在知道,比如說我在這里,大家能夠看到我是這么一個人。但同時呢,我又有一個數字的影子,叫數據畫像。


我這個數據人包括了很多很多的東西,比如說數據的足跡,每個人在沖浪的時候,帶著手機行走的時候,留下了很多數據的足跡。甚至不帶手機,在現在的這個社會還是會留下很多數據的足跡,北京有一百萬個攝象頭,你每天至少能夠在攝象頭里面出現個十幾次。


還有現在量化自我,我們要量化我的生理狀況,量化我的心理狀況,而這些東西都是數據。我們有各種各樣不同的數字身份,我們在不同的網站上面,以不同的ID登錄,不同的ID還帶著不同的密碼。


前幾天我看到一個帖子,他說有個人挺有意思的,他公司要求每三個月改一次密碼,所以他每次都設定一個很有意義的密碼,未來三個月我要怎么改變我自己,怎么來實現我的人生目標,然后我就把這個作為我未來三個月每天登錄時候都要輸入的密碼,蠻好的事情。但是這里面暴露了你的一個目的,暴露了你做事情的意義所在。


還有社交威望問題,我們每個人在社會上,在這個數字世界里面慢慢在培養我的社交威望。在國外有一家公司叫Klout,會量化你的社交威望。這里顯示Klout分數是38,非常不幸,為什么呢?你滿40的時候,就可以到機場用貴賓休息室了,但你的社交威望還差一點點。


還有你的信用,現在互聯網征信非常廣,它的一個理念是什么呢?所有的數據都是信用,這是國外的一個信用評分機構FICO,這個人積分是700分,很不錯,因為這個分數可以在P2P的網站Lending Club上借到錢,如果低于690,就貸不到款了。


還有各種各樣的消費行為,價值取向都反映在我們的數據當中,所有電商公司都會對個人進行刻畫,你是一個什么樣的人,他可能把你刻畫成一個中產階級,有孩子,花銷起來精打細算,你會被錄入到不同的桶里面,被帖上一個桶的標簽。


我看到一個最有意思的桶叫“右鍵一族”,這些人的共同特點是喜歡用鼠標右鍵彈出菜單,而后面反映的共性是對于技術有非常高的敏感度。


所有這些組合起來就是你的數據人。


而你真實的人跟數據人是能夠相互作用的。一方面,你不斷地被量化,數據不斷地去掉噪聲,最后真實刻畫成這么一個數據人,或者是你的數字影子。




另外一方面,因為它是一個數據人,他會無時無刻被大數據所影響。剛才說的Facebook,他要控制大家的情緒,就是一種影響。


甚至是我們在亞馬遜上面買書的時候,你會參考推薦,這樣一種個性化的推薦,就是大數據對你數據人的一種影響,個性化推薦本身是一個矛盾的修辭。說是個性化,但是它的結果又是把你變成跟其他人越來越相似。


所以在這么一個虛擬世界里面,你的數據人不斷地在變。而這種變化呢?又會反饋到你真實的人上面去,所以你的真實的人和數據人相互作用,循環往復、不斷變化。




這樣導致一個問題,你越來越依賴于數據的你,而數據的你會給你帶來麻煩。你點兒背的時候,第一個要考慮的不是怨社會,而是要怨數據,互聯網、大數據永遠把你忠實地記錄下來,而且不能擦除,幾十年前犯的一個事,現在還能用搜索引擎把它搜出來,永遠跟著你走。




第二是數據會被濫用,現在大家都面臨"big brother/big data dillema",有個老大哥會盯著你的數據,會濫用你的數據。


還有數據可能會帶來歧視。給大家舉一個例子,還是互聯網征信的,它會對每一個人建立一個信用的模型,而這個信用模型里面用什么數據呢?


比如說你是金牛座的,那你很有可能在統計意義上面比處女座的人,借錢不還的概率要高一點。或者你這個人老是用IE6,我就認為你是常去網吧上網的人,沒有正當的職業。如果老是半夜兩、三點上網,沒有正當職業,信用降低一點。如果以前上班都用這個IP地址上網的,突然換了一個IP地址,是不是失業了?不能全面、理性地使用這些數據,會導致歧視。



還有一個預測的困擾,剛才講到未來預測是一個很重要的大數據特性,它有可能預測十幾秒以后,你會買什么東西。這還想起來不錯,但它也會預測你幾十年后,會有什么樣的毛病?如果說你幾十年后,有40%的概率會患上某種癌癥,那保險公司就不太愿意給你保險了。


大家看過一部電影,叫做《少數派報告》,里面有個情節,一堆警察破門而入,他說我是哥倫比亞行省預測犯罪局的人,預測你未來會犯罪,要把你抓起來。所以預測也會給我們帶來麻煩。


所有這些都是面子的問題,決定了在數據社會別人眼里我是什么樣子的,我們要認真地經營這個數據人。




經營的一個目的是什么呢?目的就是把我們真正變成我自己的生意,我真正地去own自己的data。




上面這句蠻有意思的,是歌手Jay Z說的,他說I AM NOT A BUSINESSMAN,別把我當做生意人,我自己就是生意。


做生意一定要有意愿去做,為什么要去做呢?


這還是拉尼爾給大家秀的兩張圖,第一張是鐘型曲線,社會階層的收入分布圖,綠色部分是高收入階層,很有錢,但是少數。紅色部分是貧窮階層,也占少數,中產階級是占絕大多數。


但是現在互聯網讓中產階級尾巴化,互聯網有一個特點是什么?叫贏家通吃,老大、老二能活,老三就必須死。它贏家通吃了以后,把財富完全攫取在它的口袋里,而中產階級只能變成長尾了。


為什么?拉尼爾給頭部那些人取了一個名字,叫塞壬服務器,古希臘神話里面的海妖,唱著動聽的歌,把過往的水手吸引過去后吃掉。他的意思是,那些互聯網的巨頭,給你免費的服務,給你精準的服務,讓你把這個數據給它,它越來越富,你越來越窮。




我們要看看互聯網是不是做錯了什么?


首先一個,互聯網本身網絡是去中心化的。但是數據變得中心化了,這是一個問題。




第二個網絡本身是非常開放和自由的,而且我們可以通過社會化的服務,把我們一些創新的門檻降低。但問題是在這個過程當中,數據使用是不透明的,數據使用缺乏信任,我們能不能去改變這么一個現狀?




首先,法律法規應該先行,也就是說,我怎么能夠利用法律法規來保障我的數據由我做主。第一是數據的擁有權,到底誰真正擁有這個數據。


我們很多數據是我主動給出的數據,擁有權肯定在我。比如說我登錄一個網站,填入了我的私人信息,這個數據的擁有權在我。


還有一些數據是觀察數據,我是被觀察的人,而其他人是觀察的人,那這些數據是屬于觀察的人,還是被觀察的人?


還有一些數據是推理出來的數據,這個數據擁有權屬于誰?如果說我不幸掛了,這個數據擁有權能不能繼承或者轉移?如果兩個人離婚了,那這個數據擁有權怎么分割。


第二點是數據隱私權,什么數據是一定不能給你看的。第三個是數據許可權,在什么時間范圍內、針對什么目的可以許可你使用,但這個許可權是可以撤銷的,可以轉移的,今天在Facebook里面,明天不想在這個里面待了,把數據全部拿出來,轉到騰訊里面去。第四是數據審計權,我能不能去審計你對我數據的使用。


最后一個是數據分紅權,數據有一個外部性,當時我采集的時候,是為了這么一個目的采集的。但未來它可以服務于另外一個目的,反復產生新的價值。對于未來產生新價值的時候,我能不能分紅?


所有這些需求都是需要法律保障的。在中國這些東西還缺位。美國有了Consumer Privacy Bill of Rights,和歐洲有EU Data Protection Directive,但定義的也不完整,這個是需要未來十年去解決的。




這有兩個東西,兩手都要抓的,一個叫做商業模式,另外一個叫做技術,你必須有好的商業模式和新的技術,來去解決數據可控的問題,解決數據在一個信任缺位的世界里面,怎么能夠去產生價值。




商業模式第一個就是要定價,對數據要進行定價。這是金融時報給的一個計算器,我在上面算了一下,我的數據價值0.66美金,當然就是讓你回答了幾十個問題,這幾十個問題價值0.66美金,數據采集者把一千個人的數據打包賣給廣告商,這是一種定價。


另外一個網站可以分析你Facebook里面所有的內容,你的朋友,你發的帖子,你的活動,給你算出來你的數據多少錢?這個還不錯,380美金。


有一家新的初創公司Datacoup,索性就這么說,我每月給你8美金,你把你的Facebook、Twitter、銀行交易的數據給我,我去找廣告主變現去,每個月8美金還不錯。


還有一個哥們就有意思了,把自己的數據放到眾籌網站Kickstarter上面叫賣,籌到了2130多美金。所有這些都是把你的數據進行定價的不同方式。




定價以后就是貨幣化了,怎么把數據變現,這里面列出來了很多公司。


比如說Personal Cloud,你把你的一些數據存在他那邊,以后你登錄不同網站的時候,比如賣車的網站上面,你可以用Personal Cloud的帳號去登錄,一登錄了以后,它根據你的數據,根據你的一些行為,來推薦你喜歡的車的打折信息。


聚信立是反過來,你在它的瀏覽器里面用淘寶登錄,就把你淘寶消費的記錄全抓下來了,然后你也可以用你的移動帳號登錄,你也可以用你的京東帳號登錄,它根據這些消費數據,給你算出來一個信用,你有了這個信用可以申請信用卡,你也可以去P2P借貸去,享受某一個貸款利率。它讓你自己登錄了以后,把你的數據授權給它,它給你的數據帶來價值。


比如說reputation.com,跟蹤你的數據在互聯網上的出現,有時候如果你的數據是負面的,幫你解決。


Hard shake可以根據你的位置實時給你發一些信息問卷,比如你在商場里的時候會收到一份跟特定促銷相關的調研問卷,回答后給你一部分錢。


最下面這兩家公司更好地幫助你利用你的數據,跟數據的使用方做更好的匹配,讓你數據更好的變現。


所有這些公司現在都還很小,但是大家要知道,邊緣創新都是從小公司開始的。大公司一開始是看不見,看不起,看不懂,最后來不及了。


我個人做技術的,在技術上面,我認為有近期、中期、遠期三個路線。




首先近期我非常推崇OPENPDS,MIT做的一個開源系統,始作俑者是彭特蘭,他在湛廬也發過一本書,《智慧社會—社會物理學》,講到了這個OpenPDS。它就是一個數據庫,不同的應用,不同的互聯網服務想要使用你的數據的時候,不能直接拿,只能把一段代碼發給這個數據庫。


比如說這個潘多拉想要你了解個人對音樂的一些偏好,可以發請求到你的數據庫里面,跑一段代碼,它不能把你的原始數據抓出去,跑一段代碼,在數據的聚合層面、統計意義上了解你是什么樣的人,我給你推薦什么樣的音樂。


這個系統的好處是在于,現在每個人的數據都在一起,而不是分布在Facebook、潘多拉各個地方,這樣就不會出現每一個數據擁有方都是數據孤島的問題,它也能夠是不同的互聯網服務更全面地去了解每個人。但同時呢,你又不能掌握我的數據,這是近期一個很好的選擇方案。




中期,我給大家講一個有意思的東西,這跟比特幣有關。我個人并不特別看好比特幣,但是我非常看好它下面這個基礎設施,叫區塊鏈,去中心化的、不需要信任的基礎設施。


現在有很多的用途,我可以用區塊鏈顛覆金融,我能夠發股票,我能夠發債權,做分布式的股權交易,我可以做資產的置換,做smart contract,都用區塊鏈,比現在的方式要好。


但是也有人說區塊鏈可以顛覆通訊,現在通訊都是國家安全局可以監控的,有人在做私密的Twitter,我上面發個帖子,NSA是看不到的。更多的有識之士相信區塊鏈有可能顛覆未來社會運行的方式,顛覆未來整個的基礎設施。


大家可以看這么個技術棧,未來的這個數據層,互聯網數據層有可能就是建筑在這個區塊鏈的基礎上。在上面疊加網絡層、應用層。


現在事實上已經有很多很好的項目,大家感興趣的話,可以去參考一下。ethereum基于去中心化的互聯網進行應用開發的框架。MaidSafe是去中心化的存儲,SAFE指的是Secure Access For Everyone,也是基于區塊鏈。OPEN MUSTARD SEED,還是彭特蘭在MIT做的一個系統,基于硬件的可信計算和區塊鏈2.0。未來個人數據也許就建筑在這些新的基礎設施之上。




遠期我認為未來的萬維網,是Web of Data。現在的Web是web of html網頁,而數據躲在Web服務器后面的數據孤島里,未來數據直接是互聯的,但又是可控的,在一個信任缺位的世界里數據能夠相互發生關系,產生價值。




作為今天演講的總結,在數據時代我們應該采取一種積極的態度經營我們的數據化身份和數據資產,我是數據呈現的我,我做我自己數據的CEO。


原文發布時間為:2017-03-08

本文來自云棲社區合作伙伴“數據派THU”,了解相關信息可以關注“數據派THU”微信公眾號

總結

以上是生活随笔為你收集整理的【干货】吴甘沙:你是数据,我即生意的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。