大数据价值期望探讨
大數據價值期望探討
王崇駿
南京大學軟件新技術國家重點實驗室,江蘇 南京 210023
摘要:各邊利益主體對大數據價值的共同期盼,引發了社會各界對大數據的普遍關注。不同利益主體的自有利益使然,各邊的價值期望是不同的,但這些迥異的價值期望恰恰都是大數據價值實現的目標。嘗試從大數據的多邊定義和理解出發,梳理不同研究視角的相關研究以及不同利益角色的價值期望,介紹了相關研究及產業化現狀,并給出了實踐可行的方法、思路和策略。
關鍵詞:大數據;數據科學;價值期望
doi:10.11959/j.issn.2096-0271.2017045
論文引用格式:王崇駿. 大數據價值期望探討[J]. 大數據, 2017, 3(4): 91-103.
WANG C J. Discussions of the value expectations of big data[J]. Big data research, 2017, 3(4): 91-103.
1? 引言
“大數據”是近年來最為熱門的技術名詞之一,從其誕生之日起,就引起了“政、產、學、研、用”各界的普遍熱議,也獲得了哲學家、科學家、技術研究者、工程研發人員等的普遍關注[1],其原因或許在于各行各業的人們對“大數據價值”都有共同的預判或期待。
由于價值具有較強的主觀性,因而不同利益角色對大數據價值期望并不一樣,這直接導致了在大數據價值實現過程中難以形成統一的建設思維和技術口徑,從而影響大數據項目的價值彰顯。本文對不同的大數據價值期望以及由此引發的對大數據彼此互異的理解進行梳理,嘗試抽象出價值實現過程中必須響應的挑戰和問題,并從已有的參考文獻和工程實踐方面給出一些具體的思路和提示。
2 大數據多邊理解
2.1 大數據溯源
從宇宙大爆炸到地球誕生,再到簡單生命體出現(38億年前),地球上的物種開始不斷地豐富、發展和進化。與其他動物僅通過遺傳進化不同,人類在進化過程中發展和演化出了一種非遺傳性的繼承:通過獨一無二且日益發達的文化媒介(語言、文字以及不同歷史階段的存儲介質),將知識留給后代,這種文化傳統使得人類以很高的速度進化,并最終成為這個星球的統治者。
這里所說的知識指的是人類在改造世界的實踐中獲得的認識和經驗的總結歸納,可以指導解決實踐問題的觀點、經驗、程序等信息。因此發現、傳遞和學習知識是人類文明進程中亙古不變的主題。參考文獻[2]闡述了知識構建和管理的完整過程:從噪音中分揀出數據,轉化為信息,升級為知識,升華為智慧,讓信息從龐大無序到分類有序。
人類對數據的認知經歷了漫長的發展歷史,最早可溯源至“數覺”。所謂數覺,指的是在一個小的集合里,增加或減去一個元素的時候,盡管未曾直接知道元素增減,也能夠辨認到其中有所變化。圖1給出了人類從數覺到大數據的大致脈絡。
圖1?從數覺到大數據
● 人類從最原始的數覺,逐漸形成了數值的概念,然后發明了計數、算術、模擬計算和電子計算,并因為電子計算機的發明和廣泛應用,人類從繁重的腦力勞動中解放出來,推動人類向信息社會邁進。
● 因為人類需求的不斷膨脹以及軟硬件技術的不斷發展,人們的關注點在不斷地演變:從最開始的數值,到后來的數據,再到目前的大數據。人們的理念也在不斷地演變:在數據時代,計算是中心;在大數據時代,數據是中心。
● 從數覺到數據的發展,人類用了億萬年的時間,在這個時間段發明的一系列工具、算法、設備大多是在響應和滿足人類最原始的需求;從數據到大數據的發展,人類僅僅用了50年左右的時間,在這個時間段發明的許多工具、算法、設備一方面是在響應用戶的膨脹需求,另一方面是在響應因為許多新技術的使用而引發的一系列新問題。
2.2 大數據難題
數據是指存儲在某種介質上能夠識別的物理符號(數、字符或者其他)。這個定義暗含著數據獲取、存儲和使用的一般路徑,從計算機的角度來看:
● 數據獲取意味著必須將物理信號轉換成計算機可以存儲的數據,這涉及傳感、采樣、模擬信號/數字信號轉換(A/D轉換)以及在bit基礎上的字節化和數據化;
● 數據存儲意味著將數據存儲在什么介質上以及如何組織和管理這些數據,任何一個數據被記錄、存儲一定有其最原始的價值期望,而一旦原始價值被實現,數據事實就是以一種成本存在;
● 數據使用意味著需要針對某個具體的應用目標,使用計算機相關技術完成問題建模和求解。
圍繞數據獲取、存儲及使用的相關技術涉及的基礎學科的發展,使得數據在規模量級、數據精度(類型)、獲得速度上都得到迅猛的發展。計算機技術的發展尚不能完全匹配基礎學科迅猛發展,應對人類需求不斷膨脹而引發的在數據層、計算層、應用層的難題和挑戰,在這個情境下,大數據作為一個“難題”被提到人們的面前。
大數據的定義可以參見維基百科:所謂大數據,就是大到無法通過現有手段在合理時間內截取、管理、處理并整理成為人類所能解讀的信息。4V(volume、variety、velocity、value)往往是伴隨著類似定義的通常描述,而不同的利益角色又會根據不同視角給予更多的補充,比如精確性(veracity)、可視化(visualization)、有效性(validity)等。事實上,所有這些特征都是嘗試從數據層、計算層和應用層進行大數據特征描述。總體而言,大數據暗含以下3個方面的屬性。
● 規模屬性:大數據在規模量級上無論是相對于以往還是絕對值都很大,數據層的大規模性以及數據本身具備的多模式性、多模態性和異構性給存取、算法、計算和應用帶來了極大的挑戰。
● 技術屬性:大數據的價值實現依賴一系列技術合集,涉及數據層、算法層、計算層、應用開發層等多個方面。
● 價值屬性:各邊角色對大數據價值都有共識和期望,不同利益角色的個體(組織)對大數據的價值理解和關注點不同。
2.3 大數據流程
大數據是數據本身及面向數據價值挖掘的技術集合,能夠實現應用驅動的多邊商業價值,因此,數據、技術、思維是大數據價值實現的3個基本要素,其基本邏輯在于:富集和整合多數據源數據,然后開發數據處理與分析工具集,在此基礎上開發目標應用系統。開展大數據項目建設,自底向上需要從4個方面進行,分別是:數據渠道層、數據基礎實施層、應用基礎實施層和應用層。
(1)數據渠道層
無論價值期望如何,“數據在哪”是擺在每一位大數據項目建設者面前的首要問題,因此數據渠道梳理、建設是大數據項目開展的第一步。總體而言,數據源可能為既有業務系統、第三方業務系統、政府類數據、社會面數據等。雖然每一類數據源都對應著不同的數據獲取協議、方法加以響應,但數據源的梳理和渠道建設往往與技術無關,在更多的情形下往往需要某種商務模式的支撐。值得注意的是,政府類數據的逐步開放為大數據開放共享提供了一個示范之外,事實上也降低了大數據項目建設在大部分公共數據獲取的難度和門檻,特別有助于中小型初創企業的產品研發。
(2)數據基礎實施層
在數據源給定并且商務上已經確認的基礎上,數據基礎實施層的功能目標在于將數據源數據獲取、連接、整合和融合,為潛在的應用提供高性能的數據服務。因此在這個層次上,幾個基本的技術要點在于:情境知識庫的建設、數據采集工具的設計與實現、數據預處理、數據集成、語義融合等。
(3)應用基礎實施層
該層主要為未來的潛在應用開發提供基礎的計算服務,具體而言幾個基本的技術要點在于:通用數據接口、一體化網絡服務、數據分析服務、安全服務等。
(4)應用層
該層次主要面向具體的應用需求定制開發垂直應用系統(平臺),一般而言,該層次需要考慮的問題有:新開發的系統(功能)與原業務系統的關系、如何為創新應用提供服務支撐、如何與第三方有效無縫連接等。
3 大數據研究視角
3.1 哲學層面
從哲學層面理解大數據包括但不限于以下3個方面。
● 從哲學層面研究大數據給人們帶來了什么以及如何理解大數據引發的各類新生事物,往往哲學研究者會關注于此。幾個樸素的問題包括:大數據是什么、大數據從哪里來、大數據到哪里去、大數據的本質是什么、是否真的需要大數據、應該如何擁抱大數據。
● 將大數據作為一種思維方式,如何利用大數據解決一些實際問題,“第四范式”[3,4]就是基于這個視角提出的一個新興概念。
● 作為科學研究的“第四范式”,大數據技術已經成為了科學研究中的一個強大的推動力,目前“科學大數據”已經在地理遙感、高能物理、氣候氣象、藥物化學、社會人文科學等領域得到了廣泛應用[5,6,7];另一方面,在進行大數據項目開發時,利用數據平臺為領域用戶進行領域研究和后評估,是大數據項目落地時必須考慮的隱含需求。
3.2 科學層面
從科學的層面來看,大數據背后隱含著若干關鍵科學問題。
計算機科學關注的是可計算問題,而傳統的計算問題可以歸結為算法問題,即如果此算法非圖靈機可計算,即可判定該問題(計算)無法由計算機處理。而傳統的計算機科學關于計算的研究是專注于計算本身,而不在意數據。或者說傳統的計算是基于“數據完備、不變”的假設。大數據場景下,數據是持續變化和更新的,傳統的計算理論在大數據場景下是否還有效?或者說,在大數據場景下,針對數據海量且不斷增量的事實,這個問題是否可計算?進而,在可計算問題之后還可延伸的若干問題,比如計算可信問題、資源(數據、計算、能源等)管理問題等。
上述這些都是典型的計算機科學問題,在大數據場景下,大家更愿意用數據科學來進行描述[3,8-10]。
3.3 技術層面
在技術層次,大數據項目涉及的技術流程如圖2所示,即:在具體計算環境中,從多個數據源中采集數據,然后匯聚在一起,通過對數據進行處理和分析,為具體的應用提供服務[1,11,12]。
圖2 大數據技術邏輯
下文簡要介紹圖2中涉及的4個技術要點。
(1)數據采集與匯聚
功能上,通過不同的數據獲取協議從不同的數據源中獲得數據,并將這些數據以某種形式進行集成和連接,有以下3個難點。
● 大數據源自數據層的普適“多源、異構、跨時空”的典型特征,使得在數據采集技術層次上必須基于不同的數據協議進行數據的提取和交換。但是在實際情況下,原始系統開發團隊缺位導致的文檔缺失、數據庫封閉使得數據交換協議缺失;另一方面,由于不同的數據往往是存放在不同的利益主體的服務器上,如果沒有持續、匹配的商務合作支撐,數據獲取幾乎不可實現。
● 任何一個數據源數據的存在都有其最原始的價值期望,每一個數據源表示的物理對象并不一致,加之每個數據源的數據建設依托于不同的IT實施思路和建設水平,這都給有效的數據集成帶來了障礙。
● 如何對這些多源、異構、跨時空數據進行有效特征提取、語義理解和融合是重中之重,但也是難題。
(2)數據存儲與管理
從不同數據源采集來的數據以及進行各種預處理后的數據以何種方式存取也是一個在技術選型階段尤其需要考慮的問題。在大數據的應用環境下,隨著持續增長的種類繁多的非結構化的海量數據,傳統的關系型數據庫已經不能滿足更加迥異的數據格式了。非關系數據庫等新興的數據存儲技術應運而生,如基于Hadoop平臺的HBase、Cassandra、MongoDB、Neo4J和Riak等。
在實際應用過程中,數據存儲方案的選型往往需要綜合考慮源自數據層、應用層和實際應用場景及部署實施的條件約束等多種因素。
(3)數據處理與分析
通過對數據進行有效處理和分析,達到為應用目標服務的目的,這里包含3條路徑。
● 在領域知識已經豐富完備的前提下,以邏輯為基礎,利用領域知識對數據進行加工處理,然后直接為應用服務。
● 以機器學習與數據挖掘為基礎,通過對歷史數據進行建模獲得知識,然后利用此知識對數據進行加工處理,然后直接為應用服務。在大數據應用環境下,機器學習與數據挖掘面臨的挑戰在于數據及標簽的動態變化性、專家標注樣本成本過高等,參考文獻[13-21]都是圍繞這些挑戰展開的。
● 將上述基于領域知識和數據驅動的知識發現有效地結合在一起,從而達到雙邊互補,同時更好地為應用服務。以AAAI 2017的最佳論文[22]為例,該論文利用了先前的領域知識,從而將輸出空間約束到一個特定的學習結構,而不是簡單地從輸入到輸出的映射,這種做法使得在進行神經網絡訓練的時候不需要大量有標簽數據,卻能夠學習得到更先進的結構。
(4)計算環境
大數據的復雜性及規模性給大數據分析帶來的挑戰至少有兩點:如何響應數據類型的復雜性給數據的理解、建模帶來的挑戰;如何用更快的計算效率響應數據的海量、并行及快速更新的特性。前者的挑戰需要研發新型的理論、算法、技術,而后者需要所有的算法、技術(改進)必須依賴合適的高性能計算架構,目前用于高性能計算的策略有以下3類。
● 充分提升和挖掘單個計算節點的計算性能,比如通過對計算主機進行中央處理器(central processing unit,CPU)、內存、硬盤等的擴容嘗試,增加單個計算節點的計算性能,顯然,這已不是純粹的技術層次的問題。
● 通過圖形處理器(graphics processing unit,GPU)技術的引入達到大幅提升單臺計算設備的計算性能。相對而言,CPU的靈活性最大,可以高效運行各種計算任務,但局限是一次只能處理相對很少量的任務;GPU不像CPU那樣靈活,處理的任務范圍較小,但其強大之處在于能夠同時執行許多任務。谷歌公司在ISCA 2017 公布的張量處理器(tensor processing unit,TPU)論文代表了谷歌公司為其人工智能服務設計專用硬件邁出的第一步[23]。TPU是專門用于TensorFlow(谷歌公司開源的一個機器學習軟件庫)中執行特性功能的專用集成電路(application specific integrated circuit,ASIC),相對而言幾乎沒有靈活性,但性能極佳。
● 將復雜的任務“分而治之”,引入分布式計算架構以提升計算性能,分布式計算的基本出發點在于通過更多的計算能力不是很強的計算節點,利用某種合適的策略達到整體計算性能的極大提升,利用不同的分布式策略和目標,達到高性能計算的目的。目前主流的分布式計算架構有Hadoop、Spark、Storm等。當前許多工作[24-34]是針對不同的應用場景、不同的數據特點,圍繞計算架構的改良展開相關研究,也有許多工作是在既定的計算架構基礎上進行算法改良研究。以參考文獻[35]為例,作者在Spark平臺上實現了一個可擴展復合優化學習方法——SCOPE,實驗結果表明,其優于Spark上的其他分布式學習方法。
4 大數據價值期望
4.1 作為一種戰略資源
對于政府而言,大數據被認為是提高綜合國力、增強本國競爭力的重要來源,因此,從國家層面出臺各類政策、指南,借此引導企業和組織進行順勢的發展,就成為各國政府角力的法門。
美國政府在2012年3月29日發布全球首個國家層面的大數據戰略,2016年5月23日發布“聯邦大數據研究與開發戰略計劃”,以加速其2012年提出的“大數據研發行動”進程。此外,聯合國的“數據脈動”計劃、英國的“數據權”運動、日本的“面向2020年的ICT綜合戰略”、韓國的大數據中心戰略都是政府從戰略層面進行的國家意志層次的規劃和部署。
我國政府在2014年政府兩會工作報告中就提及大數據計劃,2016年11月29日,國務院印發《關于印發“十三五”國家戰略性新興產業發展規劃的通知》,提出實施大數據戰略。
在各國政府實施大數據戰略的時候,政府數據開放是其中的一個共同行動。美國政府從2009年開始就進行了政府數據開放的行動,并于2010年實施以個人為中心的數據富集、整合和開放服務的“我的大數據計劃”。歐盟在2010年開始提出“歐洲數字化議程”,旨在建立一個統一的“數字市場”,并在2012年制定了大數據戰略,強調了公共數據安全及挖掘公共機構數據的價值潛力。英國是最早推進大數據規劃的歐洲國家,2004年,英國設立了水平掃描中心(horizon scanning center, HSC)項目,以提升政府處理跨部門和多學科挑戰的能力;2011年,HSC項目啟動氣候變化的未來國際影響計劃,通過對多數據源進行深度分析,研究解決氣候變化對食品和水的可獲得性。
2008年5月1日,我國正式施行《中華人民共和國政府信息公開條例》,全面推行政府信息公開。2015年4月22日,國務院辦公廳印發《2015年政府信息公開工作要點》,列出了推進行政權力清單、國有企業、財政資金、社會組織和中介機構、環境保護、食品藥品安全等9個重點領域的信息公開;2015年8月31日,國務院印發《促進大數據發展行動綱要》,明確提出要建立國家大數據,統籌規劃大數據基礎設施建設,為政府治理大數據的建設服務。
優政、惠民、興業是政府數據開放的一個核心價值觀,而如何充分利用政府大數據的開放共享是值得產業界和工業界關注的一個課題。
4.2 作為一種競爭資本
社會各界對大數據都抱以極大的熱情,認為引入大數據能夠提高自身的競爭力。人們會有這樣價值期望的一個基本動機在于:人們認為通過大數據處理與分析能夠洞悉客戶、友商、產品、渠道在各個維度的信息情報和知識洞見,借此為創新應用模式及商業模式的設計提供研判線索和技術基礎。以芝麻信用為例,其從身份特質、行為偏好、人脈關系、信用歷史、履約能力等多個角度對一個自然人的相關數據進行搜集和匯聚,在此基礎上對個人進行信用研判,根據信用評級就可以進一步進行信用騎行、便利交通、基礎通信、信用借還、信用回收等一系列產品的設計和運維。
因此,如何在多源數據匯聚的基礎上實現對實體(客戶、友商、產品、渠道等)的精準畫像,為潛在應用提供多層面的實體語義服務就是重中之重,其中涉及的技術要點主要有以下幾方面。
(1)數據連接及實體結構化
由于大數據匯聚的數據源數據都是建立在不同IT建設思路、不同的數據原始價值期望,以“煙囪式”軟件開發方式生成并存儲的,因此如何將這種格式、表示均異構的數據以實體為中心連接起來,最終形成以實體為中心的數據表示是實體畫像的基礎。涉及的相關技術包括:數據結構化、數據預處理、去重、歧義消解、實體及實體關系抽取(針對非結構化數據)等。
(2)實體特征化及語義化
在以實體為中心的數據匯聚的基礎上,以實體為中心,針對不同視角和采集渠道的數據進行特征提取,并在此基礎上實現標簽化提取,從而最終達到實體特征表示和實體語義標簽化的目的(該標簽可作為后續進一步應用或者分析的特征表示)。由于數據的類型不一樣,因此特征表示和提取的方式也不一樣。另一方面,語義標簽的提取往往是通過監督學習完成,這意味著需要通過人機交互配置訓練集,而出于不同的商業目標或者源自領域專家的主觀性,這些語義標簽是動態變化的,如何動態維護標簽池以及如何響應標簽的動態變化也是大數據應用的一個挑戰。
(3)應用場景的挖掘
“場景”指的是在某時(when)、某地(where)、周圍出現了某物(with what)時,特定類型的用戶(who)萌發了某種欲望(desire),會想到通過某種手段(method)來滿足欲望。因而應用場景挖掘最終歸結為“用戶是誰(who)”“需求在哪(desire and method)”“應用情境是什么(when,where and with what)”,幾個可能的實現途徑有:從利益角色的職能定位、可用性需求、用戶體驗需求角度出發,研判以用戶為中心的“痛點”和利益增長點;從既有業務功能、任務或者功能驅動的角度出發,研判以既有業務為中心的可拓展功能和新增功能;從數據本身出發,通過對數據表示的實體內涵以及從該數據中發現的實體關系等找出相應的應用場景,往往是數據、思維和想象力驅動的。
為了實現大數據價值,政(見第4.1節)、產(面向大數據應用及產品開發提供各類服務的產業)、學、研各邊也都從各自的角度開展了相應行動,同時提高自己的競爭優勢。
(1)產業界
在大數據產業鏈中,逐漸形成了3種典型的公司形態 [36,37]:數據型公司,如Kaggle、LinkedIn、Twitter、Facebook等;技術型公司,如Amazon、Microsoft、Apple、Intel、Oracle等;思維型公司,如DeepMind、Salesforce、Tableau、SAS等。在兩化融合戰略的引領下,中國企業本身也自發形成了利用大數據改良既有生產、制造、商務流程的新動力。
(2)學術界
作為關鍵技術預研的擔當,學術界圍繞大數據涉及的各類科學理論和關鍵技術展開研究,積淀形成越來越豐富的科研成果,為大數據應用提供了堅實的理論技術支撐。特別值得一提的是,基于開源精神的開源社區在大數據環境下得到極大的發展,這進一步促進了大數據技術發展的同時,也大范圍降低了大數據應用的門檻。開源使新項目直接使用大數據技術成為可能,包括Spark、Apache NiFi、Kafka等在內的開源大數據技術為大數據應用提供了極大的便利。大數據方面的開源工具主要分為4個方面:數據存儲(如HBase)、開發平臺(如Hadoop)、開發工具和集成(如Apache Mahout)以及分析和報告工具(如Talend)等[38-43]。
(3)教育界
從人才培養的角度而言,為社會培養大數據人才,并借此提高影響力也成為教育界關注的事,體現在兩個方面:一是出現了越來越多的大數據技術培訓班;二是教育部從發展戰略角度,也有意部署大數據專業建設戰略,比如教育部于2015年、2016年分兩批批復包括北京大學、中國人民大學等35所大學建設“數據科學與大數據技術專業”。
4.3 作為一種商品形式
作為一種商品,數據可以買賣,可以增值,這也是大數據時代的一個基本特征。
國外數據交易大致開始于2008年,一些前瞻性的企業開始加大對數據業務的投入,初見端倪的數據應用新業態包括“數據市場”“數據銀行”“數據交易公約”等,知名數據服務商有Microsoft數據市場、Amazon公共數據集、Oracle在線數據交易等。國內數據交易起步于2010年左右,2015年9月,我國發布的《促進大數據發展行動綱要》中明確提出要引導培育大數據交易市場,開展面向應用的數據交易市場試點,探索開展大數據衍生產品交易,建立健全數據資源交易機制和定價機制。
參考文獻[44]綜述了我國數據交易的發展歷史,并將我國目前的數據交易歸納為如下4種主要形式。
● 基于大數據交易所的大數據交易:如貴陽大數據交易所、長江大數據交易所、武漢東湖大數據交易平臺、上海數據交易中心等。
● 基于行業特定領域數據的大數據交易:針對具體的行業,數據標準較易實現數據的統一采集、統一評估、統一管理、統一交易,從而實現特定行業數據的交易。
● 數據資源企業推動的大數據交易,如數據堂、美林數據、愛數據等。
● 互聯網企業“派生”出的大數據交易。
作為一個新生事物,許多來自應用層的基本問題也需要考慮,比如:數據交易的賣方是數據的擁有方還是純粹的交易平臺、賣的是原始數據還是加工過后的數據、買家是個人(組織)還是機器、交易目標是社會福利最大化還是數據擁有方或者平臺利潤最大化、是封閉拍賣還是開放拍賣。
另一方面,數據交易顯然還需在若干法律、技術及管理都匹配的情況下才能得以實現。法律方面需要考慮的是:哪些數據可以買賣、數據的所有權和使用權歸屬誰、是否所有人(組織)都具有買賣資格。在監管方面:數據交易秩序如何監管、數據質量如何保障、定價機制如何形成以及如何監管、交易監管的目標是什么。而在技術層次需要考慮的問題更多,比如:數據質量評估、定價機制設計、交易機制設計、交易行為分析、程序化交易如何實現等。
作為一種技術響應,若干既有工作或許可以作為大數據交易的有益參考。
● 大數據交易的交付物“數據”本身是一個典型的數字產品,因此參考文獻[45,46,47]探討的關于“數字產品拍賣中如何收益最大化”的研究成果和思路,對于大數據交易具有極大參考價值。
● 大數據交易往往在線實時進行,即買家隨時可能到來,因此參考文獻[48-51]關于在線機制設計的研究成果和思路對于大數據交易也具有極大的參考價值。
● 如何在拍賣中實現收入最大化,這在機制設計領域是一個重要的開放問題,也是目前最為活躍的一個研究領域,參考文獻[52,53]對于以拍賣方式進行大數據交易而言,具有重要的參考價值。
● 其他方面:大數據交易中很可能會出現異常或者惡意擾亂市場的行為,這意味著在線和實時的自動偵測與預警是大數據交易監管中的一個重要課題,參考文獻[54,55]對于數據交易中的異常偵測有較大參考價值;在數據交易的產權方面,可能會遇到產權不明、授權復雜、定價困難、交易缺乏透明性、隱私泄露等問題,參考文獻[56,57]或許可以作為有益參考。
5? 結束語
“value”是大數據的一個重要特征,或許也正是因為“有價值”,才引發了“政、產、學、研、用”各界對大數據的普遍關注。
不同利益主體迥異的價值期望都是大數據價值實現的目標。這意味著,在大數據項目建設中,必須通過具體的策略、思路和方法確保這些價值期望的實現。事實上,一個成熟的大數據應用必然涉及理論研究、技術研發、產品開發、部署運維等多邊的合作與協作,這其實也暗含大數據價值的最大體現:推進多邊資源的融合,并刺激集體智慧的涌現。
本文嘗試從大數據的多邊定義和理解出發,針對不同的價值期望,從戰略資源、競爭資本和商品形式3個角度介紹了實踐可行的系列方法、思路和策略。應當看到,本文提及的具體思路和策略僅針對整個大數據部署、實施的普適性特點展開敘述。這意味著,針對特定的領域細分應用,也有其獨特的價值實現路徑特點,需要在具體的應用進程中加以把握和關注。
點擊下方?閱讀原文?即可獲取全文
作 者 簡 介
王崇駿(1975-),男,博士,南京大學計算機科學與技術系及軟件新技術國家重點實驗室教授、博士生導師,主要研究方向為自主Agent及多Agent系統、復雜網絡理論及應用、大數據分析及智能系統。截至2016年底,主持和參與包括“973”項目、國家發展和改革委員會專項、工業和信息化部產業化基金、國家自然科學基金、國家社會科學基金、省自然科學基金及支撐計劃在內的國家及省部級基金與企事業資助項目50余項。在教育醫療類惠民行業、優政興業類政府領域、互聯網新經濟領域有30余項科研成果獲得產品化和商品化推廣。
《大數據》期刊
《大數據(Big?Data?Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的科技期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
- 上一篇: JZ2440学习总结2
- 下一篇: JZ2440学习总结3