什么是“大数据”?大数据与我们目前所做的科学研究有什么关系呢?
生活随笔
收集整理的這篇文章主要介紹了
什么是“大数据”?大数据与我们目前所做的科学研究有什么关系呢?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
大數據并非一個確切的概念,這個概念一方面指數據體量巨大,超出一般電腦所處理數據量幾個級別;另一方面也指處理的數據類型多樣化,遠遠超出傳統數據格式和分析工具能處理的范疇。也有觀點指大數據是指不用抽樣方法得到的數據。與實驗科學、理論分析和計算機模擬這三種經典科研范式相比,大數據科學將成為一種全新的科研范式。數據無處不在,麥肯錫全球研究院預測,到2020年,全球數據使用量預計相對于2011年將暴增44倍,達到35ZB。具體而言,數字信息從各種各樣的傳感器、測試儀器、模擬實驗室、文化娛樂企業和個人使用的數字終端中源源不斷地涌出。報告稱,超過傳統數據庫系統處理能力的海量數據即大數據隱含巨大價值,以網絡數據為例,報告稱,網絡數據之間的相互關系其實是人與人的相互關系。?然而,這其中許多數據缺失、重復或是沒有價值。對科學家而言,未來的主要任務不是獲取越來越多的數據,而是進行數據的去冗分類,去粗取精,從數據中挖掘知識。報告稱,幾百年來,科學研究一直在做“從薄到厚”的事情,把“小數據”變成“大數據”,而現在要做的事情是“從厚到薄”,要把“大數據”變成“小數據”。生命健康大數據與醫藥健康產業發展有著重大的關系,有興趣的可以參考華大基因董事長汪建在“生態文明貴陽國際論壇2014年年會”分論壇所作的題為《大數據與醫藥健康產業智“惠”發展》的講座,分別從跨組學大數據,控制出生缺陷,減少腫瘤、心腦血管病發生率及死亡率等幾個方面深入淺出地闡述了生命健康大數據與醫藥健康產業發展的關系。
個人覺得,從科研的角度來看的話,與大數據關聯性比較大的學科應該要書生物信息學了。 生物信息學時計算機科學在生物研究領域的體現。生信的數據量會隨著測序物種的持續增加以及測序費用的逐步降低而增大,在生物學研究方面,該數據量主要包含兩方面的內容,一是基因組數據,大的幾百兆;另外就是后基因組數據了,包括對基因組數據的組裝與注釋而產生的大量數據。
個人覺得,從科研的角度來看的話,與大數據關聯性比較大的學科應該要書生物信息學了。 生物信息學時計算機科學在生物研究領域的體現。生信的數據量會隨著測序物種的持續增加以及測序費用的逐步降低而增大,在生物學研究方面,該數據量主要包含兩方面的內容,一是基因組數據,大的幾百兆;另外就是后基因組數據了,包括對基因組數據的組裝與注釋而產生的大量數據。
總結
以上是生活随笔為你收集整理的什么是“大数据”?大数据与我们目前所做的科学研究有什么关系呢?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 科创板上市前五日规则
- 下一篇: 微信个性签名直接显示