大数据在基因检测行业作用重要吗?基因检测的哪个环节需要大数据的数据库?
生活随笔
收集整理的這篇文章主要介紹了
大数据在基因检测行业作用重要吗?基因检测的哪个环节需要大数据的数据库?
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
未病基因檢測(cè)(疾病風(fēng)險(xiǎn)評(píng)估):尚屬非常初期階段,需要未來(lái)研究支持及大數(shù)據(jù)支撐。未病基因檢測(cè)是指通過(guò)對(duì)人體進(jìn)行基因測(cè)序,結(jié)合一些已知的疾病和基因之間的關(guān)聯(lián)數(shù)據(jù),“推測(cè)”出該個(gè)體患某種疾病的概率。基于與基因檢測(cè)靶向藥物相同的原因,以及我們所知的疾病是外界環(huán)境和內(nèi)在基因共同作用的結(jié)果,未病基因檢測(cè)(疾病風(fēng)險(xiǎn)評(píng)估)尚屬非常初期階段。
目前基因檢測(cè)手段很成熟,很多實(shí)驗(yàn)室都能實(shí)現(xiàn),然而檢測(cè)結(jié)果的解讀卻非常困難,因?yàn)檫@依賴于基于大數(shù)據(jù)上的數(shù)據(jù)庫(kù)。比如,Myriad最值得驕傲的就是擁有專有數(shù)據(jù)庫(kù),它用來(lái)解釋不確定的遺傳檢測(cè)結(jié)果。如果其他公司不被允許在BRCA基因測(cè)試中使用Myriad的私有數(shù)據(jù)庫(kù),這道屏障和戰(zhàn)略優(yōu)勢(shì)將非常顯著。當(dāng)然,隨著時(shí)間的推移這種優(yōu)勢(shì)會(huì)慢慢減弱,但是無(wú)論如何,這從側(cè)面說(shuō)明了數(shù)據(jù)庫(kù)在基因檢測(cè)中的核心作用。一些主做基因檢測(cè)試劑盒的跨國(guó)公司的轉(zhuǎn)型的事實(shí)非常有說(shuō)服力,據(jù)悉它們已經(jīng)開(kāi)始把未來(lái)的業(yè)務(wù)重點(diǎn)放在了基因信息學(xué)之上,雖然短時(shí)期內(nèi)還未能帶來(lái)任何利潤(rùn),但已經(jīng)成為“行業(yè)進(jìn)化”中的必須環(huán)節(jié)。臨床驗(yàn)證是在需要大量的時(shí)間和金錢花費(fèi),而更廣泛的驗(yàn)證才能構(gòu)建真正的數(shù)據(jù)庫(kù),因?yàn)檫@些新設(shè)備和新技術(shù)變得更便宜和可用。但如何將轉(zhuǎn)化為生物或臨床結(jié)果還是很難。而且,很多國(guó)家的醫(yī)院醫(yī)生并沒(méi)有更多的遺傳性和信息學(xué)知識(shí),對(duì)遺傳密碼更是一無(wú)所知。
說(shuō)一說(shuō)基因測(cè)序里的大數(shù)據(jù)分析吧。目前的主流測(cè)序方法是二代測(cè)序。而二代測(cè)序方式會(huì)產(chǎn)生大量的數(shù)據(jù)(測(cè)一段DNA會(huì)產(chǎn)生幾十幾百G的數(shù)據(jù)吧),而由于測(cè)出來(lái)的數(shù)據(jù)是基因片段數(shù)據(jù),還需要用算法進(jìn)行數(shù)據(jù)拼接等工作。所以需要的計(jì)算量還是挺大的。而且現(xiàn)在測(cè)序儀器越來(lái)越好,產(chǎn)生的數(shù)據(jù)量越來(lái)越多,所以需要計(jì)算的東西就更多了。因此,現(xiàn)在測(cè)序領(lǐng)域的算法設(shè)計(jì)是很重要的。設(shè)計(jì)一個(gè)高效的算法,可以把計(jì)算時(shí)間大大減少。至于大數(shù)據(jù)的數(shù)據(jù)庫(kù)(例如Hadoop、Hbase之類的工具),跟所謂的基因數(shù)據(jù)庫(kù)并不是同一個(gè)層面的東西。大數(shù)據(jù)的數(shù)據(jù)庫(kù)是為了存放和處理大量數(shù)據(jù)的軟件,而基因數(shù)據(jù)庫(kù),例如NCBI,則是一個(gè)應(yīng)用,直接負(fù)責(zé)收集和提供數(shù)據(jù)了。
目前基因檢測(cè)手段很成熟,很多實(shí)驗(yàn)室都能實(shí)現(xiàn),然而檢測(cè)結(jié)果的解讀卻非常困難,因?yàn)檫@依賴于基于大數(shù)據(jù)上的數(shù)據(jù)庫(kù)。比如,Myriad最值得驕傲的就是擁有專有數(shù)據(jù)庫(kù),它用來(lái)解釋不確定的遺傳檢測(cè)結(jié)果。如果其他公司不被允許在BRCA基因測(cè)試中使用Myriad的私有數(shù)據(jù)庫(kù),這道屏障和戰(zhàn)略優(yōu)勢(shì)將非常顯著。當(dāng)然,隨著時(shí)間的推移這種優(yōu)勢(shì)會(huì)慢慢減弱,但是無(wú)論如何,這從側(cè)面說(shuō)明了數(shù)據(jù)庫(kù)在基因檢測(cè)中的核心作用。一些主做基因檢測(cè)試劑盒的跨國(guó)公司的轉(zhuǎn)型的事實(shí)非常有說(shuō)服力,據(jù)悉它們已經(jīng)開(kāi)始把未來(lái)的業(yè)務(wù)重點(diǎn)放在了基因信息學(xué)之上,雖然短時(shí)期內(nèi)還未能帶來(lái)任何利潤(rùn),但已經(jīng)成為“行業(yè)進(jìn)化”中的必須環(huán)節(jié)。臨床驗(yàn)證是在需要大量的時(shí)間和金錢花費(fèi),而更廣泛的驗(yàn)證才能構(gòu)建真正的數(shù)據(jù)庫(kù),因?yàn)檫@些新設(shè)備和新技術(shù)變得更便宜和可用。但如何將轉(zhuǎn)化為生物或臨床結(jié)果還是很難。而且,很多國(guó)家的醫(yī)院醫(yī)生并沒(méi)有更多的遺傳性和信息學(xué)知識(shí),對(duì)遺傳密碼更是一無(wú)所知。
說(shuō)一說(shuō)基因測(cè)序里的大數(shù)據(jù)分析吧。目前的主流測(cè)序方法是二代測(cè)序。而二代測(cè)序方式會(huì)產(chǎn)生大量的數(shù)據(jù)(測(cè)一段DNA會(huì)產(chǎn)生幾十幾百G的數(shù)據(jù)吧),而由于測(cè)出來(lái)的數(shù)據(jù)是基因片段數(shù)據(jù),還需要用算法進(jìn)行數(shù)據(jù)拼接等工作。所以需要的計(jì)算量還是挺大的。而且現(xiàn)在測(cè)序儀器越來(lái)越好,產(chǎn)生的數(shù)據(jù)量越來(lái)越多,所以需要計(jì)算的東西就更多了。因此,現(xiàn)在測(cè)序領(lǐng)域的算法設(shè)計(jì)是很重要的。設(shè)計(jì)一個(gè)高效的算法,可以把計(jì)算時(shí)間大大減少。至于大數(shù)據(jù)的數(shù)據(jù)庫(kù)(例如Hadoop、Hbase之類的工具),跟所謂的基因數(shù)據(jù)庫(kù)并不是同一個(gè)層面的東西。大數(shù)據(jù)的數(shù)據(jù)庫(kù)是為了存放和處理大量數(shù)據(jù)的軟件,而基因數(shù)據(jù)庫(kù),例如NCBI,則是一個(gè)應(yīng)用,直接負(fù)責(zé)收集和提供數(shù)據(jù)了。
總結(jié)
以上是生活随笔為你收集整理的大数据在基因检测行业作用重要吗?基因检测的哪个环节需要大数据的数据库?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 张腾岳晒火龙果“修仙”视频:夜晚要用补光
- 下一篇: 求一个微信网名带安字的网名