生信基础(三)——统计分析工具R语言
原創(chuàng): hxj7
關(guān)鍵詞:R; 統(tǒng)計(jì); 美圖
作為一個(gè)生信er,光會(huì)處理文本數(shù)據(jù)是不夠的,還要能進(jìn)行統(tǒng)計(jì)分析。作為一個(gè)開源軟件,R在統(tǒng)計(jì)社區(qū)“大行其道”,在生信分析人員中更是“一家獨(dú)大”。為啥?因?yàn)镽語(yǔ)言就是一群統(tǒng)計(jì)學(xué)家開發(fā)的,統(tǒng)計(jì)函數(shù)齊全,新的統(tǒng)計(jì)方法很快就會(huì)有相應(yīng)的包被開發(fā)出來(lái)。復(fù)雜的統(tǒng)計(jì)分析往往兩三行代碼就可以完成,那個(gè)方便呦,誰(shuí)用誰(shuí)知道!
(不過(guò),也有許多學(xué)計(jì)算機(jī)專業(yè)出身的同學(xué)很不喜歡R,各種不順眼…。比如,R的數(shù)組下標(biāo)是從1開始的,而諸如C、Python等語(yǔ)言都是從0開始,光這一點(diǎn)就讓他們抓狂。他們迫不及待地就去擁抱numpy、pandas了!)
圖1:lm函數(shù)進(jìn)行線形回歸分析,一行代碼即可實(shí)現(xiàn)
那如何學(xué)習(xí)R呢?方法很多,我個(gè)人是看著《R語(yǔ)言實(shí)戰(zhàn)》這本書自學(xué)的。相信很多生信人都知道它,誠(chéng)如作者在書中說(shuō),當(dāng)時(shí)國(guó)內(nèi)R語(yǔ)言的資料很少,許多想學(xué)習(xí)R語(yǔ)言的人都備受煎熬。以至于這本書一問(wèn)世,便廣受好評(píng)(像不像做廣告的~)
圖2:《R語(yǔ)言實(shí)戰(zhàn) 第二版》
上面講了那么多,還有一點(diǎn)不得不提。其實(shí)R為眾多行業(yè)的人廣泛接受,不止因?yàn)樗鼜?qiáng)大而便捷的統(tǒng)計(jì)分析功能,還因?yàn)橛肦可以輕松畫出專業(yè)而精美的圖片(外貌協(xié)會(huì)的人有福了)。我認(rèn)識(shí)的一些學(xué)經(jīng)濟(jì)、金融的同學(xué)都是R的高手,據(jù)他們說(shuō),商業(yè)報(bào)表中的很多精美圖片都是用R做出來(lái)的。另外,正如黃小仙童鞋《我是如何“被逼無(wú)奈”開始學(xué)R的》一文中所展示的那樣,生物學(xué)文獻(xiàn)中統(tǒng)計(jì)結(jié)果的圖大部分都是用R畫出來(lái)的。R,就是集美貌與才華于一身的翩翩少年!
圖3:R可以輕松畫出基因表達(dá)的箱線圖
至此,“生信基礎(chǔ)”系列就告一段落了。簡(jiǎn)單來(lái)說(shuō),生信人員常用的三種語(yǔ)言Shell、Python/Perl、R最好都能熟練掌握。無(wú)論以后的工作內(nèi)容/研究方向是什么,這三種語(yǔ)言都是基礎(chǔ)。比如,現(xiàn)在很火的機(jī)器學(xué)習(xí),其在生信領(lǐng)域也是應(yīng)用廣泛。不同于很多計(jì)算機(jī)專業(yè)的人選擇用Python/C++來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法,你會(huì)發(fā)現(xiàn)生信人更多地用R來(lái)進(jìn)行機(jī)器學(xué)習(xí)算法分析。如果你已經(jīng)掌握了Python或者R,那么入門機(jī)器學(xué)習(xí)的時(shí)候在編程語(yǔ)言這一關(guān)你會(huì)少了很多阻礙。
下一篇我會(huì)分享一下生信工作中會(huì)遇到的一些瑣碎但又很重要的事情。咱們下期再見!
公眾號(hào):生信了
總結(jié)
以上是生活随笔為你收集整理的生信基础(三)——统计分析工具R语言的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 搭建.NET CORE MVC + EF
- 下一篇: 日语翻译的小技巧