日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

Python与R的区别和联系

發(fā)布時(shí)間:2025/3/15 python 12 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Python与R的区别和联系 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

轉(zhuǎn)自:http://bbs.pinggu.org/thread-3078817-1-1.html

? ? ? 有人說Python和R的區(qū)別是顯而易見的,因?yàn)镽是針對(duì)統(tǒng)計(jì)的,python是給程序員設(shè)計(jì)的,其實(shí)這話對(duì)Python多多少少有些不公平。2012年的時(shí)候我們說R是學(xué)術(shù)界的主流,但是現(xiàn)在Python正在慢慢取代R在學(xué)術(shù)界的地位。不知道是不是因?yàn)榇髷?shù)據(jù)時(shí)代的到來。

? ?? ? Python與R相比速度要快。Python可以直接處理上G的數(shù)據(jù);R不行,R分析數(shù)據(jù)時(shí)需要先通過數(shù)據(jù)庫把大數(shù)據(jù)轉(zhuǎn)化為小數(shù)據(jù)(通過groupby)才能交給R做分析,因此R不可能直接分析行為詳單,只能分析統(tǒng)計(jì)結(jié)果。所以有人說:Python=R+SQL/Hive,并不是沒有道理的。

? ?? ? Python的一個(gè)最明顯的優(yōu)勢在于其膠水語言的特性,很多書里也都會(huì)提到這一點(diǎn),一些底層用C寫的算法封裝在Python包里后性能非常高效(Python的數(shù)據(jù)挖掘包Orange canve 中的決策樹分析50萬用戶10秒出結(jié)果,用R幾個(gè)小時(shí)也出不來,8G內(nèi)存全部占滿)。但是,凡事都不絕對(duì),如果R矢量化編程做得好的話(有點(diǎn)小難度),會(huì)使R的速度和程序的長度都有顯著性提升。

? ?? ?R的優(yōu)勢在于有包羅萬象的統(tǒng)計(jì)函數(shù)可以調(diào)用,特別是在時(shí)間序列分析方面,無論是經(jīng)典還是前沿的方法都有相應(yīng)的包直接使用。
? ?? ?相比之下,Python之前在這方面貧乏不少。但是,現(xiàn)在Python有了pandas。pandas提供了一組標(biāo)準(zhǔn)的時(shí)間序列處理工具和數(shù)據(jù)算法。因此,你可以高效處理非常大的時(shí)間序列,輕松地進(jìn)行切片/切塊、聚合、對(duì)定期/不定期的時(shí)間序列進(jìn)行重采樣等。可能你已經(jīng)猜到了,這些工具中大部分都對(duì)金融和經(jīng)濟(jì)數(shù)據(jù)尤為有用,但你當(dāng)然也可以用它們來分析服務(wù)器日志數(shù)據(jù)。于是,近年來,由于Python有不斷改良的庫(主要是pandas),使其成為數(shù)據(jù)處理任務(wù)的一大替代方案。

? ?? ?做過幾個(gè)實(shí)驗(yàn):
1. 用python實(shí)現(xiàn)了一個(gè)統(tǒng)計(jì)方法,其中用到了ctypes,multiprocess。
之后一個(gè)項(xiàng)目要做方法比較,又用回R,發(fā)現(xiàn)一些bioconductor上的包已經(jīng)默認(rèn)用parallel了。(但那個(gè)包還是很慢,一下子把所有線程都用掉了,導(dǎo)致整個(gè)電腦使用不能,看網(wǎng)頁非常卡~)
2. 用python pandas做了一些數(shù)據(jù)整理工作,類似數(shù)據(jù)庫,兩三個(gè)表來回查、匹配。感覺還是很方便的。雖然這些工作R也能做,但估計(jì)會(huì)慢點(diǎn),畢竟幾十萬行的條目了。
3. 用python matplotlib畫圖。pyplot作圖的方式和R差異很大,R是一條命令畫點(diǎn)東西,pylot是準(zhǔn)備好了以后一起出來。pyplot的顏色選擇有點(diǎn)尷尬,默認(rèn)顏色比較少,之后可用html的顏色,但是名字太長了~。pyplot 的legend比R 好用多了,算是半自動(dòng)化了。pyplot畫出來后可以自由拉升縮放,然后再保存為圖片,這點(diǎn)比R好用。

? ?? ?總的來說Python是一套比較平衡的語言,各方面都可以,無論是對(duì)其他語言的調(diào)用,和數(shù)據(jù)源的連接、讀取,對(duì)系統(tǒng)的操作,還是正則表達(dá)和文字處理,Python都有著明顯優(yōu)勢。? ?而R是在統(tǒng)計(jì)方面比較突出。但是數(shù)據(jù)分析其實(shí)不僅僅是統(tǒng)計(jì),前期的數(shù)據(jù)收集,數(shù)據(jù)處理,數(shù)據(jù)抽樣,數(shù)據(jù)聚類,以及比較復(fù)雜的數(shù)據(jù)挖掘算法,數(shù)據(jù)建模等等這些任務(wù),只要是100M以上的數(shù)據(jù),R都很難勝任,但是Python卻基本勝任。

? ?? ?結(jié)合其在通用編程方面的強(qiáng)大實(shí)力,我們完全可以只使用Python這一種語言去構(gòu)建以數(shù)據(jù)為中心的應(yīng)用程序。
? ?? ?但世上本沒有最好的軟件或程序,也鮮有人能把單一語言挖掘運(yùn)用到極致。尤其是很多人早先學(xué)了R,現(xiàn)在完全不用又舍不得,所以對(duì)于想要學(xué)以致用的人來說,如果能把R和Python相結(jié)合,就更好不過了,很早看過一篇文章——讓R與Python共舞,咱們壇子里有原帖,就不多說了,看完會(huì)有更多啟發(fā)。

BTW:?如果之前沒有學(xué)過R,可以先學(xué)Python然后決定是不是學(xué)R,如果學(xué)了R,學(xué)Python的時(shí)候會(huì)更快上手。

轉(zhuǎn)載于:https://www.cnblogs.com/KevinJasmine/p/6477383.html

總結(jié)

以上是生活随笔為你收集整理的Python与R的区别和联系的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。