python输入一个数组输出24进制式的时间_4.4 用于数组的文件输入输出 线性代数...
Numpy能夠讀寫(xiě)磁盤(pán)上的文本數(shù)據(jù)或二進(jìn)制數(shù)據(jù)。這一小節(jié)只討論Numpy的內(nèi)置二進(jìn)制格式,因?yàn)楦嗟挠脩?hù)會(huì)使用pandas或其它工具加載文本或表格數(shù)據(jù)(見(jiàn)第6章)。
np.save和np.load是讀寫(xiě)磁盤(pán)數(shù)組數(shù)據(jù)的兩個(gè)主要函數(shù)。默認(rèn)情況下,數(shù)組是以未壓縮的原始二進(jìn)制格式保存在擴(kuò)展名為.npy的文件中的:
In [213]: arr = np.arange(10)
In [214]: np.save('some_array', arr)
如果文件路徑末尾沒(méi)有擴(kuò)展名.npy,則該擴(kuò)展名會(huì)被自動(dòng)加上。然后就可以通過(guò)np.load讀取磁盤(pán)上的數(shù)組:
In [215]: np.load('some_array.npy')
Out[215]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
通過(guò)np.savez可以將多個(gè)數(shù)組保存到一個(gè)未壓縮文件中,將數(shù)組以關(guān)鍵字參數(shù)的形式傳入即可:
In [216]: np.savez('array_archive.npz', a=arr, b=arr)
加載.npz文件時(shí),你會(huì)得到一個(gè)類(lèi)似字典的對(duì)象,該對(duì)象會(huì)對(duì)各個(gè)數(shù)組進(jìn)行延遲加載:
In [217]: arch = np.load('array_archive.npz')
In [218]: arch['b']
Out[218]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
如果要將數(shù)據(jù)壓縮,可以使用numpy.savez_compressed:
In [219]: np.savez_compressed('arrays_compressed.npz', a=arr, b=arr)
線性代數(shù)
線性代數(shù)(如矩陣乘法、矩陣分解、行列以及其他方陣數(shù)學(xué)等)是任何數(shù)組庫(kù)的重要組成部分。不像某些語(yǔ)言(如matlab),通過(guò)*對(duì)兩個(gè)二維數(shù)組相乘得到的是一個(gè)元素級(jí)的積,而不是一個(gè)矩陣點(diǎn)積。因此,Numpy提供了一個(gè)用于矩陣乘法的dot函數(shù)(既是一個(gè)數(shù)組方法也是numpy命名空間的一個(gè)函數(shù)):
In [223]: x = np.array([[1., 2., 3.], [4., 5., 6.]])
In [224]: y = np.array([[6., 23.], [-1, 7], [8, 9]])
In [225]: x
Out[225]:
array([[ 1., 2., 3.],
[ 4., 5., 6.]])
In [226]: y
Out[226]:
array([[ 6., 23.],
[ -1., 7.],
[ 8., 9.]])
In [227]: x.dot(y)
Out[227]:
array([[ 28., 64.],
[ 67., 181.]])
x.dot(y)等價(jià)于np.dot(x, y)
In [228]: np.dot(x, y)
Out[228]:
array([[ 28., 64.],
[ 67., 181.]])
一個(gè)二維數(shù)組跟一個(gè)大小合適的一維數(shù)組的矩陣點(diǎn)積運(yùn)算之后將會(huì)得到一個(gè)一維數(shù)組:
In [229]: np.dot(x, np.ones(3))
Out[229]: array([ 6., 15.])
@符也可以用來(lái)用作運(yùn)算符,進(jìn)行矩陣乘法:
In [230]: x @ np.ones(3)
Out[230]: array([ 6., 15.])
numpy.linalg中有一組標(biāo)準(zhǔn)的矩陣分解運(yùn)算以及諸如求逆和行列式之類(lèi)的東西。它們跟matlab和R等語(yǔ)言所使用的是相同的行業(yè)標(biāo)準(zhǔn)線性代數(shù)庫(kù),如BLAS、LAPACK、Intel MKL(Math Kernel Library,可能有,取決于你的NumPy版本)等:
In [231]: from numpy.linalg import inv, qr
In [232]: X = np.random.randn(5, 5)
In [233]: mat = X.T.dot(X)
In [234]: inv(mat)
Out[234]:
array([[ 933.1189, 871.8258, -1417.6902, -1460.4005, 1782.1391],
[ 871.8258, 815.3929, -1325.9965, -1365.9242, 1666.9347],
[-1417.6902, -1325.9965, 2158.4424, 2222.0191, -2711.6822],
[-1460.4005, -1365.9242, 2222.0191, 2289.0575, -2793.422 ],
[ 1782.1391, 1666.9347, -2711.6822, -2793.422 , 3409.5128]])
In [235]: mat.dot(inv(mat))
Out[235]:
array([[ 1., 0., -0., -0., -0.],
[-0., 1., 0., 0., 0.],
[ 0., 0., 1., 0., 0.],
[-0., 0., 0., 1., -0.],
[-0., 0., 0., 0., 1.]])
In [236]: q, r = qr(mat)
In [237]: r
Out[237]:
array([[-1.6914, 4.38 , 0.1757, 0.4075, -0.7838],
[ 0. , -2.6436, 0.1939, -3.072 , -1.0702],
[ 0. , 0. , -0.8138, 1.5414, 0.6155],
[ 0. , 0. , 0. , -2.6445, -2.1669],
[ 0. , 0. , 0. , 0. , 0.0002]])
表達(dá)式X.T.dot(X)計(jì)算X和它的轉(zhuǎn)置X.T的點(diǎn)積。
表4-7列出了一些最常用的線性代數(shù)函數(shù):
偽隨機(jī)數(shù)生成
numpy.random模塊對(duì)Python內(nèi)置的random進(jìn)行了補(bǔ)充,增加了一些用于高效生成多種概率分布的樣本值的函數(shù)。例如,你可以用normal來(lái)得到一個(gè)標(biāo)準(zhǔn)正態(tài)分布的4×4樣本數(shù)組:
In [238]: samples = np.random.normal(size=(4, 4))
In [239]: samples
Out[239]:
array([[ 0.5732, 0.1933, 0.4429, 1.2796],
[ 0.575 , 0.4339, -0.7658, -1.237 ],
[-0.5367, 1.8545, -0.92 , -0.1082],
[ 0.1525, 0.9435, -1.0953, -0.144 ]])
而Python內(nèi)置的random模塊則只能一次生成一個(gè)樣本值。從下面的測(cè)試結(jié)果可以看出,如果需要產(chǎn)生大量樣本值,numpy.random快了不止一個(gè)數(shù)量級(jí):
In [240]: from random import normalvariate
In [241]: N = 1000000
In [242]: %timeit samples = [normalvariate(0, 1) for _ in range(N)]
1.77 s +- 126 ms per loop (mean +- std. dev. of 7 runs, 1 loop each)
In [243]: %timeit np.random.normal(size=N)
61.7 ms +- 1.32 ms per loop (mean +- std. dev. of 7 runs, 10 loops each)
我們說(shuō)這些都是偽隨機(jī)數(shù),是因?yàn)樗鼈兌际峭ㄟ^(guò)算法基于隨機(jī)數(shù)生成器種子,在確定性的條件下生成的。你可以用Numpy的np.random.seed更改隨機(jī)數(shù)生成種子:
In [244]: np.random.seed(1234)
numpy.random的數(shù)據(jù)生成函數(shù)使用了全局的隨機(jī)種子。要避免全局狀態(tài),你可以使用numpy.random.RandomState,創(chuàng)建一個(gè)與其它隔離的隨機(jī)數(shù)生成器:
In [245]: rng = np.random.RandomState(1234)
In [246]: rng.randn(10)
Out[246]:
array([ 0.4714, -1.191 , 1.4327, -0.3127, -0.7206, 0.8872, 0.8596,
-0.6365, 0.0157, -2.2427])
表4-8列出了numpy.random中的部分函數(shù)。在下一節(jié)中,我將給出一些利用這些函數(shù)一次性生成大量樣本值的范例。
示例:隨機(jī)漫步
我們通過(guò)模擬隨機(jī)漫步來(lái)說(shuō)明如何運(yùn)用數(shù)組運(yùn)算,先來(lái)看一個(gè)簡(jiǎn)單的隨機(jī)漫步的例子:從0開(kāi)始,步長(zhǎng)1和-1出現(xiàn)的概率相等。
下面是一個(gè)通過(guò)內(nèi)置的random模塊以純Python的方式實(shí)現(xiàn)1000步的隨機(jī)漫步:
In [247]: import random
.....: position = 0
.....: walk = [position]
.....: steps = 1000
.....: for i in range(steps):
.....: step = 1 if random.randint(0, 1) else -1
.....: position += step
.....: walk.append(position)
.....:
圖4-4是根據(jù)前100個(gè)隨機(jī)漫步值生成的折線圖:
In [249]: plt.plot(walk[:100])
圖4-4 簡(jiǎn)單的隨機(jī)漫步.png
不難看出,這其實(shí)就是隨機(jī)漫步中各步的累計(jì)和,可以用一個(gè)數(shù)組運(yùn)算來(lái)實(shí)現(xiàn)。因此,我用np.random模塊一次性隨機(jī)產(chǎn)生1000個(gè)“擲硬幣”結(jié)果(即兩個(gè)數(shù)中任選一個(gè)),將其分別設(shè)置成1或-1,然后計(jì)算累計(jì)和:
In [251]: nsteps = 1000
In [252]: draws = np.random.randint(0, 2, size=nsteps)
In [253]: steps = np.where(draws > 0, 1, -1)
In [254]: walk = steps.cumsum()
有了這些數(shù)據(jù)之后,我們就可以沿著漫步路徑做一些統(tǒng)計(jì)工作了,比如求取最大值和最小值:
In [255]: walk.min()
Out[255]: -3
In [256]: walk.max()
Out[256]: 31
現(xiàn)在來(lái)看一個(gè)復(fù)雜點(diǎn)的統(tǒng)計(jì)任務(wù)——首次穿越時(shí)間,即隨機(jī)漫步過(guò)程中第一次到達(dá)某個(gè)特定值的時(shí)間。假設(shè)我們想要知道本次隨機(jī)漫步需要多久才能舉例初始0點(diǎn)至少10步遠(yuǎn)(任一方向均可)。np.abs(walk)>=10可以得到一個(gè)布爾型數(shù)組,它表示的是距離是否達(dá)到或超過(guò)10,而我們想要知道的是第一個(gè)10或-10的索引。可以用argmax來(lái)解決這個(gè)問(wèn)題,它返回的是該布爾型數(shù)組第一個(gè)最大值的索引(True就是最大值):
In [257]: (np.abs(walk) >= 10).argmax()
Out[257]: 37
注意,這里使用argmax并不是很高效,因?yàn)樗鼰o(wú)論如何都會(huì)對(duì)數(shù)組進(jìn)行完全掃描。在本例中,只要發(fā)現(xiàn)了一個(gè)True,那我們就知道它是個(gè)最大值了。
一次模擬多個(gè)隨機(jī)漫步
如果你希望模擬多個(gè)隨機(jī)漫步過(guò)程(比如5000個(gè)),只需對(duì)上面的代碼做一點(diǎn)點(diǎn)修改即可生成所有的隨機(jī)漫步過(guò)程。只要給numpy.random的函數(shù)傳入一個(gè)二元元組就可以產(chǎn)生一個(gè)二維數(shù)組,然后我們就可以一次性計(jì)算5000個(gè)隨機(jī)漫步過(guò)程(一行一個(gè))的累計(jì)和了:
In [258]: nwalks = 5000
In [259]: nsteps = 1000
In [260]: draws = np.random.randint(0, 2, size=(nwalks, nsteps)) # 0 or 1
In [261]: steps = np.where(draws > 0, 1, -1)
In [262]: walks = steps.cumsum(1)
In [263]: walks
Out[263]:
array([[ 1, 0, 1, ..., 8, 7, 8],
[ 1, 0, -1, ..., 34, 33, 32],
[ 1, 0, -1, ..., 4, 5, 4],
...,
[ 1, 2, 1, ..., 24, 25, 26],
[ 1, 2, 3, ..., 14, 13, 14],
[ -1, -2, -3, ..., -24, -23, -22]])
現(xiàn)在,我們來(lái)計(jì)算所有隨機(jī)漫步過(guò)程的最大值和最小值:
In [264]: walks.max()
Out[264]: 138
In [265]: walks.min()
Out[265]: -133
得到這些數(shù)據(jù)之后,我們來(lái)計(jì)算30或-30的最小穿越時(shí)間。這里稍微復(fù)雜些,因?yàn)椴皇?000個(gè)過(guò)程都到達(dá)了30。我們可以用any方法來(lái)對(duì)此進(jìn)行檢查:
In [266]: hits30 = (np.abs(walks) >= 30).any(1)
In [267]: hits30
Out[267]: array([False, True, False, ..., False, True, False], dtype=bool)
In [268]: hits30.sum() # Number that hit 30 or -30
Out[268]: 3410
然后我們利用這個(gè)布爾型數(shù)組選出那些穿越了30(絕對(duì)值)的隨機(jī)漫步(行),并調(diào)用argmax在軸1上獲取穿越時(shí)間:
In [269]: crossing_times = (np.abs(walks[hits30]) >= 30).argmax(1)
In [270]: crossing_times.mean()
Out[270]: 498.88973607038122
請(qǐng)嘗試用其他分布方式得到漫步數(shù)據(jù)。只需使用不同的隨機(jī)數(shù)生成函數(shù)即可,如normal用于生成指定均值和標(biāo)準(zhǔn)差的正態(tài)分布數(shù)據(jù):
In [271]: steps = np.random.normal(loc=0, scale=0.25,
.....: size=(nwalks, nsteps))
總結(jié)
以上是生活随笔為你收集整理的python输入一个数组输出24进制式的时间_4.4 用于数组的文件输入输出 线性代数...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 洗车加盟多少钱啊?
- 下一篇: python管道通信_Python进程通