日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

numpy维度交换_“lazy”的transpose()函数——从numpy 数组的内存布局讲起

發布時間:2023/12/1 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 numpy维度交换_“lazy”的transpose()函数——从numpy 数组的内存布局讲起 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 數組的兩種內存布局方式

行優先與列優先

首先我們回顧一下,矩陣數據在內存中的兩種布局方式:

  • 行優先(row-major):以行為優先單位,在內存中逐行存儲/讀取;對于多維,意味著當線性掃描內存時,第一個維度的變化最慢。
  • 列優先(column-major):以列為優先單位,在內存中逐列存儲/讀取;對于多維,意味著當線性掃描內存時,最后一個維度的變化最慢。

以下面的[2, 2, 2]張量為例:

a = [[[1, 2],[3, 4]],[[5, 6],[7, 8]]]

在內存中的數據排布:

行優先:1, 2 | 3, 4 || 5, 6 | 7, 8a[0,0] a[0,1] a[1,0] a[1,1] 列優先:1, 5 | 3, 7 || 2, 6 | 4, 8a[0,0] a[1,0] a[0,1] a[1,1]

誰更好?

選擇行優先還是列優先,主要取決于我們訪問數組的模式。由于每次從內存中獲取數據時,CPU都會自動將該數據及其相鄰的內存加載到緩存中,希望利用引用的局部性。因此,如果訪問數組時是逐列訪問的,我們就希望同一列的數據在內存中靠得更近,便于一次性加載到CPU緩存中從而避免反復加載,亦即更加的“Cache-friendly”,此時列優先顯然是最好的選擇。而對于逐行訪問的情況,則應該選擇行優先。

C和大多數DeepLearning庫用的都是行優先,而Fortran和matlab等一些用于科學計算的語言,使用的是列優先。不要問為什么,這是歷史的偶然選擇而已。如果要強行解釋,可以說Fortran是考慮到線性代數中的向量默認為列向量,所以用列優先與數學符號更匹配,雖然用列優先并不會加速矩陣運算(比如矩陣乘法中第一個矩陣是逐行訪問,第二個是逐列訪問,不可兼得),但是更能顯現出科學家與眾不同的裝逼特性 :-) 。

2 numpy 中的行優先和列優先

numpy支持這兩種內存布局方式,默認采用行優先。可以在新建array,或者進行reshape等操作時,通過指定order參數來決定數據的內存布局方式。

array() 新建

函數原型:

array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0)

參數:

  • dtype: 存儲單元格式,有np.float32、np.bool、np.int32等。
  • copy: 是否在內存中新建array。
  • subok: (不用管)If True, then sub-classes will be passed-through, otherwise the returned array will be forced to be a base-class array (default).
  • ndmin: 返回的數組應該具有至少ndmin個維數,不足時補充若干個大小為1的維度。
np.array([[1,2,3],[4,5,6]]).shape Out[52]: (2, 3) np.array([[1,2,3],[4,5,6]], ndmin=4).shape Out[53]: (1, 1, 2, 3)
  • order: 新建的array在內存中的布局方式(該參數在copy==True時才有意義),從 {‘K’, ‘A’, ‘C’, ‘F’} 中選擇;

舉個例子:

s = [[1,2,3], ['a','b','c']] # python序列采用行優先布局 # 內存中 s :1, 2, 3, 'a', 'b', 'c'a = np.array(s, order='C') # a.reshape(-1) :'1', '2', '3', 'a', 'b', 'c'b = np.array(s, order='F') # b.reshape(-1) :'1', 'a', '2', 'b', '3', 'c'

reshape() 重整維度

函數原型:

reshape(array, newshape, order='C') array.reshape(newshape, order='C')

參數:

  • newshape: 一個描述各維度大小的序列,也可以是單個int。
  • order: 從 {‘A’, ‘C’, ‘F’} 中選擇。

b = reshape(a, newshape, order)相當于:

b = np.array(a, order) # 在內存中新建一個 b ,以 order 布局方式存儲從 a 中讀取的數據 b.shape = newshape # 設定index指針的計算方式

3 “lazy”的 transpose() 轉置

注意,numpy中的轉置transpose()是非常“lazy”的,亦即不對內存中的數據進行重排,僅僅改變讀取方式。

舉個例子:

''' a.shape = [1,2,3] ''' transpose_scheme = [2,1,0] # 維度0與2交換位置 b = np.transpose(a, axes=transpose_scheme) ''' 此時 b.shape 雖然變成了 [3,2,1] 但是 b 與 a 在內存的排布是一樣的 '''

transpose()等效于:在讀取/寫入函數函數外,包了一個能改變維度順序的函數裝飾器。

def change_axis_order(transpose_scheme):def get_func(func):@wraps(func)def wrapper(self, axes):transposed_axes = [axes[i] for i in transpose_scheme]return func(self, transposed_axes)return wrapperreturn get_func''' b = np.transpose(a, axes=transpose_scheme) 相當于: ''' b = a.copy() b.__getitem__ = change_axis_order(transpose_scheme)(b.__getitem__) b.__setitem__ = change_axis_order(transpose_scheme)(b.__setitem__)

之所以采用這種“lazy”的方式,是因為重新在內存中排列數據的非常耗時的。

如果一定要在內存中重新排列數據,可以采用以下方法:

b = np.zeros_like(a) b[:] = np.array(a, axes=transpose_scheme)

總結

以上是生活随笔為你收集整理的numpy维度交换_“lazy”的transpose()函数——从numpy 数组的内存布局讲起的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。