日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pytorch 矩阵相乘_编译PyTorch静态库

發布時間:2024/10/12 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 pytorch 矩阵相乘_编译PyTorch静态库 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

背景

眾所周知,PyTorch項目作為一個C++工程,是基于CMake進行構建的。然而當你想基于CMake來構建PyTorch靜態庫時,你會發現:

  • 靜態編譯相關的文檔不全;
  • CMake文件bug太多,其整體結構比較糟糕。

由于重構整體的CMake結構需要很多的人力,一時半會還看不到優雅的解決方案,因此在這里,Gemfield先寫篇文章來說明PyTorch的靜態編譯如何進行,以及各種注意事項。本文基于目前最新的PyTorch 1.7(在最新的master分支上也沒有問題)。

尤其是涉及到PyTorch靜態編譯重構的時候,還牽涉到代碼的重新設計。舉個例子,一些模塊的注冊機制是依賴全局對象初始化的,在靜態庫中,這樣的初始化邏輯并不會被鏈接(因為你的程序并沒有調用它),這就導致程序需要調用的內容并沒有被初始化。而為了解決這個問題引入的-Wl,--no-whole-archive,又導致編譯目標的體積變得極為龐大。當未來,若PyTorch官方倉庫為靜態編譯進行重構優化后,本文也就過時了(進而會被遷移到Gemfield的頹垣廢址專欄下)。

思緒再回來,本文以在Ubuntu 18.04 上進行目標為x86_64 Linux的構建為例,介紹使用CMake對PyTorch進行靜態編譯的2種最小尺度(這種最小尺度的定義是:不更改pytorch自身代碼、不使用CMake文件中intern的開關、使得libtorch能夠進行模型的前向推理、tensor的序列化反序列化、庫盡可能小):

  • 最小尺度CPU版本;
  • 最小尺度CUDA版本。

另外,在閱讀本文前,我們需要熟悉下幾個線性代數庫的名字。

BLAS (Basic Linear Algebra Subprograms),是一個常見線性代數操作的API規范,偏向底層,主要內容有:向量相加、標量相乘、點積、線性組合、矩陣相乘等。

LAPACK (Linear Algebra Package) 也是一個線性代數庫的規范. 基于BLAS規范,不同于BLAS的底層,LAPACK定位于高層。LAPACK定義矩陣分解的一些操作,如LU、LLt、QR、SVD、Schur,用來解決諸如找到矩陣的特征值、找到矩陣奇異值、求解線性方程組這樣的問題。

BLAS/LAPACK既然是API規范,就應該有相應的實現,常用的有這些:

  • MKL,Intel Math Kernel Library。用于Intel處理器的(注意和MKL-DNN庫的區別,MKL-DNN是英特爾的一個獨立的神經網絡庫:MKL for Deep Neural Networks);
  • ATLAS,Automatically Tuned Linear Algebra Software,多平臺的;
  • OpenBLAS,多平臺的;
  • Accelerate,蘋果macOS、iOS平臺上的;
  • Eigen,這個庫只有頭文件,實現了BLAS和一部分LAPACK,集成到了PyTorch項目的thirdparty下;
  • cuBLAS,NVIDIA的BLAS實現,基于NVIDIA的GPU硬件(此外還有cuFFT、cuRAND, cuSPARSE等);
  • MAGMA,基于CUDA、HIP、 Intel Xeon Phi、OpenCL的BLAS/LAPACK實現;

還記得剛才提到過本文的目標是在Ubuntu 18.04上進行目標為x86_64 Linux的構建,這種情況下,我們必須要使用一個LAPACK實現:openblas、MKL或者Eigen。否則,運行時會報錯:“gels : Lapack library not found in compile time”。本文使用MKL,并實驗性質到介紹下如何使用Eigen。

CMake編譯開關

使用CMake進行構建時,我們主要是通過一些編譯開關來決定要編譯的模塊。這些編譯開關是在CMake文件中定義的變量,其值的來源主要有這幾種:

  • 默認值;
  • 用戶指定;
  • 通過檢測系統環境獲得;
  • 通過檢測軟件包的安裝情況獲得;
  • 通過開關與開關之間的邏輯關系推導而來;

這些開關的值會影響:

  • CMakeLists.txt中要添加的編譯單元;
  • 編譯器、鏈接器的命令行參數;
  • 代碼中的ifdef宏;

下面是一些主要的編譯開關的初始值,這些值初始值要么為OFF,要么為ON,要么為空。如下所示:

1,默認關閉的

  • ATEN_NO_TEST,是否編譯ATen test binaries;
  • BUILD_BINARY,Build C++ binaries;
  • BUILD_DOCS,Build Caffe2 documentation;
  • BUILD_CAFFE2_MOBILE,Build libcaffe2 for mobile,也就是在libcaffe2和libtorch mobile中選擇,目前已經廢棄,默認使用libtorch mobile;
  • CAFFE2_USE_MSVC_STATIC_RUNTIME,Using MSVC static runtime libraries;
  • BUILD_TEST,Build C++ test binaries (need gtest and gbenchmark);
  • BUILD_STATIC_RUNTIME_BENCHMARK,Build C++ binaries for static runtime benchmarks (need gbenchmark);
  • BUILD_TENSOREXPR_BENCHMARK,Build C++ binaries for tensorexpr benchmarks (need gbenchmark);
  • BUILD_MOBILE_BENCHMARK,Build C++ test binaries for mobile (ARM) targets(need gtest and gbenchmark);
  • BUILD_MOBILE_TEST,Build C++ test binaries for mobile (ARM) targets(need gtest and gbenchmark);
  • BUILD_JNI,Build JNI bindings;
  • BUILD_MOBILE_AUTOGRAD,Build autograd function in mobile build (正在開發中);
  • INSTALL_TEST,Install test binaries if BUILD_TEST is on;
  • USE_CPP_CODE_COVERAGE,Compile C/C++ with code coverage flags;
  • USE_ASAN,Use Address Sanitizer;
  • USE_TSAN,Use Thread Sanitizer;
  • CAFFE2_STATIC_LINK_CUDA,Statically link CUDA libraries;
  • USE_STATIC_CUDNN,Use cuDNN static libraries;
  • USE_KINETO,Use Kineto profiling library;
  • USE_FAKELOWP,Use FakeLowp operators;
  • USE_FFMPEG;
  • USE_GFLAGS;
  • USE_GLOG;
  • USE_LEVELDB;
  • USE_LITE_PROTO,Use lite protobuf instead of full;
  • USE_LMDB;
  • USE_PYTORCH_METAL,Use Metal for PyTorch iOS build;
  • USE_NATIVE_ARCH,Use -march=native;
  • USE_STATIC_NCCL;
  • USE_SYSTEM_NCCL,Use system-wide NCCL;
  • USE_NNAPI;
  • USE_NVRTC,Use NVRTC. Only available if USE_CUDA is on;
  • USE_OBSERVERS,Use observers module;
  • USE_OPENCL;
  • USE_OPENCV;
  • USE_PROF,Use profiling;
  • USE_REDIS;
  • USE_ROCKSDB;
  • USE_SNPE,使用高通的神經網絡引擎;
  • USE_SYSTEM_EIGEN_INSTALL,Use system Eigen instead of the one under third_party;
  • USE_TENSORRT,Using Nvidia TensorRT library;
  • USE_VULKAN,Use Vulkan GPU backend;
  • USE_VULKAN_API,Use Vulkan GPU backend v2;
  • USE_VULKAN_SHADERC_RUNTIME,Use Vulkan Shader compilation runtime(Needs shaderc lib);
  • USE_VULKAN_RELAXED_PRECISION,Use Vulkan relaxed precision(mediump);
  • USE_ZMQ;
  • USE_ZSTD;
  • USE_MKLDNN_CBLAS,Use CBLAS in MKLDNN;
  • USE_TBB;
  • HAVE_SOVERSION,Whether to add SOVERSION to the shared objects;
  • USE_SYSTEM_LIBS,Use all available system-provided libraries;
  • USE_SYSTEM_CPUINFO,Use system-provided cpuinfo;
  • USE_SYSTEM_SLEEF,Use system-provided sleef;
  • USE_SYSTEM_GLOO,Use system-provided gloo;
  • USE_SYSTEM_FP16,Use system-provided fp16;
  • USE_SYSTEM_PTHREADPOOL,Use system-provided pthreadpool;
  • USE_SYSTEM_PSIMD,Use system-provided psimd;
  • USE_SYSTEM_FXDIV,Use system-provided fxdiv;
  • USE_SYSTEM_BENCHMARK,Use system-provided google benchmark;
  • USE_SYSTEM_ONNX,Use system-provided onnx;
  • USE_SYSTEM_XNNPACK,Use system-provided xnnpack。
  • 2,默認打開的

  • BUILD_CUSTOM_PROTOBUF,Build and use Caffe2's own protobuf under third_party;
  • BUILD_PYTHON,Build Python binaries;
  • BUILD_CAFFE2,Master flag to build Caffe2;
  • BUILD_CAFFE2_OPS,Build Caffe2 operators;
  • BUILD_SHARED_LIBS,Build libcaffe2.so;
  • CAFFE2_LINK_LOCAL_PROTOBUF,If set, build protobuf inside libcaffe2.so;
  • COLORIZE_OUTPUT,Colorize output during compilation;
  • USE_CUDA;
  • USE_CUDNN;
  • USE_ROCM;
  • USE_FBGEMM,Use FBGEMM (quantized 8-bit server operators);
  • USE_METAL,Use Metal for Caffe2 iOS build;
  • USE_NCCL,須在UNIX上,且USE_CUDA 或USE_ROCM是打開的;
  • USE_NNPACK;
  • USE_NUMPY;
  • USE_OPENMP,Use OpenMP for parallel code;
  • USE_QNNPACK;Use QNNPACK (quantized 8-bit operators);
  • USE_PYTORCH_QNNPACK,Use ATen/QNNPACK (quantized 8-bit operators);
  • USE_VULKAN_WRAPPER,Use Vulkan wrapper;
  • USE_XNNPACK,
  • USE_DISTRIBUTED;
  • USE_MPI,Use MPI for Caffe2. Only available if USE_DISTRIBUTED is on;
  • USE_GLOO,Only available if USE_DISTRIBUTED is on;
  • USE_TENSORPIPE,Only available if USE_DISTRIBUTED is on;
  • ONNX_ML,Enable traditional ONNX ML API;
  • USE_NUMA;
  • USE_VALGRIND;
  • USE_MKLDNN;
  • BUILDING_WITH_TORCH_LIBS,Tell cmake if Caffe2 is being built alongside torch libs。
  • 3,默認為空的

  • SELECTED_OP_LIST,Path to the yaml file that contains the list of operators to include for custom build. Include all operators by default;
  • OP_DEPENDENCY,Path to the yaml file that contains the op dependency graph for custom build。
  • CMake編譯開關的平臺修正

    編譯開關的初始值并不是一成不變的,即使沒有用戶的手工指定,那么CMake也會通過檢測硬件環境、系統環境、包依賴來進行修改。比如下面這樣:

    1,操作系統修正

  • USE_DISTRIBUTED,如果不是Linux/Win32,則關閉;
  • USE_LIBUV,macOS上,且手工打開USE_DISTRIBUTED,則打開;
  • USE_NUMA,如果不是Linux,則關閉;
  • USE_VALGRIND,如果不是Linux,則關閉;
  • USE_TENSORPIPE,如果是Windows,則關閉;
  • USE_KINETO,如果是windows,則關閉;
  • 如果是構建Android、iOS等移動平臺上的libtorch,則:
  • set(BUILD_PYTHON OFF)set(BUILD_CAFFE2_OPS OFF)set(USE_DISTRIBUTED OFF)set(FEATURE_TORCH_MOBILE ON)set(NO_API ON)set(USE_FBGEMM OFF)set(USE_QNNPACK OFF)set(INTERN_DISABLE_ONNX ON)set(INTERN_USE_EIGEN_BLAS ON)set(INTERN_DISABLE_MOBILE_INTERP ON)

    2,CPU架構修正

  • USE_MKLDNN,如果不是64位x86_64,則關閉;
  • USE_FBGEMM,如果不是64位x86_64,則關閉;如果不支持AVX512指令集,則關閉;
  • USE_KINETO,如果是手機平臺,則關閉;
  • USE_GLOO,如果不是64位x86_64,則關閉;
  • 3,軟件包依賴修正

  • USE_DISTRIBUTED,在Windows上,如果找不到libuv,則關閉;
  • USE_GLOO,在Windows上,如果找不到libuv,則關閉;
  • USE_KINETO,如果沒有USE_CUDA,則關閉;
  • MKL相關,不再贅述;
  • NNPACK家族相關的((QNNPACK, PYTORCH_QNNPACK, XNNPACK) ),不再贅述;
  • USE_BLAS,會被相關依賴修正;
  • USE_PTHREADPOOL,會被相關依賴修正;
  • USE_LAPACK,如果LAPACK包不能被找到,則關閉;且運行時會導致出錯:“gels : Lapack library not found in compile time”;
  • 4,用戶手工指令的修正

    • 如果手工打開了USE_SYSTEM_LIBS,則:
    set(USE_SYSTEM_CPUINFO ON)set(USE_SYSTEM_SLEEF ON)set(USE_SYSTEM_GLOO ON)set(BUILD_CUSTOM_PROTOBUF OFF)set(USE_SYSTEM_EIGEN_INSTALL ON)set(USE_SYSTEM_FP16 ON)set(USE_SYSTEM_PTHREADPOOL ON)set(USE_SYSTEM_PSIMD ON)set(USE_SYSTEM_FXDIV ON)set(USE_SYSTEM_BENCHMARK ON)set(USE_SYSTEM_ONNX ON)set(USE_SYSTEM_XNNPACK ON)
    • 如果設置環境變量BUILD_PYTORCH_MOBILE_WITH_HOST_TOOLCHAIN,則set(INTERN_BUILD_MOBILE ON),而INTERN_BUILD_MOBILE一旦打開,則:
    #只有編譯caffe2 mobile的時候才是OFF,其它時候都是ON,也就是都會編譯ATen的op set(INTERN_BUILD_ATEN_OPS ON)set(BUILD_PYTHON OFF) set(BUILD_CAFFE2_OPS OFF) set(USE_DISTRIBUTED OFF) set(FEATURE_TORCH_MOBILE ON) set(NO_API ON) set(USE_FBGEMM OFF) set(USE_QNNPACK OFF) set(INTERN_DISABLE_ONNX ON) set(INTERN_USE_EIGEN_BLAS ON) set(INTERN_DISABLE_MOBILE_INTERP ON)

    5,CMake的配置

    CMake的過程中會對系統環境進行檢查,主要用來檢測:

    • 是否支持AVX2(perfkernels有依賴);
    • 是否支持AVX512(fbgemm有依賴);
    • 尋找BLAS實現,如果目標是Mobile平臺,使用Eigen;如果不是Mobile,則尋找MKL、openblas(找不到不會報錯,但程序運行時會提示:gels : Lapack library not found in compile time);
    • Protobuf;
    • python解釋器;
    • NNPACK(NNPACK backend 是x86-64);
    • OpenMP(是MKL-DNN的依賴);
    • NUMA;
    • pybind11;
    • CUDA;
    • ONNX;
    • MAGMA(基于GPU等設備的blas/lapack實現);
    • metal(蘋果生態);
    • NEON(ARM生態,這里肯定是檢測不到相關的硬件了);
    • MKL-DNN(Intel的深度學習庫);
    • ATen parallel backend: NATIVE;
    • Sleef(thirdparty下的三方庫);
    • RT : /usr/lib/x86_64-linux-gnu/librt.so ;
    • FFTW3 : /usr/lib/x86_64-linux-gnu/libfftw3.so;
    • OpenSSL: /usr/lib/x86_64-linux-gnu/libcrypto.so;
    • MPI;

    CMake構建的時候會使用python腳本(tools/codegen/gen.py)生成一些cpp源文件,這個python腳本對yaml、dataclasses模塊有依賴,因此,在開始編譯前,你需要安裝這些包:

    root@gemfield:~# pip3 install setuptools root@gemfield:~# pip3 install pyyaml root@gemfield:~# pip3 install dataclasses

    PyTorch官方預編譯動態庫的編譯選項

    如果對官方編譯的庫所選用的編譯開關感興趣的話,可以使用如下的python命令獲得這些信息:

    >>> print(torch.__config__.show()) PyTorch built with:- GCC 7.3- C++ Version: 201402- Intel(R) Math Kernel Library Version 2020.0.1 Product Build 20200208 for Intel(R) 64 architecture applications- Intel(R) MKL-DNN v1.5.0 (Git Hash e2ac1fac44c5078ca927cb9b90e1b3066a0b2ed0)- OpenMP 201511 (a.k.a. OpenMP 4.5)- NNPACK is enabled- CPU capability usage: AVX2- CUDA Runtime 10.1- NVCC architecture flags: -gencode;arch=compute_37,code=sm_37;-gencode;arch=compute_50,code=sm_50;-gencode;arch=compute_60,code=sm_60;-gencode;arch=compute_61,code=sm_61;-gencode;arch=compute_70,code=sm_70;-gencode;arch=compute_75,code=sm_75;-gencode;arch=compute_37,code=compute_37- CuDNN 7.6.3- Magma 2.5.2- Build settings: BLAS=MKL, BUILD_TYPE=Release, CXX_FLAGS= -Wno-deprecated -fvisibility-inlines-hidden -DUSE_PTHREADPOOL -fopenmp -DNDEBUG -DUSE_FBGEMM -DUSE_QNNPACK -DUSE_PYTORCH_QNNPACK -DUSE_XNNPACK -DUSE_VULKAN_WRAPPER -O2 -fPIC -Wno-narrowing -Wall -Wextra -Werror=return-type -Wno-missing-field-initializers -Wno-type-limits -Wno-array-bounds -Wno-unknown-pragmas -Wno-sign-compare -Wno-unused-parameter -Wno-unused-variable -Wno-unused-function -Wno-unused-result -Wno-unused-local-typedefs -Wno-strict-overflow -Wno-strict-aliasing -Wno-error=deprecated-declarations -Wno-stringop-overflow -Wno-error=pedantic -Wno-error=redundant-decls -Wno-error=old-style-cast -fdiagnostics-color=always -faligned-new -Wno-unused-but-set-variable -Wno-maybe-uninitialized -fno-math-errno -fno-trapping-math -Werror=format -Wno-stringop-overflow, PERF_WITH_AVX=1, PERF_WITH_AVX2=1, PERF_WITH_AVX512=1, USE_CUDA=ON, USE_EXCEPTION_PTR=1, USE_GFLAGS=OFF, USE_GLOG=OFF, USE_MKL=ON, USE_MKLDNN=ON, USE_MPI=OFF, USE_NCCL=ON, USE_NNPACK=ON, USE_OPENMP=ON, USE_STATIC_DISPATCH=OFF

    編譯最小尺度的CPU版本靜態庫(MKL后端)

    在這個最小尺度的CPU版本里,Gemfield將會選擇MKL作為LAPACK的實現。此外,Gemfield將會首先禁用CUDA,這是自然而然的。其次Gemfield還要禁用caffe2(因為目的是編譯libtorch),這會連帶著禁用caffe2的op。整體要禁用的模塊還有:

    • caffe2;
    • 可執行文件;
    • python;
    • test;
    • numa;
    • 分布式(DISTRIBUTED);
    • ROCM;
    • GLOO;
    • MPI;
    • CUDA;

    1,安裝MKL

    既然選擇了MKL,第一步就是要安裝它。MKL使用的是ISSL授權(Intel Simplified Software License):

    root@gemfield:~# wget https://apt.repos.intel.com/intel-gpg-keys/GPG-PUB-KEY-INTEL-SW-PRODUCTS-2019.PUB root@gemfield:~# apt-key add GPG-PUB-KEY-INTEL-SW-PRODUCTS-2019.PUB root@gemfield:~# echo deb https://apt.repos.intel.com/mkl all main > /etc/apt/sources.list.d/intel-mkl.list root@gemfield:~# apt update root@gemfield:~# apt install intel-mkl-64bit-2020.4-912

    2,使用CMake構建

    命令如下:

    cmake -DCMAKE_VERBOSE_MAKEFILE:BOOL=1 -DUSE_CUDA=OFF -DBUILD_CAFFE2=OFF -DBUILD_PYTHON:BOOL=OFF -DBUILD_CAFFE2_OPS=OFF -DUSE_DISTRIBUTED=OFF -DBUILD_TEST=OFF -DBUILD_BINARY=OFF -DBUILD_MOBILE_BENCHMARK=0 -DBUILD_MOBILE_TEST=0 -DUSE_ROCM=OFF -DUSE_GLOO=OFF -DUSE_LEVELDB=OFF -DUSE_MPI:BOOL=OFF -DBUILD_CUSTOM_PROTOBUF:BOOL=OFF -DUSE_OPENMP:BOOL=OFF -DBUILD_SHARED_LIBS:BOOL=OFF -DCMAKE_BUILD_TYPE:STRING=Release -DPYTHON_EXECUTABLE:PATH=`which python3` -DCMAKE_INSTALL_PREFIX:PATH=../libtorch_cpu_mkl ../pytorch

    然后使用如下的命令進行編譯:

    cmake --build . --target install -- "-j8"

    編譯成功后,生成的靜態庫有(23個,其中一個是鏈接文件):

    lib/libprotobuf.a lib/libsleef.a lib/libclog.a lib/libcpuinfo.a lib/libnnpack.a lib/libasmjit.a lib/libmkldnn.a lib/libpytorch_qnnpack.a lib/libcaffe2_protos.a lib/libprotobuf-lite.a lib/libfbgemm.a lib/libc10.a lib/libpthreadpool.a lib/libtorch_cpu.a lib/libdnnl.a lib/libqnnpack.a lib/libprotoc.a lib/libXNNPACK.a lib/libtorch.a lib/libonnx_proto.a lib/libfmt.a lib/libonnx.a lib/libfoxi_loader.a

    或者你也想編譯Caffe2的話,就開啟BUILD_CAFFE2編譯開關:

    cmake -DCMAKE_VERBOSE_MAKEFILE:BOOL=1 -DBUILD_CAFFE2=ON -DBUILD_CAFFE2_OPS=ON -DUSE_OPENMP=ON -DUSE_MKLDNN=ON -DUSE_GFLAGS=OFF -DUSE_GLOG=OFF -DUSE_CUDA=OFF -DBUILD_PYTHON:BOOL=OFF -DUSE_DISTRIBUTED=OFF -DBUILD_TEST=OFF -DBUILD_BINARY=OFF -DBUILD_MOBILE_BENCHMARK=0 -DBUILD_MOBILE_TEST=0 -DUSE_ROCM=OFF -DUSE_GLOO=OFF -DUSE_LEVELDB=OFF -DUSE_MPI:BOOL=OFF -DBUILD_SHARED_LIBS:BOOL=OFF -DCMAKE_BUILD_TYPE:STRING=Release -DPYTHON_EXECUTABLE:PATH=`which python3` -DCMAKE_INSTALL_PREFIX:PATH=../libtorch_cpu_caffe2 ../pytorch

    生成的靜態庫有26個,除了上面的非caffe2版本,還多出來了perfkernel模塊生成的:

    libCaffe2_perfkernels_avx.a libCaffe2_perfkernels_avx2.a libCaffe2_perfkernels_avx512.a

    這三個庫包含了如下的API,實現了一些FMA操作:

    caffe2::EmbeddingLookupIdx_int32_t_float_float_false__avx2_fma caffe2::EmbeddingLookupIdx_int32_t_float_float_true__avx2_fma caffe2::EmbeddingLookupIdx_int32_t_half_float_false__avx2_fma caffe2::EmbeddingLookupIdx_int32_t_half_float_true__avx2_fma caffe2::EmbeddingLookupIdx_int32_t_uint8_t_float_false__avx2_fma caffe2::EmbeddingLookupIdx_int32_t_uint8_t_float_true__avx2_fma caffe2::EmbeddingLookupIdx_int64_t_float_float_false__avx2_fma caffe2::EmbeddingLookupIdx_int64_t_float_float_true__avx2_fma caffe2::EmbeddingLookupIdx_int64_t_half_float_false__avx2_fma caffe2::EmbeddingLookupIdx_int64_t_half_float_true__avx2_fma caffe2::EmbeddingLookupIdx_int64_t_uint8_t_float_false__avx2_fma caffe2::EmbeddingLookupIdx_int64_t_uint8_t_float_true__avx2_fma caffe2::EmbeddingLookup_int32_t_float_float_false__avx2_fma caffe2::EmbeddingLookup_int32_t_float_float_true__avx2_fma caffe2::EmbeddingLookup_int32_t_half_float_false__avx2_fma caffe2::EmbeddingLookup_int32_t_half_float_true__avx2_fma caffe2::EmbeddingLookup_int32_t_uint8_t_float_false__avx2_fma caffe2::EmbeddingLookup_int32_t_uint8_t_float_true__avx2_fma caffe2::EmbeddingLookup_int64_t_float_float_false__avx2_fma caffe2::EmbeddingLookup_int64_t_float_float_true__avx2_fma caffe2::EmbeddingLookup_int64_t_half_float_false__avx2_fma caffe2::EmbeddingLookup_int64_t_half_float_true__avx2_fma caffe2::EmbeddingLookup_int64_t_uint8_t_float_false__avx2_fma caffe2::EmbeddingLookup_int64_t_uint8_t_float_true__avx2_fma caffe2::Fused8BitRowwiseEmbeddingLookupIdx_int32_t_uint8_t_float_false__avx2_fma caffe2::Fused8BitRowwiseEmbeddingLookupIdx_int64_t_uint8_t_float_false__avx2_fma caffe2::Fused8BitRowwiseEmbeddingLookup_int32_t_uint8_t_float_false__avx2_fma caffe2::Fused8BitRowwiseEmbeddingLookup_int64_t_uint8_t_float_false__avx2_fma caffe2::TypedAxpy__avx2_fma caffe2::TypedAxpy__avx_f16c caffe2::TypedAxpyHalffloat__avx2_fma caffe2::TypedAxpyHalffloat__avx_f16c caffe2::TypedAxpy_uint8_float__avx2_fma

    此外,SELECTED_OP_LIST可以減少要編譯的OP,但本文不討論——因為Gemfield編譯的靜態庫要滿足不同模型的推理。

    3,使用pytorch靜態庫(MKL后端版本)

    如何讓自己的程序鏈接該靜態庫呢?由于MKL依賴openmp,因此編譯的命令行參數要打開(-fopenmp )。而PyTorch的代碼又需要依賴以下的MKL靜態庫:

    /opt/intel/mkl/lib/intel64/libmkl_intel_lp64.a #/opt/intel/mkl/lib/intel64/libmkl_sequential.a /opt/intel/mkl/lib/intel64/libmkl_gnu_thread.a /opt/intel/mkl/lib/intel64/libmkl_core.a

    以及依賴系統上的這幾個共享庫:

    /usr/lib/x86_64-linux-gnu/libpthread.so /usr/lib/x86_64-linux-gnu/libm.so /usr/lib/x86_64-linux-gnu/libdl.so

    因此你的程序需要鏈接這些庫(除了鏈接pytorch那二十幾個靜態庫外)才能完成編譯。感覺很復雜是吧?忘記這些吧,使用我們開源的libdeepvac庫吧。libdeepvac封裝了libtorch,提供更簡化的C++中使用PyTorch模型的方法。

    編譯最小尺度的CPU版本靜態庫(Eigen后端)

    在這個最小尺度的CPU版本里,Gemfield將會選擇Eigen來作為LAPACK的實現。使用Eigen來作為LAPACK實現的話,需要打開INTERN_USE_EIGEN_BLAS。看見INTERN前綴了吧,這提示我們不應該這樣來使用這個開關。并且由于在PyTorch中,Eigen是為mobile平臺而設計使用的,因此要想在x86_64 Linux使用,就需要改下pytorch倉庫中的CMake文件:一共2處。

    1,修改PyTorch的CMake文件

    第一處,修改cmake/Dependencies.cmake:

    #if(NOT INTERN_BUILD_MOBILE) # set(AT_MKL_ENABLED 0) # set(AT_MKL_MT 0) # set(USE_BLAS 1) # if(NOT (ATLAS_FOUND OR OpenBLAS_FOUND OR MKL_FOUND OR VECLIB_FOUND OR GENERIC_BLAS_FOUND)) # message(WARNING "Preferred BLAS (" ${BLAS} ") cannot be found, now searching for a general BLAS library") # find_package(BLAS) # if(NOT BLAS_FOUND) # set(USE_BLAS 0) # endif() # endif() # # if(MKL_FOUND) # add_definitions(-DTH_BLAS_MKL) # if("${MKL_THREADING}" STREQUAL "SEQ") # add_definitions(-DTH_BLAS_MKL_SEQ=1) # endif() # if(MSVC AND MKL_LIBRARIES MATCHES ".*libiomp5md.lib.*") # add_definitions(-D_OPENMP_NOFORCE_MANIFEST) # set(AT_MKL_MT 1) # endif() # set(AT_MKL_ENABLED 1) # endif() if(INTERN_USE_EIGEN_BLAS)# Eigen BLAS for Mobileset(USE_BLAS 1)set(AT_MKL_ENABLED 0)include(${CMAKE_CURRENT_LIST_DIR}/External/EigenBLAS.cmake)list(APPEND Caffe2_DEPENDENCY_LIBS eigen_blas) endif()

    第二處,修改cmake/External/EigenBLAS.cmake:

    root@gemfield:~# git diff cmake/External/EigenBLAS.cmake ......set(__EIGEN_BLAS_INCLUDED TRUE) - -if(NOT INTERN_BUILD_MOBILE OR NOT INTERN_USE_EIGEN_BLAS) +if(NOT INTERN_USE_EIGEN_BLAS)return()endif()

    此外,像MKL后端那樣,Gemfield要照例禁用CUDA、caffe2、caffe2的op。

    2,使用CMake進行構建

    命令如下(注意開啟了INTERN_USE_EIGEN_BLAS):

    cmake -DINTERN_USE_EIGEN_BLAS=ON -DCMAKE_VERBOSE_MAKEFILE:BOOL=1 -DBUILD_CAFFE2=OFF -DBUILD_CAFFE2_OPS=OFF -DBUILD_PYTHON:BOOL=OFF -DUSE_DISTRIBUTED=OFF -DBUILD_TEST=OFF -DBUILD_BINARY=OFF -DBUILD_MOBILE_BENCHMARK=0 -DBUILD_MOBILE_TEST=0 -DUSE_ROCM=OFF -DUSE_GLOO=OFF -DUSE_CUDA=OFF -DUSE_LEVELDB=OFF -DUSE_MPI:BOOL=OFF -DBUILD_CUSTOM_PROTOBUF:BOOL=OFF -DUSE_OPENMP:BOOL=OFF -DBUILD_SHARED_LIBS:BOOL=OFF -DCMAKE_BUILD_TYPE:STRING=Release -DPYTHON_EXECUTABLE:PATH=`which python3` -DCMAKE_INSTALL_PREFIX:PATH=../libtorch_cpu_eigen ../pytorch

    然后使用如下的命令進行編譯:

    cmake --build . --target install -- "-j8"

    編譯出來的靜態庫如下所示(24個,注意多出來libeigen_blas.a):

    lib/libprotobuf.a lib/libsleef.a lib/libclog.a lib/libcpuinfo.a lib/libeigen_blas.a lib/libnnpack.a lib/libasmjit.a lib/libmkldnn.a lib/libpytorch_qnnpack.a lib/libcaffe2_protos.a lib/libprotobuf-lite.a lib/libfbgemm.a lib/libc10.a lib/libpthreadpool.a lib/libtorch_cpu.a lib/libdnnl.a lib/libqnnpack.a lib/libprotoc.a lib/libXNNPACK.a lib/libtorch.a lib/libonnx_proto.a lib/libfmt.a lib/libonnx.a lib/libfoxi_loader.a

    3,使用pytorch靜態庫(Eigen后端版本)

    和MKL后端不同,你的程序需要從鏈接MKL轉而去鏈接libeigen_blas.a,更簡單了。如果使用libdeepvac庫的話,這都是無感的。

    和MKL后端的靜態庫進行了下粗略的性能比較,在6核intel處理器的系統上,對20個目標進行CNN+LSTM的計算下,MKL版本消耗了11秒,而Eigen版本消耗了20秒。所以還是推薦使用MKL。

    編譯最小尺度的CUDA版本靜態庫(無MAGMA版本)

    1,配置

    相關的配置如下:

    • 要編譯CUDA版本,必須啟用USE_CUDA;
    • 另外,回落到CPU的時候,我們依然需要有對應的LAPACK實現,這里還是選擇MKL,安裝方法見前文;
    • 還有一個地方需要注意:是否使用MAGMA。這里Gemfield先不使用。

    2,CUDA架構

    同CPU版本相比,編譯CUDA版本的最大不同就是要指定CUDA架構(開普勒、麥克斯韋、帕斯卡、圖靈、安培等)。要編譯特定CUDA架構的目標,需要給NVCC編譯器傳遞特定架構的號碼,如7.0。特定架構的號碼有兩種情況:PTX和非PTX。比如7.0 和 7.0 PTX。

    非PTX版本是實際的二進制文件,只能做到主版本號兼容。比如compute capability 3.0 的編譯產物只能運行在compute-capability 3.x的架構上(開普勒架構),而不能運行在compute-capability 5.x (麥克斯韋) 或者 6.x (帕斯卡) 設備上。

    而PTX版本編譯出來的是JIT的中間代碼,可以做到前向兼容——也就是舊設備的目標可以運行在新設備上。因為編譯的時候可以指定多個架構號碼,因此一個技巧就是,總是在最高的版本號上加上PTX,以獲得前向兼容,比如:3.5;5.0;5.2;6.0;6.1;7.0;7.5;7.5+PTX。

    另外,在不兼容的CUDA設備上運行你的程序會出現“no kernel image is available for execution on the device”錯誤。編譯PyTorch的時候,這個CUDA架構號碼來自三種方式:

    • 自動檢測本地機器上的設備號;
    • 檢測不到,則使用默認的一組;
    • 用戶通過TORCH_CUDA_ARCH_LIST環境變量指定。TORCH_CUDA_ARCH_LIST環境變量,比如TORCH_CUDA_ARCH_LIST="3.5 5.2 6.0 6.1+PTX",決定了要編譯的pytorch支持哪些cuda架構。支持的架構越多,最后的庫越大;
    #cuda9 export TORCH_CUDA_ARCH_LIST="3.5;5.0;5.2;6.0;6.1;7.0;7.0+PTX"#cuda10 export TORCH_CUDA_ARCH_LIST="3.5;5.0;5.2;6.0;6.1;7.0;7.5;7.5+PTX"#cuda11 export TORCH_CUDA_ARCH_LIST="3.5;5.0;5.2;6.0;6.1;7.0;7.5;8.0;8.0+PTX"#cuda11.1 export TORCH_CUDA_ARCH_LIST="5.0;7.0;8.0;8.6;8.6+PTX"

    一些市面上常見顯卡的compute-capability號碼如下所示:

    3,使用CMake進行構建

    cmake命令如下(注意打開了USE_CUDA):

    cmake -DCMAKE_VERBOSE_MAKEFILE:BOOL=1 -DUSE_CUDA=ON -DBUILD_CAFFE2=OFF -DBUILD_CAFFE2_OPS=OFF -DUSE_DISTRIBUTED=OFF -DBUILD_TEST=OFF -DBUILD_BINARY=OFF -DBUILD_MOBILE_BENCHMARK=0 -DBUILD_MOBILE_TEST=0 -DUSE_ROCM=OFF -DUSE_GLOO=OFF -DUSE_LEVELDB=OFF -DUSE_MPI:BOOL=OFF -DBUILD_PYTHON:BOOL=OFF -DBUILD_CUSTOM_PROTOBUF:BOOL=OFF -DUSE_OPENMP:BOOL=OFF -DBUILD_SHARED_LIBS:BOOL=OFF -DCMAKE_BUILD_TYPE:STRING=Release -DPYTHON_EXECUTABLE:PATH=`which python3` -DCMAKE_INSTALL_PREFIX:PATH=../libtorch_cuda ../pytorch

    在CUDA版本中,CMake構建時還會檢測:

    • -- CUDA detected: 10.2
    • -- CUDA nvcc is: /usr/local/cuda/bin/nvcc
    • -- CUDA toolkit directory: /usr/local/cuda
    • -- cuDNN: v7.6.5 (include: /usr/include, library: /usr/lib/x86_64-linux-gnu/libcudnn.so)
    • -- Autodetected CUDA architecture(s): 3.5;5.0;5.2;6.0;6.1;7.0;7.5;7.5+PTX;
    • -- Found CUDA with FP16 support, compiling with torch.cuda.HalfTensor;

    然后使用如下的命令進行編譯:

    cmake --build . --target install -- "-j8"

    編譯出如下的靜態庫(26個):

    libasmjit.a libc10.a libc10_cuda.a libcaffe2_protos.a libclog.a libcpuinfo.a libdnnl.a libfbgemm.a libfmt.a libfoxi_loader.a libmkldnn.a libnccl_static.a libnnpack.a libonnx.a libonnx_proto.a libprotobuf.a libprotobuf-lite.a libprotoc.a libpthreadpool.a libpytorch_qnnpack.a libqnnpack.a libsleef.a libtorch.a libtorch_cpu.a libtorch_cuda.a libXNNPACK.a

    可以看到相比CPU版本多出了libtorch_cuda.a、 libc10_cuda.a、libnccl_static.a這3個靜態庫。

    4,使用pytorch靜態庫(CUDA版本)

    和CPU版本類似,但是區別是還要鏈接NVIDIA的cuda運行時的庫(這部分是動態庫)。此外,如果你的程序初始化的時候報錯:“PyTorch is not linked with support for cuda devices”,說明你沒有whole_archive c10_cuda.a靜態庫。

    如果你編譯自己程序的時候遇到了cannot find -lnvToolsExt、cannot find -lcudart這樣的錯誤,你還需要設置下環境變量讓鏈接器能夠找到cuda運行時的庫:

    root@gemfield:~# export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-10.2/targets/x86_64-linux/lib/

    總之,你如果使用了libdeepvac封裝的話(需要打開USE_CUDA),就沒有這么多問題了。

    5,性能

    做了一個快速的不嚴謹的推理性能測試。使用了cuda版本后,還是之前的那個系統,還是之前那個測試任務(對20個目標進行CNN+LSTM的計算下),CUDA版本消耗了不到一秒。

    最后

    在你使用pytorch靜態庫的時候,或多或少還會遇到一些問題。但是,何必自討苦吃呢,使用我們封裝了libtorch的libdeepvac庫吧:

    DeepVAC/libdeepvac?github.com

    總結

    以上是生活随笔為你收集整理的pytorch 矩阵相乘_编译PyTorch静态库的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    81国产精品久久久久久久久久 | 黄色成人av网址 | .国产精品成人自产拍在线观看6 | 99免费在线观看视频 | 精品久久久精品 | 91免费视频网站在线观看 | 在线观看www91 | 99re中文字幕 | 婷婷激情五月综合 | 久久av在线播放 | 免费的成人av | 欧美a在线看 | 日本一区二区高清不卡 | 国产精品久久精品国产 | 99在线精品视频观看 | 日韩网站免费观看 | 久久久久免费精品国产小说色大师 | 亚洲精品视频在线观看免费视频 | 国产成人精品一区二三区 | 日韩在线观看你懂得 | 国产视频一二区 | 国产乱老熟视频网88av | 亚洲综合色视频在线观看 | 蜜臀久久99精品久久久无需会员 | 韩日电影在线观看 | 欧美日韩aaaa | 99精品国产99久久久久久97 | 午夜av日韩| 在线日韩亚洲 | 日韩福利在线观看 | 一区二区三区四区不卡 | av网站在线免费观看 | 韩日av在线| 国产精品毛片久久蜜 | 国产手机视频 | 亚州日韩中文字幕 | 亚洲免费观看视频 | 91成人免费在线视频 | 日韩a级免费视频 | 午夜性生活 | 国产91aaa| 在线日本看片免费人成视久网 | 91大神免费视频 | 天天操天天摸天天干 | 麻豆传媒视频在线免费观看 | 色综合久久中文字幕综合网 | 久久久国产精品网站 | 在线观看视频国产 | 午夜精品av | 日本中文字幕在线视频 | 少妇超碰在线 | 天天躁天天躁天天躁婷 | 久久99国产精品久久 | 国产精品完整版 | 亚洲国产中文字幕在线 | 999国内精品永久免费视频 | 日韩av电影一区 | 九九视频这里只有精品 | 婷婷黄色片 | 色综合久久久久久中文网 | 国产精品九九热 | 日本超碰在线 | 一级黄色片在线免费观看 | 99视频这里有精品 | 91成人欧美 | 99精品国产99久久久久久97 | 久久人人精品 | 91成人免费视频 | 日韩精品一卡 | 五月天色中色 | 六月丁香婷婷在线 | 日韩成人高清在线 | 日产av在线播放 | 国产亚洲欧洲 | 成人午夜片av在线看 | 91香蕉视频 mp4| 国内精品在线一区 | 伊人成人精品 | 狠狠的干狠狠的操 | 欧美色图88 | 亚洲精品播放 | 国产不卡片 | 国产一级免费视频 | 色播五月激情综合网 | 婷婷亚洲五月色综合 | 国产在线观看你懂得 | 99中文字幕视频 | 天天躁天天躁天天躁婷 | 国产精品24小时在线观看 | 激情网站网址 | 久草在线免费在线观看 | 欧洲一区二区三区精品 | 狠狠色噜噜狠狠狠狠 | 国产原创在线 | 高潮久久久 | 国产生活一级片 | 在线不卡a| 久久视频免费在线观看 | 国产精品一区二区无线 | 97成人精品区在线播放 | 色五月情 | 91在线视频免费观看 | 免费在线观看黄 | 久久精品99视频 | 成人免费看电影 | 在线免费国产视频 | 在线播放一区二区三区 | 人人超碰在线 | 国产精品国内免费一区二区三区 | 国产一级在线看 | 国产精品毛片一区二区在线看 | 人人爱人人添 | 中文字幕黄色 | 一区二三国产 | 日韩欧美视频二区 | av888av.com| 91av视频观看 | 91理论片午午伦夜理片久久 | 成年性视频 | 粉嫩av一区二区三区入口 | 69av网| 国产精品福利久久久 | 天天弄天天干 | 欧美日韩中文在线视频 | 国产精品久久久久久久av大片 | 欧美日本在线观看视频 | mm1313亚洲精品国产 | 狠狠色丁香婷婷综合欧美 | 天天综合色天天综合 | 久久调教视频 | 国产一区精品在线观看 | 黄色www| 国产精品 国产精品 | 日韩一区二区三 | 国产涩涩在线观看 | 操久| 久久图 | av网站免费在线 | 国产在线精 | 国产精品影音先锋 | 国产91学生 | 国产精品成人一区二区三区吃奶 | 黄色影院在线观看 | 国产综合91 | 国产在线专区 | 狠狠色丁香婷综合久久 | 日韩h在线观看 | 天天干,天天草 | 色婷婷视频在线 | 91亚洲精品久久久久图片蜜桃 | 久久国产精品99久久久久久进口 | 亚洲乱码精品久久久 | 久久五月婷婷丁香社区 | 久久精品香蕉 | 人人射人人爽 | 人人澡人人干 | av在线免费播放 | 在线国产一区二区三区 | 国产麻豆视频 | 精品国产自 | 国产又粗又硬又爽的视频 | 免费在线观看av网站 | 国产精品精品久久久久久 | 久久精品九色 | 亚洲区视频在线 | 免费看久久久 | 久久人人爽视频 | 蜜桃视频在线视频 | 美女国内精品自产拍在线播放 | 日韩午夜小视频 | 国产a国产 | 在线电影 你懂得 | 免费观看一区 | 国产亚洲人成网站在线观看 | 亚洲综合在线五月 | 免费视频二区 | 国产精品久久久久影院 | 在线观看91精品国产网站 | 亚洲精品黄色片 | 日韩在线中文字幕 | 狠狠干天天操 | 久久免费看av | 免费视频网 | 亚洲人天堂| 欧美日韩在线精品 | 91精品国产高清 | 国产精品电影在线 | 日批网站在线观看 | 91视频啊啊啊 | 91av官网| 久久伊人免费视频 | 国产乱老熟视频网88av | 日韩不卡高清 | 久久久久二区 | 高清色免费 | 久久男女视频 | 91大神视频网站 | 91女神的呻吟细腰翘臀美女 | 欧美视频网址 | 久久电影中文字幕视频 | 国产视频久久久 | 麻花天美星空视频 | 精品久久久久久国产偷窥 | 国产一级二级三级在线观看 | 久久亚洲欧美日韩精品专区 | 国产精品久久在线观看 | 日韩av电影中文字幕在线观看 | av网站地址| 国产一区二区精品久久91 | 8x8x在线观看视频 | 国产成人精品一区二区三区网站观看 | 亚洲精区二区三区四区麻豆 | 日韩免费一区二区 | 91在线看网站 | 521色香蕉网站在线观看 | 久久在线 | 亚洲国产精品va在线 | 免费在线观看视频a | 久久久久国产免费免费 | 国产在线精品一区二区 | 人人操日日干 | 亚洲一区二区三区毛片 | 国产成人a亚洲精品 | 人人爽人人澡 | 色视频国产直接看 | www.一区二区三区 | 国产精品久久久影视 | 天天干,天天射,天天操,天天摸 | 一级成人网 | 欧美激情亚洲综合 | 亚洲三区在线 | 日韩高清一区二区 | 国产免费一区二区三区最新 | 久久精品一区二区三区四区 | 香蕉手机在线 | 99视频一区 | 欧美精品久久久久久久久老牛影院 | 超碰在线cao| 999久久久久久久久 69av视频在线观看 | 日b视频国产 | 日韩r级电影在线观看 | 免费观看成年人视频 | www.黄色| 天天做天天射 | 亚洲毛片一区二区三区 | 久久少妇| 亚洲理论视频 | 精品视频成人 | 日p在线观看 | 国产精品午夜在线观看 | 亚洲精品视频在线观看视频 | 久久久精品小视频 | 一级黄色毛片 | 国产黄色免费观看 | 婷婷丁香视频 | 中文字幕永久在线 | 国产欧美日韩精品一区二区免费 | 中文字幕免费观看 | 国产精品久久久久久久久久不蜜月 | 中文字幕一区二区在线观看 | 午夜视频在线网站 | 在线视频日韩一区 | 国产主播大尺度精品福利免费 | 成年人app网址 | 国产精品久久久 | 国产一区二区三区黄 | 久久黄色片子 | 青草视频在线 | 亚洲黄色一级大片 | 亚洲三级国产 | 综合久久久久久久 | 久久久.com | 综合在线色 | 国产aa免费视频 | 欧美日本高清视频 | 亚洲成色 | 久久五月天婷婷 | 久久免费精品一区二区三区 | 人人添人人澡人人澡人人人爽 | 婷婷激情站 | 97视频免费在线看 | 在线成人高清电影 | 亚洲国产欧美在线人成大黄瓜 | 午夜成人影视 | 久久久精品一区二区 | 在线韩国电影免费观影完整版 | 欧美美女一级片 | 韩国av免费在线观看 | 在线观看av国产 | 天天艹| 国产96在线观看 | 国产免费高清视频 | 欧美日韩一区二区在线 | 成人免费一区二区三区在线观看 | 精品久久久久久亚洲综合网 | 99精品久久99久久久久 | 亚洲乱码精品久久久久 | 一本大道久久精品懂色aⅴ 五月婷社区 | 天天艹天天操 | 九九九九九精品 | 久久视频国产 | 狠狠五月婷婷 | 人人爽人人搞 | 日韩中文字幕免费电影 | 欧美国产一区在线 | 成人小视频在线播放 | 最新免费中文字幕 | 久久久久久久久久久久久9999 | 在线性视频日韩欧美 | 日韩成人看片 | 激情久久伊人 | 久久男女视频 | 亚洲免费不卡 | 天海翼一区二区三区免费 | 国产精品久久久久久久久久三级 | 日日操日日操 | 亚洲专区中文字幕 | 视频在线国产 | 99视频国产精品 | 国产99一区二区 | 91亚色免费视频 | 国产免费xvideos视频入口 | av一级黄| 91精品一区国产高清在线gif | 九九在线视频免费观看 | 美女福利视频网 | 99久久超碰中文字幕伊人 | 亚洲一区尤物 | 国产美女在线精品免费观看 | 国产视频 亚洲视频 | 国内小视频在线观看 | 亚洲一级二级三级 | 色婷婷综合成人av | 免费97视频 | 天天色天天综合 | 91精品久久久久久粉嫩 | 天天躁日日躁狠狠躁av中文 | 毛片基地黄久久久久久天堂 | 免费看一级一片 | 九九免费在线观看 | 在线看不卡av | 久久综合欧美 | 天天做天天爽 | 日韩在线高清视频 | 日韩激情在线 | 久久免费观看视频 | 日韩成人欧美 | 久久久香蕉视频 | 国产精品1区2区 | 久久久久久久久久免费 | 久久综合狠狠综合久久激情 | 永久免费毛片在线观看 | 欧美aa一级片 | 久久久久亚洲精品成人网小说 | 国产精品短视频 | 国产一区二区精品91 | 亚洲一区日韩 | 九九亚洲精品 | 中文字幕亚洲精品在线观看 | 天天射天天爱天天干 | av在线电影网站 | 在线观看一 | 91精品国产综合久久婷婷香蕉 | 婷婷在线视频观看 | 探花在线观看 | 日韩av电影中文字幕 | 久久精品久久久久久久 | 成人一级在线观看 | 九九九视频精品 | 欧美日韩国产在线一区 | 手机在线观看国产精品 | 精品一区精品二区 | 就要色综合 | 91成人精品国产刺激国语对白 | 欧美日韩国产二区三区 | 一区在线观看 | 中字幕视频在线永久在线观看免费 | 久久精品国产久精国产 | 免费男女羞羞的视频网站中文字幕 | 99av国产精品欲麻豆 | 国产成人777777 | 热久久免费视频 | 又大又硬又黄又爽视频在线观看 | 国产91精品一区二区绿帽 | 色五月情 | 国产高清视频色在线www | 国产一级二级在线 | 国产乱对白刺激视频在线观看女王 | 天天草天天干天天射 | 麻豆精品视频在线 | 精品久久久久国产免费第一页 | 日韩一级黄色片 | 最近免费中文字幕mv在线视频3 | 日精品在线观看 | 久久久夜色 | 天堂av网站 | 99综合电影在线视频 | 蜜桃视频色 | 久久国产精品久久国产精品 | 日韩精品一区在线播放 | 国产精品99久久久久久久久久久久 | 91日韩精品一区 | 激情av一区二区 | 欧美极品xxxx | 日韩av一区二区在线影视 | 成人黄色片免费看 | 天天色天天搞 | 久久99国产精品视频 | 日韩高清毛片 | www婷婷 | 日韩va亚洲va欧美va久久 | 国产精品一区二区久久精品爱涩 | 成人永久视频 | 日韩久久精品一区二区三区下载 | 91丨九色丨首页 | 啪啪免费观看网站 | 成年人在线视频观看 | 国产午夜三级一区二区三桃花影视 | 91久久在线观看 | 欧美精品少妇xxxxx喷水 | 狠狠做深爱婷婷综合一区 | av综合av| 99r在线精品 | 日韩中文字幕免费视频 | 激情av五月婷婷 | av免费在线播放 | 欧美a视频在线观看 | 天天躁日日躁狠狠躁av中文 | 国产精品美女久久 | 91资源在线观看 | 国产精品久久久久久久久岛 | 久久久久国产一区二区三区 | 久久久久久久久久免费视频 | 一区二区三区免费在线播放 | 午夜精品久久久久久久99水蜜桃 | 狠狠插天天干 | 成人国产精品免费观看 | 亚洲影院国产 | 在线а√天堂中文官网 | 亚洲精品午夜一区人人爽 | 久久久精品欧美一区二区免费 | 日韩h在线观看 | 中文字幕中文字幕在线中文字幕三区 | 中文字幕在线一区观看 | 国产一级免费视频 | 亚洲视频 在线观看 | a视频在线播放 | 97视频网站| 波多野结衣视频一区 | 久久99精品国产91久久来源 | 午夜一级免费电影 | 91精品对白一区国产伦 | 国产99久久久欧美黑人 | 免费看成人片 | 激情欧美国产 | 日韩小视频网站 | 91黄色在线观看 | 亚洲成人黄色在线观看 | 亚洲人成人99网站 | 天天色.com | 日韩一区二区在线免费观看 | 国产麻豆视频在线观看 | 五月天久久狠狠 | 99精品视频在线观看免费 | 日韩大片在线免费观看 | 久久视频在线视频 | 婷婷视频在线播放 | av免费在线网站 | 日韩在线观看高清 | 国产精品久久久久久久免费观看 | 激情欧美一区二区免费视频 | 天天操夜夜叫 | 免费在线观看黄网站 | 五月天色中色 | 欧美日韩免费在线观看视频 | 日韩av电影中文字幕 | 国产精品美女久久久 | 国产精品99久久久精品 | 亚洲aⅴ乱码精品成人区 | 久久久久亚洲精品成人网小说 | 三上悠亚一区二区在线观看 | 久久久久久久网 | 久久亚洲精品国产亚洲老地址 | 黄色中文字幕 | 中文字幕 二区 | 日本久久成人中文字幕电影 | 欧美日韩亚洲一 | 精品国产免费人成在线观看 | 四虎永久免费 | 亚洲理论在线 | 欧美成人黄色 | 国产日韩视频在线 | 日韩高清免费观看 | 国产成人久久精品77777综合 | 最近高清中文字幕在线国语5 | 国产免费国产 | 超碰精品在线 | 狠狠色伊人亚洲综合成人 | 最新av在线播放 | 欧美va电影 | 亚洲色视频 | 97精品国产97久久久久久春色 | 激情在线五月天 | 国产一级性生活 | 午夜av大片 | 日本精品视频在线播放 | 黄色精品一区二区 | 在线电影av | 国产99一区二区 | 国产精品自在线 | 久久艹影院 | 日韩免费久久 | 国产精品2018 | 一本一道波多野毛片中文在线 | 国产日韩欧美自拍 | 日本黄色免费在线观看 | 久精品一区 | 国内精品在线观看视频 | 欧美成人黄色片 | 久久久久久久久久电影 | 激情婷婷亚洲 | 欧美性一级观看 | 特级黄色视频毛片 | 成年人视频在线免费观看 | 国产精品福利一区 | 色偷偷人人澡久久超碰69 | 99热这里只有精品8 久久综合毛片 | 成人免费毛片aaaaaa片 | 欧美亚洲成人免费 | 女人高潮特级毛片 | 国产精品久久久久影院日本 | www.婷婷色| 国际精品久久久 | 69国产盗摄一区二区三区五区 | 黄色毛片视频 | 日韩精品一区二区在线观看 | 麻豆一区二区 | 国产一级片播放 | 日韩在线色视频 | 亚洲精品黄色片 | 成人免费色| 日韩高清dvd | 一区二区三区在线观看中文字幕 | 亚洲专区在线播放 | 狠狠色综合网站久久久久久久 | 视频在线在亚洲 | 在线观看一区视频 | 中文字幕免费高清在线 | 日韩av一区二区在线播放 | 美女免费视频一区 | 欧美十八| 91在线视频免费播放 | 伊人国产女 | 日日日日干 | 九九九视频精品 | 二区三区在线视频 | 国产日韩中文在线 | 亚洲 在线 | 午夜久久福利影院 | 99精品在线视频观看 | 中文字幕日韩无 | 国模精品在线 | 欧美在线日韩在线 | 亚洲欧洲精品一区二区精品久久久 | 免费看搞黄视频网站 | 麻豆 videos| 午夜精品久久久久久久久久久 | 中午字幕在线 | 91免费试看 | 9在线观看免费高清完整 | 黄a在线 | 国产成人精品综合久久久久99 | 就操操久久 | 五月婷婷综 | 国产一级黄色免费看 | 91大神免费视频 | 日韩有码在线播放 | 人人插人人草 | 久久婷婷视频 | 国内精品久久久久影院男同志 | 一级α片免费看 | 二区视频在线 | 久久久久久久久久久黄色 | 日韩成人中文字幕 | 国产在线中文字幕 | 手机在线欧美 | 国产精选在线 | 成人91在线 | 成人四虎 | 日韩网站中文字幕 | 亚洲综合在线一区二区三区 | 日韩欧美一区二区三区视频 | 午夜精品中文字幕 | 日韩专区在线观看 | 91爱爱免费观看 | 国产视频精品久久 | 在线观看国产成人av片 | 国产又黄又爽无遮挡 | 日日摸日日添夜夜爽97 | 最新国产精品拍自在线播放 | 国产综合激情 | 国产精品一区在线观看 | 一区中文字幕电影 | 欧美一级电影片 | 久久一区91| 成人黄色小说在线观看 | 视频在线国产 | 日韩激情第一页 | 久久婷亚洲五月一区天天躁 | 麻豆视频在线观看免费 | 中文字幕一区二区三区四区久久 | 亚洲a色 | 国产黄在线免费观看 | 97精品久久人人爽人人爽 | 成人高清在线 | av五月婷婷 | 热久久这里只有精品 | 亚洲黄色片一级 | 日韩网站在线免费观看 | 国产成人福利片 | 国产精品久久久久久婷婷天堂 | 中文字幕在线中文 | 四虎免费在线观看 | 久久国产精品一区二区三区 | 一区二区三区在线免费 | 亚洲春色综合另类校园电影 | av电影免费在线播放 | 黄a在线看 | 国产黄色片一级三级 | 国产你懂的在线 | 天天久久综合 | 色综合天天综合网国产成人网 | 视频在线一区二区三区 | 在线观看欧美成人 | 蜜桃麻豆www久久囤产精品 | 国产一区二区三区四区大秀 | 在线国产一区二区三区 | 国产精品美女久久久久久久 | 欧美日韩视频免费看 | 精品久久久国产 | 久久久久久久久久久久久影院 | 99福利片 | 人人爱人人爽 | 亚洲码国产日韩欧美高潮在线播放 | 国产精品视频久久 | 国产91探花| 国产精品免费久久久久久久久久中文 | 日韩免费一区二区在线观看 | 亚洲人成人天堂h久久 | 在线看国产 | 国产精品麻豆欧美日韩ww | 综合五月| 亚洲经典视频在线观看 | 免费亚洲黄色 | 国产成人精品一区二区三区网站观看 | 日韩av成人免费看 | 在线免费观看黄色 | 韩国三级一区 | 亚洲精品白浆高清久久久久久 | 亚洲精品在线观看免费 | 婷婷丁香色综合狠狠色 | 菠萝菠萝在线精品视频 | 亚洲激情在线播放 | 亚洲黄网站 | 成人综合日日夜夜 | 亚洲精品国偷拍自产在线观看蜜桃 | 成人av免费 | av在线一 | 五月婷香| a天堂在线看 | 97超碰人人模人人人爽人人爱 | 久久免费看 | 欧美精品色 | 国产高清在线免费观看 | 岛国大片免费视频 | 欧美日韩网站 | 又黄又爽的免费高潮视频 | 国产麻豆电影在线观看 | 日本在线h| 人人爽人人爽人人片av免 | 免费看的黄色 | 狠狠操狠狠干天天操 | 国产精品1区 | 在线视频精品播放 | 日本中文字幕在线播放 | 中文字幕在线免费看 | 在线中文字幕播放 | 中文字幕精品久久 | 99久久精品免费看国产四区 | 国产精品久久久久久久久免费看 | 国产香蕉视频在线播放 | 国产精品黑丝在线观看 | 久久婷婷色综合 | av女优中文字幕在线观看 | 欧美91片 | 欧美在线91 | 欧美日本啪啪无遮挡网站 | 91香蕉视频在线下载 | 亚洲国产中文字幕在线观看 | 久久久久这里只有精品 | 久草视频99 | 婷婷av网| 亚洲精品综合在线 | 色吧av色av | 丁香 久久 综合 | 99久久精品免费看国产四区 | 久久久精品在线观看 | 精品国产乱码久久久久久三级人 | 天天操夜 | 成人国产网站 | 中文字幕成人网 | 欧美午夜久久 | 国产午夜精品av一区二区 | 激情五月***国产精品 | 91人人澡人人爽 | 特级毛片网站 | 国产精品观看在线亚洲人成网 | 丝袜美腿在线播放 | 午夜精品三区 | 精品国产诱惑 | 精品日韩中文字幕 | 青青河边草手机免费 | 日韩免费播放 | 99久久这里有精品 | 国产高清视频 | 涩涩网站免费 | 蜜臀av性久久久久蜜臀aⅴ涩爱 | 国产精品一区免费在线观看 | 91激情小视频 | 国产高清永久免费 | 欧美另类老妇 | 在线视频观看你懂的 | 97热久久免费频精品99 | 国产高清av免费在线观看 | 色偷偷人人澡久久超碰69 | 成年人黄色大片在线 | 国产精品美乳一区二区免费 | 69国产盗摄一区二区三区五区 | 91视频在线观看大全 | 天天操操 | 91免费的视频在线播放 | 久久精品成人 | 不卡电影免费在线播放一区 | 9色在线视频 | 国产福利91精品一区 | 亚洲精品午夜久久久久久久 | 69av视频在线 | 亚洲成年人在线播放 | 亚洲日本成人网 | 国产玖玖视频 | 超碰免费在线公开 | 国产精品女同一区二区三区久久夜 | 在线看国产视频 | 在线国产一区二区 | 三级av小说 | 亚洲网久久| 欧美亚洲国产一卡 | 999ZYZ玖玖资源站永久 | 中文字幕亚洲综合久久五月天色无吗'' | 2021久久| 国产午夜精品一区 | 国产精品18久久久久久久久久久久 | 成人久久久久 | 国产精品国产自产拍高清av | 婷婷久久综合网 | 操操操av| 色婷婷中文| 久久国产精品色av免费看 | 亚洲精品免费在线观看 | 午夜手机电影 | 国产精品日韩久久久久 | av在线电影免费观看 | 在线观看成人 | 久久免费视频在线观看 | 久久av黄色 | 超碰97国产在线 | 亚洲婷婷伊人 | 日韩国产精品一区 | 四川妇女搡bbbb搡bbbb搡 | 四虎欧美 | 夜夜看av| 在线最新av| 国产91av视频在线观看 | 久久久久久久久久久成人 | 久久伊人色综合 | 97夜夜澡人人爽人人免费 | 亚洲一区av | 麻豆久久| 亚洲精品美女久久17c | 深夜福利视频一区二区 | 五月香视频在线观看 | 亚洲理论视频 | 色中文字幕在线观看 | 中文字幕在线观看不卡 | 国产黄色视 | 中文字幕在线观看完整版 | 日韩在线观看第一页 | 日韩一级成人av | 天天色综合久久 | 免费三级黄色片 | 久久中文网 | 欧美激情综合五月色丁香 | 波多野结衣电影一区二区 | 日韩欧美大片免费观看 | 不卡电影免费在线播放一区 | 成人av一区二区在线观看 | 在线观看国产区 | 日韩黄色在线观看 | 日本三级中文字幕在线观看 | 亚洲国产最新 | 91cn国产在线| 国产午夜精品福利视频 | 中文有码在线 | 人人爽人人爽人人片av免 | 婷婷综合亚洲 | 麻豆观看| 射九九| 久久久免费精品国产一区二区 | 视频在线99re| 国产视频资源 | 99精品偷拍视频一区二区三区 | 天天拍天天爽 | 国产成人久久久77777 | 精品一区二区在线观看 | 99久久99久久综合 | 色姑娘综合天天 | 97精品国产91久久久久久久 | 久久精品艹 | 久久露脸国产精品 | 日韩av在线一区二区 | 久久99深爱久久99精品 | 99国产精品久久久久久久久久 | 久久99视频精品 | 亚洲精品一区二区三区高潮 | 国产精品资源在线观看 | 久久免费福利 | 99精品视频在线免费观看 | 蜜桃传媒一区二区 | 久草在线免费新视频 | 天天干人人 | 国产色在线 | 精品国产乱码久久久久久天美 | 黄色国产高清 | 国产精品免费一区二区三区 | 91精品国产乱码久久桃 | 国产精品毛片久久 | 婷婷精品视频 | 天天操夜夜拍 | 国产精品私人影院 | 国产韩国日本高清视频 | 高清精品在线 | 国产不卡视频 | 有码中文字幕在线观看 | 在线影视 一区 二区 三区 | 日韩特级片| 成人一区二区三区中文字幕 | av免费观看网站 | 丁香五月亚洲综合在线 | 欧美在线观看视频一区二区 | 国产尤物在线 | 在线电影日韩 | 欧美少妇xxxxxx | 亚洲观看黄色网 | 丁香综合五月 | 久久视频精品在线 | 麻豆传媒一区二区 | 黄色小说免费观看 | 夜夜躁狠狠躁日日躁 | 久草国产精品 | 麻豆激情电影 | 久久免费视频国产 | 日本三级不卡视频 | 美女视频黄在线观看 | 国产精品一区免费看8c0m | 日韩国产精品久久久久久亚洲 | 精品在线视频观看 | 四虎国产精品永久在线国在线 | 99热这里| 91精品视频在线免费观看 | 国产 色| 日韩理论影院 | 综合激情婷婷 | 99re久久精品国产 | 欧美少妇xxx | 97碰碰碰 | 最新色视频 | 色综合天天综合 | 男女激情免费网站 | 国产成人精品亚洲日本在线观看 | 日韩视频在线不卡 | 欧美成人xxx| 91精品国自产在线 | 天天爽天天搞 | 日韩在线视频一区二区三区 | 日韩免费看片 | 91丨九色丨蝌蚪丰满 | 91亚洲狠狠婷婷综合久久久 | 91女神的呻吟细腰翘臀美女 | 久久九九影院 | 亚洲狠狠操| 久久久久久久免费 | 欧美91精品久久久久国产性生爱 | 日韩和的一区二在线 | 国产精品久久久久久久久久久免费看 | 色www精品视频在线观看 | 亚洲清纯国产 | 国产中文字幕第一页 | 成人 亚洲 欧美 | 久久在线免费观看 | 久久久精品国产免费观看同学 | 欧美一区二区在线免费观看 | 中国一级特黄毛片大片久久 | 精品久久久久免费极品大片 | 日韩r级在线 | 人人揉人人揉人人揉人人揉97 | 免费在线观看av网站 | 综合铜03 | 亚洲国产大片 | 中文在线a天堂 | 欧美在线资源 | 久久ww| avlulu久久精品 | 国产精品一区二区三区四 | av资源免费在线观看 | 国精产品一二三线999 | 啪啪免费观看网站 | www.com在线观看 | 久久99热精品这里久久精品 | www.午夜| 亚洲黄色小说网址 | 午夜av免费观看 | 国产高清黄色 | 丁香色婷 | 国产精品欧美激情在线观看 | 亚洲午夜久久久久久久久 | 怡红院av| 99看视频在线观看 | 国产精品黄色 | 久久久久免费看 | 91九色蝌蚪视频 | 精品美女久久久久 | 18pao国产成视频永久免费 | 欧美日本日韩aⅴ在线视频 插插插色综合 | 久久精品99北条麻妃 | 国产久草在线观看 | 亚洲视频资源在线 | 欧美 日韩 国产 成人 在线 | 91久久精品日日躁夜夜躁国产 | 久久免费视频在线观看6 | 爱情影院aqdy鲁丝片二区 | 国产不卡一 | 91成人亚洲 | 国产成人黄色网址 | 免费黄色av片 | 国产一级免费av | 欧美日韩国产色综合一二三四 | 日韩二区在线观看 | 国产精品尤物 | 久久99精品国产麻豆宅宅 | 中文字幕一二三区 | 五月婷婷开心 | 久久久精品欧美一区二区免费 | 97超碰超碰久久福利超碰 | 成人免费影院 | 波多野结衣小视频 | 亚洲2019精品 | 亚洲精品日韩在线观看 | 久久精品欧美视频 | 亚洲精品久 | 亚洲日本国产精品 | 国产黄色片在线免费观看 | 在线a亚洲视频播放在线观看 | 91在线蜜桃臀 | 97超级碰碰碰碰久久久久 | 中文字幕日韩免费视频 | 亚洲国产精品传媒在线观看 | 天天想夜夜操 | 亚洲午夜精品久久久 | 麻豆视传媒官网免费观看 | 欧美激情综合五月色丁香小说 | 欧美一级电影在线观看 | 国产黄色视 | 日韩精品视频第一页 | 色视频在线观看免费 | 成人动图 | 最新中文在线视频 | 国产玖玖精品视频 | 亚洲精品久久久久久久蜜桃 | www.国产在线观看 | 亚洲一区动漫 | 四虎在线观看精品视频 | a在线播放 | 日女人电影 | 国产视频 亚洲视频 | 在线va视频| 国产91精品一区二区 | 日韩r级电影在线观看 | 精品视频免费 |