日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深度神经网络:WX+b vs XW+b

發(fā)布時間:2025/6/16 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 深度神经网络:WX+b vs XW+b 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者:chen_h
微信號 & QQ:862251340
微信公眾號:coderpai
我的博客:請點擊這里

在大多數(shù)的神經(jīng)網(wǎng)絡(luò)教科書中,神經(jīng)網(wǎng)絡(luò)一般都會使用 y = WX+B 或者 y = XW+B 的形式。但是在 tensorflow 或者 theano 中,神經(jīng)網(wǎng)絡(luò)的實現(xiàn)都是采用了 y = XW+B 的形式。這是為什么呢?我花了很多的時間去查找資料,最后發(fā)現(xiàn)一點,可能是 y = XW+B 計算導(dǎo)數(shù)比 y = WX+B 容易。

從理論上講,XW+B 和 WX+B 在神經(jīng)網(wǎng)絡(luò)中是等價的(其實就是一個矩陣的轉(zhuǎn)置)。然而,當我們計算兩者的導(dǎo)數(shù)的時候卻差別很大。我們通過具體的數(shù)學推導(dǎo)來感受一下吧。

比如:y = XW

比如:y = WX

原文

matrix cookbook


CoderPai 是一個專注于算法實戰(zhàn)的平臺,從基礎(chǔ)的算法到人工智能算法都有設(shè)計。如果你對算法實戰(zhàn)感興趣,請快快關(guān)注我們吧。加入AI實戰(zhàn)微信群,AI實戰(zhàn)QQ群,ACM算法微信群,ACM算法QQ群。詳情請關(guān)注 “CoderPai” 微信號(coderpai)。


總結(jié)

以上是生活随笔為你收集整理的深度神经网络:WX+b vs XW+b的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。