當前位置：首頁 >

ktt算法约化_推荐系统的多目标优化(4)-PE-LTR

發(fā)布時間：2025/4/5 37 豆豆

生活随笔收集整理的這篇文章主要介紹了 ktt算法约化_推荐系统的多目标优化(4)-PE-LTR 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

[toc]

1. 提出背景

電商場景下，需要同時優(yōu)化GMV和CTR，但這兩個優(yōu)化目標并不是嚴格相關(guān)的，甚至是沖突的。當CTR/GMV最優(yōu)時，另一個可能是次優(yōu)甚至是不好的。

因此，該問題可以看作是尋找帕累托最優(yōu)的問題來處理。現(xiàn)有的帕累托優(yōu)化方法有兩種，一種是啟發(fā)式搜索(heuristic search)，缺點是不能保證帕累托最優(yōu)；另一種是標量化方法(scalarization)，缺點是需要手動指定權(quán)重。

帕累托最優(yōu)(Pareto Optimum)：也稱為帕累托效率(Pareto Efficiency)。形象解釋的話，在該狀態(tài)下，“從此以后，非損人不能利己”。

作者在KKT條件下提出PE-LTR(Pareto-Efficient Learning to Rank)，有LTR過程優(yōu)化多個目標。

2. PE-LTR

該算法偏向于理論證明，本節(jié)先對算法整體步驟進行描述，然后對其中的關(guān)鍵步驟進行推導。

2.1 算法描述

定義多目標問題的目標函數(shù)：

其中，$ L_i(\theta)$ 為單目標的損失函數(shù)，$w_i$ 為該目標的權(quán)值，滿足$\sum_{i=1}^Kw_i=1,w_i \geq c_i$。

用SGD更新參數(shù)$\theta$ ：

通過 PECsolver算法更新 k 個 $w_i$，算法如下；

定義帕累托最優(yōu)條件(Pareto Efficient Condition)：

將$w_i=\hat w_i+c_i$代入，得到等價的松弛問題：

通過求解定理 (后面推導中給出) 和投影，得到非負最小二乘問題：

通過求解最小二乘問題，得到所有 $w_i$ 的值。

聚合得到損失：

2.2 基于KTT的求解定理推導

上文中的公式

可以改寫為：

拉格朗日函數(shù)：

偏導數(shù)為0，得：

可以改寫為：

得解：

3. 實驗結(jié)果

3.1 實驗數(shù)據(jù)

開源了一個數(shù)據(jù)集：EC-REC，包含展現(xiàn)、點擊、購買三種標簽，700w條。

3.2 實驗結(jié)果

對照方法：

LambdaMART：一種LTR方法，實驗中只考慮點擊來排序，不考慮購買。

LETORIF ：最大化 GMV 的LTR方法，采用 price*CTR*CVR 進行排序， CTR 和 CVR 由兩個單獨模型預測。

MTL-REC ：即ESMM，排序模型也是 price*CTR*CVR，底層emb共享。

CXR-RL ：使用強化學習技術(shù)來優(yōu)化 CXR(CTR和CVR的組合)，從而實現(xiàn) CTR 和 CVR 之間的平衡。

PO-EA ：一種多目標優(yōu)化方法，用演化算法生成權(quán)重，尋找帕累托有效的解。

PO-EA-CTR ，PO-EA-GMV：由 PO-EA 生成的兩個解決方案，分別針對 CTR 和 GMV。

PE-LTR-CTR，PE-LTR-GMV：由 PE-LTR 生成的兩個解決方案，分別針對 CTR 和 GMV。

評價指標：

用NDCG，MAP評估CTR；

用改造的G-NDCG，G-MAP評估GMV；

實驗結(jié)果：

在低CTR損失下，最優(yōu)化了GMV，整體效果最佳；

相較于ESMM，PE-LTR用一個模型聯(lián)合學習點擊和購買，而ESMM用兩個模型來學習點擊和購買，后者可能會導致不一致性；

4. 代碼復現(xiàn)

帕累托最優(yōu)本身等價于對任務賦予合理的權(quán)值，不改變模型。單加權(quán)取得兩位數(shù)的指標收益，有些夸張，不確定是否存在計算陷阱問題；所以對原文進行復現(xiàn)。

4.1 求解定理實現(xiàn)

輸入：權(quán)值w，閾值c，梯度矩陣G

說明：完成論文中附錄定理的求解，得到 hat_w

def pareto_step(w, c, G):

"""

ref:http://ofey.me/papers/Pareto.pdf

K : the number of task

M : the dim of NN's params

:param W: # (K,1)

:param C: # (K,1)

:param G: # (K,M)

:return:

"""

GGT = np.matmul(G, np.transpose(G)) # (K, K)

e = np.mat(np.ones(np.shape(w))) # (K, 1)

m_up = np.hstack((GGT, e)) # (K, K+1)

m_down = np.hstack((np.transpose(e), np.mat(np.zeros((1, 1))))) # (1, K+1)

M = np.vstack((m_up, m_down)) # (K+1, K+1)

z = np.vstack((-np.matmul(GGT, c), 1 - np.sum(c))) # (K+1, 1)

hat_w = np.matmul(np.matmul(np.linalg.inv(np.matmul(np.transpose(M), M)), M), z) # (K+1, 1)

hat_w = hat_w[:-1] # (K, 1)

hat_w = np.reshape(np.array(hat_w), (hat_w.shape[0],)) # (K,)

c = np.reshape(np.array(c), (c.shape[0],)) # (K,)

new_w = ASM(hat_w, c)

return new_w

4.2 有效集求解非負最小二乘

輸入：求得的解hat_w，閾值c

說明：根據(jù)ASM和閾值的約束，求解得到滿足條件的 new_w

from scipy.optimize import minimize

from scipy.optimize import nnls

def ASM(hat_w, c):

"""

ref:

http://ofey.me/papers/Pareto.pdf,

https://stackoverflow.com/questions/33385898/how-to-include-constraint-to-scipy-nnls-function-solution-so-that-it-sums-to-1

:param hat_w: # (K,)

:param c: # (K,)

:return:

"""

A = np.array([[0 if i != j else 1 for i in range(len(c))] for j in range(len(c))])

b = hat_w

x0, _ = nnls(A, b)

def _fn(x, A, b):

return np.linalg.norm(A.dot(x) - b)

cons = {'type': 'eq', 'fun': lambda x: np.sum(x) + np.sum(c) - 1}

bounds = [[0., None] for _ in range(len(hat_w))]

min_out = minimize(_fn, x0, args=(A, b), method='SLSQP', bounds=bounds, constraints=cons)

new_w = min_out.x + c

return new_w

4.3 完整代碼

通過簡單實驗，發(fā)現(xiàn)帕累托最優(yōu)容易在迭代過程中收斂到閾值，如果不設(shè)置閾值，則容易最后優(yōu)化一個單獨的任務。

總結(jié)

以上是生活随笔為你收集整理的ktt算法约化_推荐系统的多目标优化(4)-PE-LTR的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： linux同名文件夹覆盖_第一天：Lin
下一篇： java逻辑第九章_深入理解jvm-(第

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

ktt算法 约化_推荐系统的多目标优化(4)-PE-LTR

總結(jié)

ktt算法约化_推荐系统的多目标优化(4)-PE-LTR