當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深入理解FFM原理与实践

發(fā)布時間：2025/3/21 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了深入理解FFM原理与实践小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

原文：http://tech.meituan.com/deep-understanding-of-ffm-principles-and-practices.html

深入理解FFM原理與實(shí)踐

del2z, 大龍?·2016-03-03 09:00

FM和FFM模型是最近幾年提出的模型，憑借其在數(shù)據(jù)量比較大并且特征稀疏的情況下，仍然能夠得到優(yōu)秀的性能和效果的特性，屢次在各大公司舉辦的CTR預(yù)估比賽中獲得不錯的戰(zhàn)績。美團(tuán)點(diǎn)評技術(shù)團(tuán)隊(duì)在搭建DSP的過程中，探索并使用了FM和FFM模型進(jìn)行CTR和CVR預(yù)估，并且取得了不錯的效果。本文旨在把我們對FM和FFM原理的探索和應(yīng)用的經(jīng)驗(yàn)介紹給有興趣的讀者。

前言

在計(jì)算廣告領(lǐng)域，點(diǎn)擊率CTR（click-through rate）和轉(zhuǎn)化率CVR（conversion rate）是衡量廣告流量的兩個關(guān)鍵指標(biāo)。準(zhǔn)確的估計(jì)CTR、CVR對于提高流量的價(jià)值，增加廣告收入有重要的指導(dǎo)作用。預(yù)估CTR/CVR，業(yè)界常用的方法有人工特征工程 + LR(Logistic Regression)、GBDT(Gradient Boosting Decision Tree) + LR[1][2][3]、FM（Factorization Machine）[2][7]和FFM（Field-aware Factorization Machine）[9]模型。在這些模型中，FM和FFM近年來表現(xiàn)突出，分別在由Criteo和Avazu舉辦的CTR預(yù)測競賽中奪得冠軍[4][5]。

考慮到FFM模型在CTR預(yù)估比賽中的不俗戰(zhàn)績，美團(tuán)點(diǎn)評技術(shù)團(tuán)隊(duì)在搭建DSP（Demand Side Platform）[6]平臺時，在站內(nèi)CTR/CVR的預(yù)估上使用了該模型，取得了不錯的效果。本文是基于對FFM模型的深度調(diào)研和使用經(jīng)驗(yàn)，從原理、實(shí)現(xiàn)和應(yīng)用幾個方面對FFM進(jìn)行探討，希望能夠從原理上解釋FFM模型在點(diǎn)擊率預(yù)估上取得優(yōu)秀效果的原因。因?yàn)镕FM是在FM的基礎(chǔ)上改進(jìn)得來的，所以我們首先引入FM模型，本文章節(jié)組織方式如下：

首先介紹FM的原理。

其次介紹FFM對FM的改進(jìn)。

然后介紹FFM的實(shí)現(xiàn)細(xì)節(jié)。

最后介紹模型在DSP場景的應(yīng)用。

FM原理

FM（Factorization Machine）是由Konstanz大學(xué)Steffen Rendle（現(xiàn)任職于Google）于2010年最早提出的，旨在解決稀疏數(shù)據(jù)下的特征組合問題[7]。下面以一個示例引入FM模型。假設(shè)一個廣告分類的問題，根據(jù)用戶和廣告位相關(guān)的特征，預(yù)測用戶是否點(diǎn)擊了廣告。源數(shù)據(jù)如下[8]

Clicked?CountryDayAd_type

1	USA	26/11/15	Movie
0	China	1/7/14	Game
1	China	19/2/15	Game

"Clicked?"是label，Country、Day、Ad_type是特征。由于三種特征都是categorical類型的，需要經(jīng)過獨(dú)熱編碼（One-Hot Encoding）轉(zhuǎn)換成數(shù)值型特征。

Clicked?Country=USACountry=ChinaDay=26/11/15Day=1/7/14Day=19/2/15Ad_type=MovieAd_type=Game

1	1	0	1	0	0	1	0
0	0	1	0	1	0	0	1
1	0	1	0	0	1	0	1

由上表可以看出，經(jīng)過One-Hot編碼之后，大部分樣本數(shù)據(jù)特征是比較稀疏的。上面的樣例中，每個樣本有7維特征，但平均僅有3維特征具有非零值。實(shí)際上，這種情況并不是此例獨(dú)有的，在真實(shí)應(yīng)用場景中這種情況普遍存在。例如，CTR/CVR預(yù)測時，用戶的性別、職業(yè)、教育水平、品類偏好，商品的品類等，經(jīng)過One-Hot編碼轉(zhuǎn)換后都會導(dǎo)致樣本數(shù)據(jù)的稀疏性。特別是商品品類這種類型的特征，如商品的末級品類約有550個，采用One-Hot編碼生成550個數(shù)值特征，但每個樣本的這550個特征，有且僅有一個是有效的（非零）。由此可見，數(shù)據(jù)稀疏性是實(shí)際問題中不可避免的挑戰(zhàn)。

One-Hot編碼的另一個特點(diǎn)就是導(dǎo)致特征空間大。例如，商品品類有550維特征，一個categorical特征轉(zhuǎn)換為550維數(shù)值特征，特征空間劇增。

同時通過觀察大量的樣本數(shù)據(jù)可以發(fā)現(xiàn)，某些特征經(jīng)過關(guān)聯(lián)之后，與label之間的相關(guān)性就會提高。例如，“USA”與“Thanksgiving”、“China”與“Chinese New Year”這樣的關(guān)聯(lián)特征，對用戶的點(diǎn)擊有著正向的影響。換句話說，來自“China”的用戶很可能會在“Chinese New Year”有大量的瀏覽、購買行為，而在“Thanksgiving”卻不會有特別的消費(fèi)行為。這種關(guān)聯(lián)特征與label的正向相關(guān)性在實(shí)際問題中是普遍存在的，如“化妝品”類商品與“女”性，“球類運(yùn)動配件”的商品與“男”性，“電影票”的商品與“電影”品類偏好等。因此，引入兩個特征的組合是非常有意義的。

多項(xiàng)式模型是包含特征組合的最直觀的模型。在多項(xiàng)式模型中，特征?

y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1nwijxixj(1)(1)y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1nwijxixj

其中，

從公式

那么，如何解決二次項(xiàng)參數(shù)的訓(xùn)練問題呢？矩陣分解提供了一種解決思路。在model-based的協(xié)同過濾中，一個rating矩陣可以分解為user矩陣和item矩陣，每個user和item都可以采用一個隱向量表示[8]。比如在下圖中的例子中，我們把每個user表示成一個二維向量，同時把每個item表示成一個二維向量，兩個向量的點(diǎn)積就是矩陣中user對item的打分。

類似地，所有二次項(xiàng)參數(shù)?

y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,vj?xixj(2)(2)y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,vj?xixj

其中，

顯而易見，公式

∑i=1n∑j=i+1n?vi,vj?xixj=12∑f=1k??(∑i=1nvi,fxi)2?∑i=1nv2i,fx2i??(3)(3)∑i=1n∑j=i+1n?vi,vj?xixj=12∑f=1k((∑i=1nvi,fxi)2?∑i=1nvi,f2xi2)

我們再來看一下FM的訓(xùn)練復(fù)雜度，利用SGD（Stochastic Gradient Descent）訓(xùn)練模型。模型各個參數(shù)的梯度如下

??θy(x)=?????1,xi,xi∑nj=1vj,fxj?vi,fx2i,ifθisw0ifθiswiifθisvi,f??θy(x)={1,ifθisw0xi,ifθiswixi∑j=1nvj,fxj?vi,fxi2,ifθisvi,f

其中，

FM與其他模型的對比

FM是一種比較靈活的模型，通過合適的特征變換方式，FM可以模擬二階多項(xiàng)式核的SVM模型、MF模型、SVD++模型等[7]。

相比SVM的二階多項(xiàng)式核而言，FM在樣本稀疏的情況下是有優(yōu)勢的；而且，FM的訓(xùn)練/預(yù)測復(fù)雜度是線性的，而二項(xiàng)多項(xiàng)式核SVM需要計(jì)算核矩陣，核矩陣復(fù)雜度就是N平方。

相比MF而言，我們把MF中每一項(xiàng)的rating分改寫為?

FFM原理

FFM（Field-aware Factorization Machine）最初的概念來自Yu-Chin Juan（阮毓欽，畢業(yè)于中國臺灣大學(xué)，現(xiàn)在美國Criteo工作）與其比賽隊(duì)員，是他們借鑒了來自Michael Jahrer的論文[14]中的field概念提出了FM的升級版模型。通過引入field的概念，FFM把相同性質(zhì)的特征歸于同一個field。以上面的廣告分類為例，“Day=26/11/15”、“Day=1/7/14”、“Day=19/2/15”這三個特征都是代表日期的，可以放到同一個field中。同理，商品的末級品類編碼生成了550個特征，這550個特征都是說明商品所屬的品類，因此它們也可以放到同一個field中。簡單來說，同一個categorical特征經(jīng)過One-Hot編碼生成的數(shù)值特征都可以放到同一個field，包括用戶性別、職業(yè)、品類偏好等。在FFM中，每一維特征?

假設(shè)樣本的?

y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,fj,vj,fi?xixj(4)(4)y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1n?vi,fj,vj,fi?xixj

其中，

下面以一個例子簡單說明FFM的特征組合方式[9]。輸入記錄如下

UserMovieGenrePrice

YuChin

3Idiots

Comedy, Drama

$9.99

這條記錄可以編碼成5個特征，其中“Genre=Comedy”和“Genre=Drama”屬于同一個field，“Price”是數(shù)值型，不用One-Hot編碼轉(zhuǎn)換。為了方便說明FFM的樣本格式，我們將所有的特征和對應(yīng)的field映射成整數(shù)編號。

Field nameField indexFeature nameFeature index

User	1	User=YuChin	1
Movie	2	Movie=3Idiots	2
Genre	3	Genre=Comedy	3
Price	4	Genre=Drama	4
?	?	Price	5

那么，FFM的組合特征有10項(xiàng)，如下圖所示。

?v1,2,v2,1??1?1+?v1,3,v3,1??1?1+?v1,3,v4,1??1?1+?v1,4,v5,1??1?9.99+?v2,3,v3,

轉(zhuǎn)載于:https://www.cnblogs.com/zhizhan/p/5238415.html

總結(jié)

以上是生活随笔為你收集整理的深入理解FFM原理与实践的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

原理
FFM

上一篇：七天学会ASP.NET MVC (五)—
下一篇：《Build your own Angu