浅析eBay联盟营销的上下文广告机制
作者|eBay
譯者|Sambodhi
編輯|Natalie
AI 前線導(dǎo)讀: 上下文廣告是與內(nèi)容匹配的網(wǎng)絡(luò)廣告,比如,用戶在網(wǎng)絡(luò)上瀏覽信息,如果看到汽車相關(guān)的文章,就會看到汽車銷售、汽車保險、汽車雜志相關(guān)的廣告。上下文廣告會成為智能廣告的前奏。eBay 聯(lián)盟營銷的上下文廣告做得相當(dāng)出色,今天我們就來看看 eBay 是如何將自家的上下文廣告做到極致的。
eBay 利用各種營銷渠道將新客戶和現(xiàn)有客戶匯集到該網(wǎng)站,其中之一就是 eBay 的聯(lián)盟計劃。eBay 還提供工具包來幫助發(fā)布商 / 分支機構(gòu)增加傭金。有些工具可在 eBay 網(wǎng)站上購物時創(chuàng)建可跟蹤的鏈接。至于更復(fù)雜的工具,如我們的 API,可以支持自定義訪問 eBay 的產(chǎn)品列表數(shù)據(jù)。例如,用戶可以創(chuàng)建橫幅來添加實時的 eBay 清單到自己的網(wǎng)站。本文討論了如何根據(jù)頁面內(nèi)容在發(fā)布商網(wǎng)站進(jìn)行上下文廣告。這種方法的亮點包括:
- 根據(jù)頁面內(nèi)容,通過算法確定如何識別出頁面的標(biāo)題 / 相關(guān)關(guān)鍵詞。
- 忽略凌亂的 HTML 內(nèi)容,只篩選相關(guān)和重要的關(guān)鍵詞。
- 在不丟失推薦關(guān)鍵詞的相關(guān)性的情況下,隨著網(wǎng)址數(shù)量的增加進(jìn)行擴(kuò)展。
- 使用經(jīng)測試并確認(rèn)有效的 eBay 搜索算法,提供相關(guān)的 eBay 條目,在發(fā)布者頁面上呈現(xiàn)。
- 僅當(dāng)頁面返回積極情緒時才觸發(fā)條目呈現(xiàn)算法。我們已根據(jù)內(nèi)容和上下文,為每個 HTML 頁面構(gòu)建了情緒預(yù)測算法。
聯(lián)盟營銷模式
聯(lián)盟營銷是一個網(wǎng)上推薦項目,商家向發(fā)布商支付他們所提到的客戶銷售的傭金。
AI 前線:Affiliate Marketing,中文可以理解為聯(lián)盟推廣,也叫聯(lián)盟營銷,傭金計算方式是按成交付費,也即是 CPS。Affiliate Marketing 的優(yōu)點是傭金往往比較客觀。Affiliate Marketing 是一種由來已久的推廣方式,由你向某個人推廣某一個產(chǎn)品,當(dāng)那個人通過你的推廣購買了產(chǎn)品時,你就可以獲得傭金。傭金的多少取決于你推廣的產(chǎn)品。有很多方法可以向訪問我們合作伙伴網(wǎng)站的客戶提供相關(guān)廣告:
在本文中,我們將討論如何發(fā)布就廣告內(nèi)容相關(guān)的廣告,并討論一些我們用來實現(xiàn)業(yè)務(wù)目標(biāo)的幾個算法。
算法 1:基于主題建模和頁面標(biāo)題
處理流程:
詳細(xì)過程:
算法:為頁面內(nèi)容生成一大堆單詞,對否定詞進(jìn)行懲罰,并對正面單詞進(jìn)行獎勵,然后計算整個頁面的得分。
- 一旦頁面被抓取,我們通過刪除停止字、特殊字符、標(biāo)點、空格等清理網(wǎng)站內(nèi)容,以獲得文獻(xiàn)術(shù)語相關(guān)矩陣(Document Term Matrix,DTM)。DTM 包含頁面上的單詞列表及其相關(guān)的頻率計數(shù)(通常也成為術(shù)語頻率)。
- 然后我們運行三個單獨的通用情感詞典,如 AFINN、Bing 和 nrc(由 Finn Arup Nielsen、bing Liu 及其合作者 Saif Mohammad、Peter Turney 編纂)。所有這三個詞典都是基于一元模型(unigrams),即單個單詞。這些詞典包含了許多英語單詞,這些單詞被賦予積極 / 消極情緒的分?jǐn)?shù),也可能是諸如喜歡、憤怒、悲傷等情緒。nrc 詞典將單詞以而二進(jìn)制形式分類(是 / 否)分為積極、消極、憤怒、期待、延誤、恐懼、喜悅、悲傷、驚訝和信任。Bing 詞典以“二元”方式將單詞分為“褒義”“貶義”兩類。而 AFINN 詞典則給單詞打分,分?jǐn)?shù)在 -5 到 5 之間,負(fù)分表示消極情緒,正分表示積極情緒。
- 該頁面必須有三個詞典中的兩個才能返回正分?jǐn)?shù),以便將 URL 視為正數(shù)。
這種簡單易行的檢測情緒的方法是強大而準(zhǔn)確的,我們構(gòu)建了一個人工判斷工具來整理算法的效率。實現(xiàn)了誤分類率為 16%,這意味著 84% 的時間,算法預(yù)測了頁面的實際情緒。
4. 確定相關(guān)的關(guān)鍵字
- 基于內(nèi)容: 我們采用 Gibbs 抽樣(Gibbs Sampling)來運行 LDA 主題建模算法,獲得兩個主題,每個主題有三個關(guān)鍵詞,以概率最高的術(shù)語被作為頁面的關(guān)鍵詞。少于一次的單詞則從集合中予以刪除。
- 基于頁面的標(biāo)題: 我們拉取頁面的標(biāo)題,進(jìn)行解析并過濾出名詞(單復(fù)數(shù))、專用名詞(單復(fù)數(shù))、外來詞和基數(shù)詞,并根據(jù)標(biāo)題,基于它們在網(wǎng)頁上出現(xiàn)的頻率從中抽取前三個關(guān)鍵詞。
然后將上述兩種方法生成的關(guān)鍵詞結(jié)合起來,根據(jù)頁面出現(xiàn)的頻率,從結(jié)合中取出前三個唯一關(guān)鍵詞。
AI 前線:Gibbs 抽樣是 Metropolis Hastings 算法的一個特例。MH 算法利用了馬爾可夫鏈的細(xì)致平衡,從而獲得了聯(lián)合分布的采樣。有了聯(lián)合分布的采樣我們就可以得到邊緣分布,而這在貝葉斯推斷中求后驗分布有重要作用。主題建模概念
- 主題建模是一種無監(jiān)督的方法,可自動識別出出現(xiàn)在文本中的主題,并派生出文本語料庫所展現(xiàn)的隱藏模式。粗略地說,一個主題是在詞匯表中一組術(shù)語的概率分布,可以看做是“在語料庫中共同出現(xiàn)的術(shù)語的重復(fù)模式”。
- 主題模型與基于規(guī)則的方法不同,它們使用正則表達(dá)式或者基于詞典的關(guān)鍵詞搜索技術(shù)。
- 我們使用隱狄利克雷分布(Latent Dirichlet Allocation,LDA)進(jìn)行主題建模。它是一種矩陣分解技術(shù),是潛在語義索引(Latent Semantic Indexing,LSI)的概率版本,試圖提取數(shù)據(jù)中的潛在因素,即“主題”。
算法 2:基于頁面的標(biāo)題
該算法基于頁面標(biāo)題和副標(biāo)題的詞頻。
- 一旦網(wǎng)站被搜尋(我們使用 HTML 標(biāo)簽<div>和<p>中的內(nèi)容),通過移除停用詞、特殊字符、標(biāo)點符號、空格等來清除站點內(nèi)容,獲取包含單詞列表及其相關(guān)頻率的文檔。
- 然后,我們只抓取頁面的標(biāo)題和副標(biāo)題 (<h1到h6>),只過濾名詞 (單數(shù)和復(fù)數(shù))、專有名詞 (單數(shù)和復(fù)數(shù))、外來詞,以及標(biāo)題和副標(biāo)題上的基數(shù)詞。
- 然后,我們在實際頁面內(nèi)容上獲取最常見的三個標(biāo)題 / 副標(biāo)題,并將這三個關(guān)鍵字傳遞給搜索服務(wù)。
5. 調(diào)用 eBay search API 來獲取關(guān)鍵詞——一旦為各網(wǎng)頁提供了關(guān)鍵詞,就會將其傳遞到我們的搜索服務(wù) API 中,以獲得條目推薦。
示例
URL: mashable.com/2017/10/25/…
算法 1 展示了《怪奇物語》(Stranger Things)的紀(jì)念品,而算法 2 則展示了《怪奇物語》的魔王海報。這是因為算法 1 缺少“海報”關(guān)鍵詞,這正是本文要討論的內(nèi)容。
我們從用戶的判斷工具中選擇了算法 2 和算法 1,并進(jìn)行比較,算法 2 的表現(xiàn)優(yōu)于算法 1。
結(jié)果: 這個簡單而有效的算法在收集大量網(wǎng)址的反饋過程中,經(jīng)過多輪人工判斷,我們發(fā)現(xiàn):
- 觸發(fā)關(guān)鍵字生成算法的情緒算法能夠預(yù)測頁面的正確情緒,高達(dá) 84%。
- 與算法 1 相比,針對關(guān)鍵詞的算法 2,及之后的 eBay 條目生成得到了更高的反饋分?jǐn)?shù)(在人工判斷工具中以 5 分為滿分,則大于 3.5 分)。
- 每個網(wǎng)址都有一個新的 eBay 類別預(yù)測算法,如果沒有關(guān)鍵詞生成算法的結(jié)果,則會使用這個算法。
- 此外,營銷數(shù)據(jù)科學(xué)團(tuán)隊正致力于基于頁面上顯示的圖像生成類似的 eBay 條目列表。另外,該團(tuán)隊正在為發(fā)布商頁面上出現(xiàn)的圖像構(gòu)建一個合理的撤回 eBay 條目清單機制。(即如果發(fā)布商頁面上有高山的圖片,那么在為圖像呈現(xiàn) eBay 相關(guān)條目時,算法不應(yīng)將這些圖片作為種子圖像。)
- 一旦產(chǎn)生這些不同的定位方式,營銷數(shù)據(jù)科學(xué)團(tuán)隊計劃建立一個機器學(xué)習(xí)模型,確定用戶層面上如何響應(yīng)不同的定位方式(基于上下文相關(guān)的關(guān)鍵詞、基于由發(fā)布商提供的關(guān)鍵詞的圖像、基于重定向)并根據(jù)訪問相同頁面的不同客戶來進(jìn)行調(diào)整。
總之,如果發(fā)布商可以在其頁面上提供與上下文相關(guān)的 eBay 條目,則無需執(zhí)行任何操作,只需注冊該程序即可,我們最終會為發(fā)布商、買家、賣家和 eBay 提供一個有利的生態(tài)系統(tǒng)。
原文鏈接:Contextual Advertising for eBay Affiliate www.ebayinc.com/stories/blo…
更多干貨內(nèi)容,可關(guān)注AI前線,ID:ai-front,后臺回復(fù)「AI」、「TF」、「大數(shù)據(jù)」可獲得《AI前線》系列PDF迷你書和技能圖譜。
總結(jié)
以上是生活随笔為你收集整理的浅析eBay联盟营销的上下文广告机制的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MATLAB clc clear
- 下一篇: VLOOKUP函数具体操作及注意事项