为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比
生活随笔
收集整理的這篇文章主要介紹了
为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ? ?當前,問題優化常用的測試方法是使用A/Btest, 即使用隨機的相同規模的流量分別進行A組結果或B組結果測試。
? ? ?那么我們來看下A/Btest 的組成:
- 一個短時間的純探索階段,你需要找相同數量的用戶進入A,B組。
- 一個長時間的利用階段,即所有用戶進入結果更好的實驗組,然后不再回退。
? ? ?為什么說這是一個有缺點的策略:
- 這是一個探索與利用完全分離的策略,要么純探索要么純利用,但是你其實可以在這兩個階段平滑過度。
- 在純探索階段,其實存在一定的資源浪費,就是你一定要拿到相同量級的結果數據,但是當一個實驗組的結果顯著的非常差的時候,你其實不需要那么多數據來證明結果。
? ? 賭博機算法可以為以上兩個問題提供解決方案:算法可以平滑的進行兩個階段的過度。算法會用資源去探索更好的結果,而不是浪費在顯著差的實驗中。
? ? ?
總結
以上是生活随笔為你收集整理的为什么使用multiarmed bandit algorithms(多臂赌博机算法)--与A/Btest的对比的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 默纳克万能协议服务器图片,默纳克MDKE
- 下一篇: flutter中对接微信登录