日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据竞赛】十大重要的时间组合特征!

發布時間:2025/3/12 编程问答 13 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据竞赛】十大重要的时间组合特征! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

作者:塵沙杰少、櫻落、新峰、DOTA、謝嘉嘉

特征工程--無序類別&時間信息的組合特征!

前 言

本篇文章我們會介紹10大與時間相關的組合特征,這些特征在95%涉及到時間信息的競賽中都是極為重要的特征,也是以往Top選手與新手拉開差距的重要部分。

無序類別特征+時間特征

為了方便表示我們將A作為無序類別特征,B作為時間特征。無序類別特征與時間特征的交互往往是決定比賽走向的一大極為重要的特征,此處我們就列舉在實踐過程中上分最多的幾大特征。

1. 基于A/B一次差值特征

該特征可以表示A出現的時間間隔;該特征在點擊預估等的問題中都是非常重要的特征。如果A表示商品的話,那么基于A/B差值特征就表示A商品被瀏覽/購買/點擊的時間差。

df['A_B_diff1']?=?df['B']?-?df.groupby('A')['B'].shift()

2.基于A/B二次差值特征

基于A/B一次差值特征的差值可以認為是最近的(即shift(1)的)的差值,自然我們也可以是兩次的,即shift(2)的,或者多次的,但是實踐中我們發現一般shift(3)及以上的效果就不是很明顯了。

df['A_B_diff2']?=?df['B']?-?df.groupby('A')['B'].shift(2)

3.基于A與A/B一/二次差值特征的統計特征

該特征的構建是基于A/B一次/二次差值特征的,我們在A/B差值特征的基礎之上再計算A關于A/B差值特征的統計特征,例如:

  • 均值;

  • 方差;

  • 中位數;

  • 偏度;

  • 分位數(四分位數等);

  • 眾數;

  • skewness;

  • 峰度系數;

  • 其它統計特征。

該特征可以很好地反映A在時間戳上的諸多信息,如果基于A與A/B差值特征的最大值和最小值的差值很小或者方差相對很小,這就暗示可能存在較強的周期性,A可能會出現在固定的時間周期內。

df['A_A_B_diff1_sts']?=?df.groupby('A')['A_B_diff1'].apply(sts)? df['A_A_B_diff2_sts']?=?df.groupby('A')['A_B_diff2'].apply(sts)?

4. 基于A/B差值的差值以及對應統計特征

如果說基于A/B差值特征是一階滑動,那么基于A/B差值的差值就是二階了,該特征一般直接加入也可以為模型帶來微弱的提升。因為和基于A/B的差值是類似的,此處我們給出其計算方式,其它的不再贅述。

類似地,我們也可以做shift(N),N>1的差值,但這么做的物理意義會差一些,實際中也很少能帶來提升。

df['A_B_diff1_diff']?=?df['A_B_diff1']?-?df.groupby('A')['A_B_diff1'].shift()? df['A_B_diff1_diff_sts']?=?df.groupby('A')['A_B_diff1_diff'].apply(sts)?

5.A的第一次出現時間

A的第一次出現時間也就是接觸A的第一次時間,該特征具有非常強的意義。

df['A_B_first']?=??df.groupby('A')['B'].first()??

6.A的最后一次出現時間

A的最后一次出現時間也就是接觸A的最后一次時間,該特征和第一次時間互為補充。

df['A_B_last']?=??df.groupby('A')['B'].last()??

7.當前距離A出現第一次時間的時間差

A從第一次被接觸到最后一次被接觸的時間的差值。

df['B_A_B_first_diff']?=??df['B']?-?df['A_B_first']

8.當前距離A最后一次出現時間的時間差

A距離最后一次接觸的時間的差值。

df['B_A_B_first_last']?=??df['B']?-?df['A_B_last']

9.A出現的時間gap

A最后一次出現和第一次出現的時間的差值。

df['A_B_gap']?=?df['A_B_last']?-?df['A_B_first']

10.平均每次A出現的時間

A每次出現的平均時間。

df['A_B_first_last_div_count']?=?(df['A_B_last']?-?df['A_B_first'])?/?df['A_B_count']??

小結

本篇文章我們列舉了特征工程中無序類別變量時間變量的十大重要組合特征,這些是最為重要的一組特征,也是傳統策略中上分最多的一組特征,除此之外與時間特征進行組合的特征還有非常多,我們將會在本系列的下一篇中進行介紹。

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯溫州大學《機器學習課程》視頻 本站qq群851320808,加入微信群請掃碼:

總結

以上是生活随笔為你收集整理的【数据竞赛】十大重要的时间组合特征!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产美女一级视频 | 息与子五十路翔田千里 | 国产日韩欧美一区二区东京热 | 亚洲欧洲国产精品 | 欧美熟妇精品久久久久久 | 寡妇av| 男女做爰猛烈吃奶啪啪喷水网站 | 欧美久草 | 欧洲成人在线 | 99久久久国产精品无码网爆 | 天天av天天干 | 亚洲美女av网站 | 在线免费av播放 | 国产小视频免费在线观看 | 99思思| 国产欧美三区 | 色伊人影院 | av成人免费在线 | 国产av无码专区亚洲av | 91精品国产综合久久精品 | 校园春色自拍偷拍 | 亚洲码欧美码一区二区三区 | 成人一级影片 | 欧美贵妇videos办公室 | 日本极品少妇 | 日韩精品一二 | 999精品在线观看 | 99国产精品99 | 在线观看日本网站 | 久久精品国产精品 | 亚洲成人网在线观看 | 一区二区在线 | 国产网红无码精品视频 | 毛片毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 精品国产999久久久免费 | 福利视频在线免费观看 | 亚洲成人77777 | 成人国产网站 | 日韩免费黄色片 | 52av在线| 国产精品视频一二三区 | 制服丝袜av电影 | 国产xx在线观看 | 曰批女人视频在线观看 | 国产在线一级 | 国产精品丝袜黑色高跟鞋 | 91综合国产 | 久草操 | 成人av免费网址 | 免费视频二区 | 亚洲第一黄色片 | 欧美性另类 | 91久久伊人| 99热视| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 成人福利av | 91亚洲精品久久久蜜桃网站 | 婷婷丁香综合网 | 青青草华人在线视频 | 亚洲大片在线观看 | 欧美一区二区日韩一区二区 | 日韩电影在线观看一区二区 | 天天干天天日夜夜操 | 午夜爱爱网 | 下面一进一出好爽视频 | 欧美成人亚洲 | 国产精品久久久久久婷婷天堂 | 亚洲国产一区二区三区四区 | 中国黄色录像一级片 | 国产男女av | 九九视频在线免费观看 | 亚洲区小说 | 成人午夜精品无码区 | 国产精品 欧美激情 | 色播一区二区 | 天天爱综合 | 人妖和人妖互交性xxxx视频 | 欧美男人又粗又长又大 | 91国产在线免费观看 | 欧美黄片一区二区三区 | 91视频日本 | 国产免费高清视频 | 国产一区在线观看免费 | 欧美暧暧视频 | 一级全黄裸体免费视频 | 艳母动漫在线播放 | 一级少妇毛片 | 亚洲欧美成人一区二区 | 国产经典一区 | 六月综合 | 国产aⅴ一区二区三区 | 国产乱子伦视频一区二区三区 | 成人小视频免费观看 | 国产裸体舞一区二区三区 | 欧美日本一道 | 青青草视频播放器 | 亚洲av网址在线 | 91高清在线视频 | 小毛片|