快速筛选数据集中某列特征符合某种规律的所有数据集
生活随笔
收集整理的這篇文章主要介紹了
快速筛选数据集中某列特征符合某种规律的所有数据集
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
我們常常有這樣的需要:
如果某條數(shù)據(jù)的特征card1的取值在某個列表里面,就提取出來.
所有上述數(shù)據(jù)輸出得到新的數(shù)據(jù)集.
?
那么sql怎么操作呢?
1.統(tǒng)計犯罪信用卡設(shè)計的卡號card1有哪些取值.
select distinct card1 from merge.train where isFraud=12.把上述結(jié)果導(dǎo)入數(shù)據(jù)庫,表名為fraud_card1,然后做查詢操作如下:
select * from merge.train,merge.fraud_card1 where merge.train.card1=merge.fraud_card1.card1這個時候就能得到初始訓(xùn)練集中,所有和犯罪卡號相關(guān)的數(shù)據(jù)集用來訓(xùn)練了.
?
上方的merge是schema名(可以理解為子數(shù)據(jù)庫)
總結(jié)
以上是生活随笔為你收集整理的快速筛选数据集中某列特征符合某种规律的所有数据集的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: pandas的dataframe节省内存
- 下一篇: Unknown column 'XXX'