日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

解析金融反欺诈技术的应用与实践

發(fā)布時間:2025/3/21 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 解析金融反欺诈技术的应用与实践 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

統(tǒng)計學(xué)分為兩大部分,描述性統(tǒng)計學(xué)和推斷性統(tǒng)計學(xué)。而描述性統(tǒng)計學(xué)在建模的時候往往是很重要而又容易被人忽略的一步, 而它的作用往往如下:

1.發(fā)現(xiàn)數(shù)據(jù)中的異常

2.通過分布圖發(fā)現(xiàn)離群值點

3.檢查數(shù)據(jù)缺失情況

4.檢查標簽占比情況,如壞樣本太少的話,需要抽樣調(diào)整好壞樣本比例

所需模塊python模塊

matplotlib

pandas

seaborn

numpy

SciPy

例子

首先用numpy來創(chuàng)造一組隨機數(shù),我這邊創(chuàng)造一組正態(tài)分布的隨機數(shù),總共50個用于實驗。

from numpy.random import normal, randint

datatest= normal(0, 50, size=50)

一般描述性統(tǒng)計的統(tǒng)計量有均值,眾數(shù),中位數(shù),極差,標準差,方差

這三種重要的統(tǒng)計量,可以分別用numpy包,SciPy包,pandas包計算

Numpy包計算方法

from numpy import mean, median

import numpy as np

np.mean(datatest)---計算均值

np.median(datatest)—計算中位數(shù)

np.std(datatest)—計算標準差

np.var(datatest)—計算方差

scipy包計算方法

from scipy.stats import mode

mode(datatest)

pandas包計算方法

用pandas計算統(tǒng)計量,需要先把數(shù)據(jù)轉(zhuǎn)換重pandas的數(shù)據(jù)框格式

先加列名’number’,轉(zhuǎn)為字典

datatestn={'number':datatest}

再轉(zhuǎn)為dataframe格式

datatestn =pd.DataFrame(datatestn)

就可以直接用

datatestn.mean()

datatestn.median()

datatestn.mode()

或者一步到位

datatestn.describe()

?

如上,產(chǎn)出數(shù)量,均值,標準差,最大最小值,以及各分位點。

datatestn.skew()

datatestn.kurt()

針對我們自己要分析的數(shù)據(jù),可以在sas上面處理完,用python讀取,例如:

datatestnnn=pd.read_sas(‘D:\dataplay.sas7bdat’)

datatestnnn['salary'].shape—取收入變量,再看行數(shù)和列數(shù)

然后用剛才提到的一系列方法分析,當用datatestnnn.skew()計算出來的偏度越大且為正數(shù),說明數(shù)據(jù)的分布重尾在右邊,右邊的極端值較多,可能有較多的異常值。

?

可視化

可視化可以用matplotlib包和seaborn包,就可以從圖片觀察數(shù)據(jù)的分布,有直觀的感覺。

import matplotlib.pyplot as plt

plt.hist(datatest,bins=50,color='b')

plt.xlabel('number')

plt.ylabel(Frequency’)

?

import seaborn as sns

sns.distplot(datatest)

?

要做箱線圖的話可以執(zhí)行以下代碼

from pylab import *

?

總結(jié)

以上是生活随笔為你收集整理的解析金融反欺诈技术的应用与实践的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。