日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程语言 > python >内容正文

python

《python数据分析与挖掘》-步骤

發(fā)布時間:2023/12/15 python 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《python数据分析与挖掘》-步骤 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

3章數(shù)據(jù)探索(重要)

數(shù)據(jù)質(zhì)量分析

是數(shù)據(jù)預(yù)處理的前提,是數(shù)據(jù)挖掘分析結(jié)論有效性和準(zhǔn)確性的基礎(chǔ),其主要任務(wù)是檢查原始數(shù)據(jù)中是否存在臟數(shù)據(jù),臟數(shù)據(jù)包括:

????缺失值

????異常值

????不一致的值

????重復(fù)數(shù)據(jù)及含有特殊符號(如#、¥、*)的數(shù)據(jù)

本小節(jié)將主要對數(shù)據(jù)中的缺失值、異常值和一致性進(jìn)行分析。

缺失值統(tǒng)計分析

統(tǒng)計缺失值的變量個數(shù)

統(tǒng)計每個變量的未缺失數(shù)

統(tǒng)計變量的缺失數(shù)及缺失率

異常值統(tǒng)計分析-箱型圖代碼

異常值分析是檢驗(yàn)數(shù)據(jù)是否有錄入錯誤以及含有不合常理的數(shù)據(jù)

異常值是指樣本中的個別值,其數(shù)值明顯偏離其余的觀測值。異常值也稱為離群點(diǎn),異常值的分析也稱為離群點(diǎn)的分析。

異常值分析方法主要有:簡單統(tǒng)計量分析、3 ???原則、箱型圖分析。


import pandas as pd
data = pd.read_excel('../data/catering_sale.xls', index_col = u'日期') #讀取數(shù)據(jù),指定“日期”列為索引列

import matplotlib.pyplot as plt #導(dǎo)入圖像庫
plt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標(biāo)簽
plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負(fù)號

plt.figure() #建立圖像
p = data.boxplot(return_type='dict')#p['fliers'][0].get不會報錯
#p = data.boxplot() #畫箱線圖,直接使用pd的DataFrame的方法
x = p['fliers'][0].get_xdata() # 'flies'即為異常值的標(biāo)簽
y = p['fliers'][0].get_ydata()
y.sort() #從小到大排序,該方法直接改變原對象

#用annotate添加注釋
#其中有些相近的點(diǎn),注解會出現(xiàn)重疊,難以看清,需要一些技巧來控制。
#以下參數(shù)都是經(jīng)過調(diào)試的,需要具體問題具體調(diào)試。
for i in range(len(x)):
??if i>0:
????plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
??else:
????plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))
plt.show() #展示箱線圖

?

一致性分析

數(shù)據(jù)不一致性是指數(shù)據(jù)的矛盾性、不相容性。直接對不一致的數(shù)據(jù)進(jìn)行挖掘,可能會產(chǎn)生與實(shí)際相違背的挖掘結(jié)果。

在數(shù)據(jù)挖掘過程中,不一致數(shù)據(jù)的產(chǎn)生主要發(fā)生在數(shù)據(jù)集成的過程中,可能是由于被挖掘數(shù)據(jù)是來自于從不同的數(shù)據(jù)源、重復(fù)存放的數(shù)據(jù)未能進(jìn)行一致性地更新造成的,比如兩張表中都存儲了用戶的地址,在用戶的地址發(fā)生改變時,如果只更新了一張表中的數(shù)據(jù),那么這兩張表中就有了不一致的數(shù)據(jù)。

數(shù)據(jù)特征分析

一般可通過繪制圖表、計算某些特征量等手段進(jìn)行數(shù)據(jù)的特征分析。

這里主要介紹的特征方法有:

分布分析-統(tǒng)計函數(shù)describe

分布分析能揭示數(shù)據(jù)的分布特征和分布類型,便于發(fā)現(xiàn)某些特大或特小的可疑值。

對于定性分類數(shù)據(jù),可用餅圖和條形圖直觀地顯示分布情況。

對于定量變量而言,欲了解其分布形式,是對稱的、還是非對稱的,可做出頻率分布表、繪制頻率分布直方圖、繪制莖葉圖進(jìn)行直觀地分析;

定量變量做頻率分布分析時選擇“組數(shù)”和“組寬”是主要的問題,一般按照以下步驟:

求極差2決定組距與組數(shù)3決定分點(diǎn)4列出頻率分布表5繪制頻率分布直方圖

1各組之間必須是相互排斥的

2各組必須將所有的數(shù)據(jù)包含在內(nèi)

3各組的組寬最好相等
catering_sale = '../data/catering_sale.xls' #餐飲數(shù)據(jù)
data = pd.read_excel(catering_sale, index_col = u'日期') #讀取數(shù)據(jù),指定“日期”列為索引列
data = data[(data[u'銷量'] > 400)&(data[u'銷量'] < 5000)] #過濾異常數(shù)據(jù)
statistics = data.describe() #保存基本統(tǒng)計量

statistics.loc['range'] = statistics.loc['max']-statistics.loc['min'] #極差
statistics.loc['var'] = statistics.loc['std']/statistics.loc['mean'] #變異系數(shù)
statistics.loc['dis'] = statistics.loc['75%']-statistics.loc['25%'] #四分位數(shù)間距
print(statistics)

對比分析

對比分析是指把兩個相互聯(lián)系的指標(biāo)數(shù)據(jù)進(jìn)行比較,從數(shù)量上展示和說明研究對象規(guī)模的大小,水平的高低,速度的快慢,以及各種關(guān)系是否協(xié)調(diào)。特別適用于指標(biāo)間的橫縱向比較、時間序列的比較分析。在對比分析中,選擇合適的對比標(biāo)準(zhǔn)是十分關(guān)鍵的步驟,選擇得合適,才能做出客觀的評價,選擇不合適,評價可能得出錯誤的結(jié)論。

對比分析主要有以下兩種形式:

第一種:絕對數(shù)比較

第二種:相對數(shù)比較

???????1)結(jié)構(gòu)相對數(shù) ????????????????????????????????4)強(qiáng)度相對數(shù)

???????2)比例相對數(shù) ????????????????????????????????5)計劃完成程度相對數(shù)

???????3)比較相對數(shù) ????????????????????????????????6)動態(tài)相對數(shù)

統(tǒng)計量分析

用統(tǒng)計指標(biāo)對定量數(shù)據(jù)進(jìn)行統(tǒng)計描述,常從集中趨勢和離中趨勢兩個方面進(jìn)行分析。

平均水平的指標(biāo)是對個體集中趨勢的度量,使用最廣泛的是均值和中位數(shù);反映變異程度的指標(biāo)則是對個體離開平均水平的度量,使用較廣泛的是標(biāo)準(zhǔn)差(方差)、四分位間距。

集中趨勢度量主要有:均值、中位數(shù)、眾數(shù)

離中趨勢度量主要有:極差、標(biāo)準(zhǔn)差、變異系數(shù)

周期性分析

周期性分析是探索某個變量是否隨著時間變化而呈現(xiàn)出某種周期變化趨勢。周期性趨勢相對較長的有年度周期性趨勢、季節(jié)性周期趨勢,相對較短的一般有月度周期性趨勢、周度周期性趨勢,甚至更短的天、小時周期性趨勢。

如在做某用電單位用電量趨勢預(yù)測過程中,可以先分析該用電單位日用電量的時序圖,來直觀地估計其用電量變化趨勢。

貢獻(xiàn)度分析-帕累托分析

貢獻(xiàn)度分析又稱帕累托分析,帕累托法則又稱20/80定律。同樣的投入放在不同的地方會產(chǎn)生不同的效益。比如對一個公司來講,80%的利潤常常來自于20%最暢銷的產(chǎn)品;而其他80%的產(chǎn)品只產(chǎn)生了20%的利潤。貢獻(xiàn)度分析要求我們抓住問題的重點(diǎn),找到那最有效的20%的熱銷產(chǎn)品、渠道或者銷售人員,在最有效的20%上投入更多資源,盡量減少浪費(fèi)在80%低效的地方。

菜品盈利數(shù)據(jù) 帕累托圖


#初始化參數(shù)
dish_profit = '../data/catering_dish_profit.xls' #餐飲菜品盈利數(shù)據(jù)
data = pd.read_excel(dish_profit, index_col = u'菜品名')
data = data[u'盈利'].copy()
plt.figure()
data.plot(kind='bar')
plt.ylabel(u'盈利(元)')
p = 1.0*data.cumsum()/data.sum()
p.plot(color = 'r', secondary_y = True, style = '-o',linewidth = 2)#secondary_y數(shù)軸說明在右邊
plt.annotate(format(p[6], '.4%'), xy = (6, p[6]), xytext=(6*0.9, p[6]*0.9), arrowprops=dict(arrowstyle="->", connectionstyle="arc3,rad=.2")) #添加注釋,即85%處的標(biāo)記。這里包括了指定箭頭樣式。
plt.ylabel(u'盈利(比例)')
plt.show()

#小知識cumsum
a = np.array([[1,2,3], [4,5,6]])
np.cumsum(a,axis=0) ?????# sum over rows for each of the 3 columns
np.cumsum(a,axis=1) ?# sum over rows for each of the 3 行

就餐飲企業(yè)來講,可以重點(diǎn)改善盈利最高的80%的菜品,或者重點(diǎn)發(fā)展綜合影響最高的80%的部門。這種結(jié)果可以通過帕累托分析直觀的呈現(xiàn)出來,如下圖:

相關(guān)性分析代碼corr

分析連續(xù)變量之間線性的相關(guān)程度的強(qiáng)弱,并用適當(dāng)?shù)慕y(tǒng)計指標(biāo)表示出來的過程稱為相關(guān)分析。

相關(guān)性分析方法主要有:

直接繪制散點(diǎn)圖2繪制散點(diǎn)圖矩陣3計算相關(guān)系數(shù)(比較常用的如Pearson相關(guān)系數(shù)、Spearman秩相關(guān)系數(shù)和判定系數(shù)。)


catering_sale = '../data/catering_sale_all.xls' #餐飲數(shù)據(jù),含有其他屬性
data?= pd.read_excel(catering_sale, index_col = u'日期') #讀取數(shù)據(jù),指定“日期”列為索引列
data.corr() #相關(guān)系數(shù)矩陣,即給出了任意兩款菜式之間的相關(guān)系數(shù)
data.corr()[u'百合醬蒸鳳爪'] #只顯示“百合醬蒸鳳爪”與其他菜式的相關(guān)系數(shù)
data[u'百合醬蒸鳳爪'].corr(data[u'翡翠蒸香茜餃']) #計算“鳳爪”與“翡翠蒸香茜餃”的相關(guān)系數(shù)

統(tǒng)計特征函數(shù)

Mean()Geomean()幾何平均數(shù),VarstdcorrcovMoment中心距

第4章-數(shù)據(jù)預(yù)處理

一、數(shù)據(jù)清洗

數(shù)據(jù)清洗主要是刪除原始數(shù)據(jù)集中的無關(guān)數(shù)據(jù)、重復(fù)數(shù)據(jù),平滑噪聲數(shù)據(jù),處理缺失值、異常值等。

1刪除無關(guān)重復(fù)值
2平滑噪聲
3異常值處理


(1)刪除有異常值的記錄 (2)視為缺失值 (3)平均值修正 (4)不處理
要分析異常值的原因,再決定取舍。

4缺失值處理

方法可分為三類:刪除記錄、數(shù)據(jù)插補(bǔ)和不處理。

常用的數(shù)據(jù)插補(bǔ)方法:均值/中位數(shù)/眾數(shù),固定值,最近鄰插補(bǔ),回歸方法,插值

插值方法:有Hermite插值、分段插值、樣條插值法,而最主要的有拉格朗日插值法和牛頓插值法。

拉格朗日插值法代碼?ployinterp_column

拉格朗日插值法可以找到一個多項式,其恰好在各個觀測的點(diǎn)取到觀測到的值。這樣的多項式稱為拉格朗日(插值)多項式
from scipy.interpolate import lagrange #導(dǎo)入拉格朗日插值函數(shù)
inputfile = '../data/catering_sale.xls' #銷量數(shù)據(jù)路徑
outputfile = '../tmp/sales.xls' #輸出數(shù)據(jù)路徑
data = pd.read_excel(inputfile) #讀入數(shù)據(jù)
data[u'銷量'][(data[u'銷量'] < 400) | (data[u'銷量'] > 5000)] = None #過濾異常值,將其變?yōu)榭罩?/span>

#自定義列向量插值函數(shù)
#s為列向量,n為被插值的位置,k為取前后的數(shù)據(jù)個數(shù),默認(rèn)為5
def ployinterp_column(s, n, k=5):
??y = s[list(range(n-k, n)) + list(range(n+1, n+1+k))] #取數(shù)
??y = y[y.notnull()] #剔除空值
??return lagrange(y.index, list(y))(n) #插值并返回插值結(jié)果
#逐個元素判斷是否需要插值
for i in data.columns:
??for j in range(len(data)):
????if (data[i].isnull())[j]: #如果為空即插值。
??????data[i][j] = ployinterp_column(data[i], j)

data.to_excel(outputfile) #輸出結(jié)果,寫入文件

?

二、數(shù)據(jù)集成實(shí)體識別,冗余屬性識別

將多個數(shù)據(jù)源放在一個統(tǒng)一的數(shù)據(jù)倉庫中。

要考慮實(shí)體識別問題和屬性冗余問題,從而把源數(shù)據(jù)在最低層上加以轉(zhuǎn)換、提煉和集成。


1.實(shí)體識別

實(shí)體識別的任務(wù)是檢測和解決同名異義、異名同義、單位不統(tǒng)一的沖突。如:

同名異義:數(shù)據(jù)源A中的屬性ID和數(shù)據(jù)源B中的屬性ID分別描述的是菜品編號和訂單編號,即描述的是不同的實(shí)體。

異名同義:數(shù)據(jù)源A中的sales_dt和數(shù)據(jù)源B中的sales_date都是是描述銷售日期的,即A. sales_dt= B. sales_date

單位不統(tǒng)一:描述同一個實(shí)體分別用的是國際單位和中國傳統(tǒng)的計量單位。


2.冗余屬性識別

?

數(shù)據(jù)集成往往導(dǎo)致數(shù)據(jù)冗余,如:同一屬性多次出現(xiàn)\同一屬性命名不一致導(dǎo)致重復(fù)

不同源數(shù)據(jù)的仔細(xì)整合能減少甚至避免數(shù)據(jù)冗余與不一致,以提高數(shù)據(jù)挖掘的速度和質(zhì)量。對于冗余屬性要先分析檢測到后再將其刪除。

有些冗余屬性可以用相關(guān)分析檢測到。給定兩個數(shù)值型的屬性AB,根據(jù)其屬性值,可以用相關(guān)系數(shù)度量一個屬性在多大程度上蘊(yùn)含另一個屬性。

?

一、數(shù)據(jù)變換:簡單函數(shù)變換 規(guī)范化,離散化

主要是對數(shù)據(jù)進(jìn)行規(guī)范化的操作,將數(shù)據(jù)轉(zhuǎn)換成“適當(dāng)?shù)摹备袷?#xff0c;以適用于挖掘任務(wù)及算法的需要。

1.簡單函數(shù)變換


簡單函數(shù)變換就是對原始數(shù)據(jù)進(jìn)行某些數(shù)學(xué)函數(shù)變換,常用的函數(shù)變換包括平方、開方、對數(shù)、差分運(yùn)算等

用來將不具有正太分布的數(shù)據(jù)變換成具有正太性的數(shù)據(jù)。
時間序列分析中,對數(shù)變換或者差分運(yùn)算可以將非平穩(wěn)序列轉(zhuǎn)換為平穩(wěn)序列


2.規(guī)范化?

數(shù)據(jù)標(biāo)準(zhǔn)化(歸一化)處理是數(shù)據(jù)挖掘的一項基礎(chǔ)工作,不同評價指標(biāo)往往具有不同的量綱和量綱單位,數(shù)值間的差別可能很大
消除指標(biāo)間量綱影響

最小-最大規(guī)范化:也稱為離差標(biāo)準(zhǔn)化是對原始數(shù)據(jù)的線性變換,使結(jié)果值映射到[0,1]之間

-均值規(guī)范化:也叫標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,經(jīng)過處理的數(shù)據(jù)的平均數(shù)為0標(biāo)準(zhǔn)差為1

小數(shù)定標(biāo)規(guī)范化:通過移動屬性值的小數(shù)位數(shù),將屬性值映射到[-11]之間,移動的小數(shù)位數(shù)取決于屬性值絕對值的最大值。

?

datafile?= '../data/normalization_data.xls' #參數(shù)初始化
data = pd.read_excel(datafile, header = None) #讀取數(shù)據(jù)

(data - data.min())/(data.max() - data.min()) #最小-最大規(guī)范化
(data - data.mean())/data.std() #零-均值規(guī)范化data.mean(axis = 0)按照列


data/10**np.ceil(np.log10(data.abs().max())) #小數(shù)定標(biāo)規(guī)范化

?

1.?連續(xù)屬性離散化?

一些數(shù)據(jù)挖掘算法,特別是某些分類算法,要求數(shù)據(jù)是分類屬性形式,如ID3算法、Apriori算法等。這樣,常常需要將連續(xù)屬性變換成分類屬性,即連續(xù)屬性離散化。

離散化性涉及兩個子任務(wù)1需要多少個分類變量2確定如何將連續(xù)屬性值映射到這些分類值。

常用的離散化方法?
(1)等寬法
(2)等頻法
(3)基于聚類分析的方法

#數(shù)據(jù)規(guī)范化:離散化cut,KMeans
datafile = '../data/discretization_data.xls' #參數(shù)初始化
data = pd.read_excel(datafile) #讀取數(shù)據(jù)
data = data[u'肝氣郁結(jié)證型系數(shù)'].copy()
k = 4
# 等寬離散化,各個類比依次命名為0,1,2,3
d1 = pd.cut(data, k, labels = range(k))
#等頻率離散化
w = [1.0*i/k for i in range(k+1)]
w = data.describe(percentiles = w)[4:4+k+1] #使用describe函數(shù)自動計算分位數(shù)
w[0] = w[0]*(1-1e-10)
d2 = pd.cut(data, w, labels = range(k))
#聚類分類
from sklearn.cluster import KMeans #引入KMeans
kmodel = KMeans(n_clusters = k, n_jobs = 4) #建立模型,n_jobs是并行數(shù),一般等于CPU數(shù)較好
kmodel.fit(data.reshape((len(data), 1))) #訓(xùn)練模型
c = pd.DataFrame(kmodel.cluster_centers_).sort_values(by=[0]) #.sort()#輸出聚類中心,并且排序(默認(rèn)是隨機(jī)序的)
w = pd.rolling_mean(c, 2).iloc[1:] #相鄰兩項求中點(diǎn),作為邊界點(diǎn)
w = [0] + list(w[0]) + [data.max()] #把首末邊界點(diǎn)加上
d3 = pd.cut(data, w, labels = range(k))

def cluster_plot(d, k): #自定義作圖函數(shù)來顯示聚類結(jié)果
??import matplotlib.pyplot as plt
??plt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標(biāo)簽
??plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負(fù)號
??
??plt.figure(figsize = (8, 3))
??for j in range(0, k):
????plt.plot(data[d==j], [j for i in d[d==j]], 'o')
??
??plt.ylim(-0.5, k-0.5)
??return plt

cluster_plot(d1, k).show()
cluster_plot(d2, k).show()
cluster_plot(d3, k).show()

4.?屬性構(gòu)造 -構(gòu)造新的屬性

#新屬性構(gòu)造-輸出到excel
inputfile= '../data/electricity_data.xls' #供入供出電量數(shù)據(jù)
outputfile = '../tmp/electricity_data.xls' #屬性構(gòu)造后數(shù)據(jù)文件
data = pd.read_excel(inputfile) #讀入數(shù)據(jù)
data[u'線損率'] = (data[u'供入電量'] - data[u'供出電量'])/data[u'供入電量']
data.to_excel(outputfile, index = False) #保存結(jié)果

?

5.?小波變換代碼

?


非平穩(wěn)序列的分析手段。
基于小波變換的特征提取方法:
(1)基于小波變換的多尺度空間能量分布特征提取法
(2)基于小波變換的多尺度空間的模極大特征值提取法
(3)基于小波變換的特征提取方法
(4)基于適應(yīng)性小波神經(jīng)網(wǎng)絡(luò)的特征提取方法

inputfile= '../data/leleccum.mat' #提取自Matlab的信號文件
from scipy.io import loadmat #mat是MATLAB專用格式,需要用loadmat讀取它
mat = loadmat(inputfile)
signal = mat['leleccum'][0]

import pywt #導(dǎo)入PyWavelets
coeffs = pywt.wavedec(signal, 'bior3.7', level = 5)
#返回結(jié)果為level+1個數(shù)字,第一個數(shù)組為逼近系數(shù)數(shù)組,后面的依次是細(xì)節(jié)系數(shù)數(shù)組

二、數(shù)據(jù)規(guī)約

數(shù)據(jù)規(guī)約是將海量數(shù)據(jù)進(jìn)行規(guī)約,規(guī)約之后的數(shù)據(jù)仍接近于保持原數(shù)據(jù)的完整性,但數(shù)據(jù)量小得多。

通過數(shù)據(jù)規(guī)約,可以達(dá)到:

降低無效、錯誤數(shù)據(jù)對建模的影響,提高建模的準(zhǔn)確性

少量且具代表性的數(shù)據(jù)將大幅縮減數(shù)據(jù)挖掘所需的時間

降低儲存數(shù)據(jù)的成本


1.屬性規(guī)約常用方法
1.合并屬性2逐步向前選擇3逐步向后刪除4決策樹規(guī)約
5主成分分析降維代碼

1數(shù)據(jù)矩陣2將數(shù)據(jù)矩陣中心標(biāo)準(zhǔn)化3求相關(guān)系數(shù)矩陣4R的特征方程5確定主成分個數(shù)

6計算m個相應(yīng)的單位特征向量7計算主成分

?

inputfile = '../data/principal_component.xls'
outputfile = '../tmp/dimention_reducted.xls' #降維后的數(shù)據(jù)
data = pd.read_excel(inputfile, header = None) #讀入數(shù)據(jù)

from sklearn.decomposition import PCA
pca = PCA()
pca.fit(data)
pca.components_ #返回模型的各個特征向量
pca.explained_variance_ratio_ #返回各個成分各自的方差百分比

三維

pca=PCA(3)

pca.fit(data)

low_d=pca.transform(data)#降維

pd.DataFrame(low_d).to_excel(outputfile)

pca.inverse_transform(low_d)

?

2數(shù)值規(guī)約 分箱,回歸,聚類,卡方檢驗(yàn),決策樹


通過選擇替代的、較小的數(shù)據(jù)來減少數(shù)據(jù)量,包含有參數(shù)方法和無參數(shù)方法兩類;有參數(shù)方法使用模型評估數(shù)據(jù),不需要存放真實(shí)數(shù)據(jù),只需要存放參數(shù),例如回歸、對數(shù)線性模型。

無參數(shù)需要數(shù)據(jù),例如直方圖、聚類、抽樣。

五、常用數(shù)據(jù)預(yù)處理函數(shù)

1.interpolate:一維,高維數(shù)據(jù)插值
f.scipy.interpolate.lagrange(x,y)
2.unique:去除重復(fù)元素
np.unique(D)
D.unique( )

import pandas as pd
import numpy as np
D=pd.Series([1,1,2,3,5])
d1=D.unique()
d2=np.unique(D)
print "d1 is:\n",d1
print "d2 is:\n",d2

3.isnull/notnull:判斷空值/非空值
4.random:生成隨機(jī)矩陣
k x m x n維0-1之間;
np.random.rand(k,m,n…)
k x m x n維,正態(tài)分布;
np.random.randn(k,m,n)
5.PCA:主成分分析

?

5章:挖掘建模

cmplot混淆矩陣,看spe

# -*- coding: utf-8 -*-
def cm_plot(y, yp):
??from sklearn.metrics import confusion_matrix ?# 導(dǎo)入混淆矩陣函數(shù)
??cm = confusion_matrix(y, yp) ?# 混淆矩陣


??import matplotlib.pyplot as plt ?# 導(dǎo)入作圖庫
??plt.matshow(cm, cmap=plt.cm.Greens) ?# 畫混淆矩陣圖,配色風(fēng)格使用cm.Greens,更多風(fēng)格請參考官網(wǎng)。
??plt.colorbar() ?# 顏色標(biāo)簽

??for x in range(len(cm)): ?# 數(shù)據(jù)標(biāo)簽
????for y in range(len(cm)):
??????plt.annotate(cm[x, y], xy=(x, y), horizontalalignment='center', verticalalignment='center')

??plt.ylabel('True label') ?# 坐標(biāo)軸標(biāo)簽
??plt.xlabel('Predicted label') ?# 坐標(biāo)軸標(biāo)簽
??return plt

?

1分類與預(yù)測

算法與模型

算法:回歸分析(logisticsLDA),決策樹,神經(jīng)網(wǎng)絡(luò),貝葉斯,svm,隨機(jī)森林

常用回歸模型:邏輯回歸,(非)線性回歸,嶺回歸,主成分回歸, logistics回歸

1、邏輯回歸

#-*- coding: utf-8 -*-
#邏輯回歸 自動建模
import pandas as pd

#參數(shù)初始化
filename = '../data/bankloan.xls'
data = pd.read_excel(filename)
x = data.iloc[:,:8].as_matrix()
y = data.iloc[:,8].as_matrix()

from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR
rlr = RLR() #建立隨機(jī)邏輯回歸模型,篩選變量
rlr.fit(x, y) #訓(xùn)練模型
rlr.get_support() #獲取特征篩選結(jié)果,也可以通過.scores_方法獲取各個特征的分?jǐn)?shù)
print(u'通過隨機(jī)邏輯回歸模型篩選特征結(jié)束。')
print(u'有效特征為:%s' % ','.join(data.columns[rlr.get_support()]))
x = data[data.columns[rlr.get_support()]].as_matrix() #篩選好特征

lr = LR() #建立邏輯貨柜模型
lr.fit(x, y) #用篩選后的特征數(shù)據(jù)來訓(xùn)練模型
print(u'邏輯回歸模型訓(xùn)練結(jié)束。')
print(u'模型的平均正確率為:%s' % lr.score(x, y)) #給出模型的平均正確率,本例為81.4%

?

Scikit-learn提供了RFE包,用于特征消除,還提供了RFECV通過交叉驗(yàn)證進(jìn)行特征排序

2、決策樹ID3,C4.5CART

ID3決策樹

ID3算法是一種基于信息熵的決策樹分類算法,它選擇當(dāng)前樣本集中具有最大信息增益值的屬性作為測試屬性選擇增益最大

?

#-*- coding: utf-8 -*-
#使用ID3決策樹算法預(yù)測銷量高低
import pandas as pd

#參數(shù)初始化
inputfile = '../data/sales_data.xls'
data = pd.read_excel(inputfile, index_col = u'序號') #導(dǎo)入數(shù)據(jù)

#數(shù)據(jù)是類別標(biāo)簽,要將它轉(zhuǎn)換為數(shù)據(jù)
#用1來表示“好”、“是”、“高”這三個屬性,用-1來表示“壞”、“否”、“低”
data[data == u'好'] = 1
data[data == u'是'] = 1
data[data == u'高'] = 1
data[data != 1] = -1
x = data.iloc[:,:3].as_matrix().astype(int)
y = data.iloc[:,3].as_matrix().astype(int)

from sklearn.tree import DecisionTreeClassifier as DTC
dtc = DTC(criterion='entropy') #建立決策樹模型,基于信息熵
dtc.fit(x, y) #訓(xùn)練模型

#導(dǎo)入相關(guān)函數(shù),可視化決策樹。
#導(dǎo)出的結(jié)果是一個dot文件,需要安裝Graphviz才能將它轉(zhuǎn)換為pdf或png等格式。
from sklearn.tree import export_graphviz
from sklearn.externals.six import StringIO
with open("tree.dot", 'w') as f:
??f = export_graphviz(dtc, feature_names = x.columns, out_file = f)

?

2

CART決策樹模型

#-*- coding: utf-8 -*-
#構(gòu)建并測試CART決策樹模型

import pandas as pd #導(dǎo)入數(shù)據(jù)分析庫
from random import shuffle #導(dǎo)入隨機(jī)函數(shù)shuffle,用來打算數(shù)據(jù)

datafile = '../data/model.xls' #數(shù)據(jù)名
data = pd.read_excel(datafile) #讀取數(shù)據(jù),數(shù)據(jù)的前三列是特征,第四列是標(biāo)簽
data = data.as_matrix() #將表格轉(zhuǎn)換為矩陣
shuffle(data) #隨機(jī)打亂數(shù)據(jù)

p = 0.8 #設(shè)置訓(xùn)練數(shù)據(jù)比例
train = data[:int(len(data)*p),:] #前80%為訓(xùn)練集
test = data[int(len(data)*p):,:] #后20%為測試集

#構(gòu)建CART決策樹模型
from sklearn.tree import DecisionTreeClassifier #導(dǎo)入決策樹模型

treefile = '../tmp/tree.pkl' #模型輸出名字
tree = DecisionTreeClassifier() #建立決策樹模型
tree.fit(train[:,:3], train[:,3]) #訓(xùn)練

#保存模型
from sklearn.externals import joblib
joblib.dump(tree, treefile)

from cm_plot import * #導(dǎo)入自行編寫的混淆矩陣可視化函數(shù)
cm_plot(train[:,3], tree.predict(train[:,:3])).show() #顯示混淆矩陣可視化結(jié)果
#注意到Scikit-Learn使用predict方法直接給出預(yù)測結(jié)果。

from sklearn.metrics import roc_curve #導(dǎo)入ROC曲線函數(shù)

fpr, tpr, thresholds = roc_curve(test[:,3], tree.predict_proba(test[:,:3])[:,1], pos_label=1)
plt.plot(fpr, tpr, linewidth=2, label = 'ROC of CART', color = 'green') #作出ROC曲線
plt.xlabel('False Positive Rate') #坐標(biāo)軸標(biāo)簽
plt.ylabel('True Positive Rate') #坐標(biāo)軸標(biāo)簽
plt.ylim(0,1.05) #邊界范圍
plt.xlim(0,1.05) #邊界范圍
plt.legend(loc=4) #圖例
plt.show() #顯示作圖結(jié)果

?

3、人工神經(jīng)網(wǎng)絡(luò)BP\LM\RBF\FNN\GMDH\ANFIS

#-*- coding: utf-8 -*-
#使用神經(jīng)網(wǎng)絡(luò)算法預(yù)測銷量高低,用sales_data.xls
from keras.models import Sequential
from keras.layers.core import Dense, Activation


model = Sequential() #建立模型
model.add(Dense(10,input_dim=3)) ?#三個輸入,10個隱藏,1一個輸出
model.add(Activation('relu')) #用relu函數(shù)作為激活函數(shù),能夠大幅提供準(zhǔn)確度
model.add(Dense(1,input_dim=10))
model.add(Activation('sigmoid')) #由于是0-1輸出,用sigmoid函數(shù)作為激活函數(shù)

model.compile(loss = 'binary_crossentropy', optimizer = 'adam')#?class_mode = 'binary'
#編譯模型。由于我們做的是二元分類,所以我們指定損失函數(shù)為binary_crossentropy,以及模式為binary
#另外常見的損失函數(shù)還有mean_squared_error、categorical_crossentropy等,請閱讀幫助文件。
#求解方法我們指定用adam,還有sgd、rmsprop等可選

model.fit(x, y, epochs = 1000, batch_size = 10) #訓(xùn)練模型,學(xué)習(xí)一千次,x訓(xùn)練失敗?
yp = model.predict_classes(x).reshape(len(y)) #分類預(yù)測

from cm_plot import * #導(dǎo)入自行編寫的混淆矩陣可視化函數(shù)
cm_plot(y,yp).show() #顯示混淆矩陣可視化結(jié)果

?

2聚類分析:

劃分方法(常用:kmean算法 ,k中心點(diǎn)),系統(tǒng)聚類,層次聚類,譜聚類,基于密度/網(wǎng)格/模型的聚類,均值漂移聚類:用scikit-learnspicy.cluster也有很多

kmeans聚類算法過程:

1)從N個樣本數(shù)據(jù)中隨機(jī)選取K個對象作為初始的聚類中心;

2)分別計算每個樣本到各個聚類中心的距離,將對象分配到距離最近的聚類中;

3)所有對象分配完成后,重新計算K個聚類的中心;

4)與前一次計算得到的K個聚類中心比較,如果聚類中心發(fā)生變化,轉(zhuǎn)2),否則轉(zhuǎn)5)

5)當(dāng)質(zhì)心不發(fā)生變化時停止并輸出聚類結(jié)果。

連續(xù)屬性:度量樣本之間的相似性最常用的是歐幾里得距離、曼哈頓距離和閔可夫斯基距離, 文檔數(shù)據(jù):使用余弦相似性度量,先將文檔數(shù)據(jù)整理成文檔—詞矩陣格式)

誤差平方和SSE

???????????

import pandas as pd

#參數(shù)初始化
inputfile = '../data/consumption_data.xls' #銷量及其他屬性數(shù)據(jù)
outputfile = '../tmp/data_type.xls' #保存結(jié)果的文件名
k = 3 #聚類的類別
iteration = 500 #聚類最大循環(huán)次數(shù)
data = pd.read_excel(inputfile, index_col = 'Id') #讀取數(shù)據(jù)
data_zs = 1.0*(data - data.mean())/data.std() #數(shù)據(jù)標(biāo)準(zhǔn)化


from sklearn.cluster import KMeans
if __name__=='__main__':#加入此行代碼即可
????model = KMeans(n_clusters = k, n_jobs = 4, max_iter = iteration) #分為k類,并發(fā)數(shù)4
????model.fit(data_zs) #開始聚類, you must protect your main loop using "if __name__ == '__main__'".

#簡單打印結(jié)果
r1 = pd.Series(model.labels_).value_counts() #統(tǒng)計各個類別的數(shù)目
r2 = pd.DataFrame(model.cluster_centers_) #找出聚類中心
r = pd.concat([r2, r1], axis = 1) #橫向連接(0是縱向),得到聚類中心對應(yīng)的類別下的數(shù)目
r.columns = list(data.columns) + [u'類別數(shù)目'] #重命名表頭
print(r)

#詳細(xì)輸出原始數(shù)據(jù)及其類別
r = pd.concat([data, pd.Series(model.labels_, index = data.index)], axis = 1) ?#詳細(xì)輸出每個樣本對應(yīng)的類別
r.columns = list(data.columns) + [u'聚類類別'] #重命名表頭
r.to_excel(outputfile) #保存結(jié)果

繪制聚類后的概率密度圖


def density_plot(data): #自定義作圖函數(shù)
??p = data.plot(kind='kde', linewidth = 2, subplots = True, sharex = False)
??[p[i].set_ylabel(u'密度') for i in range(k)]
??plt.legend()
??return plt

pic_output = '../tmp/pd_' #概率密度圖文件名前綴
for i in range(k):
??density_plot(data[r[u'聚類類別']==i]).savefig(u'%s%s.png' %(pic_output, i))

for i in range(len(data.iloc[0])):#逐列作圖
??(data.iloc[:,i]).plot(kind='kde', linewidth=2, label=data.columns[i])

聚類后算法評價

Purity評價法:正確聚類占總數(shù)比例

RI評價

F值評價

聚類可視化TSNE

#kmeans.py

from sklearn.manifold import TSNE
import matplotlib.pyplot as plt

tsne = TSNE()
tsne.fit_transform(data_zs) #進(jìn)行數(shù)據(jù)降維
tsne = pd.DataFrame(tsne.embedding_, index = data_zs.index) #轉(zhuǎn)換數(shù)據(jù)格式

#不同類別用不同顏色和樣式繪圖
d = tsne[r[u'聚類類別'] == 0] ?#a=r[u'聚類類別'] == 0,dtype('bool'),r:oject,r.columns:Index([u'R', u'F', u'M', u'聚類類別'], dtype='object')
plt.plot(d[0], d[1], 'r.')
d = tsne[r[u'聚類類別'] == 1]
plt.plot(d[0], d[1], 'go')
d = tsne[r[u'聚類類別'] == 2]
plt.plot(d[0], d[1], 'b*')
plt.show()

?

3關(guān)聯(lián)規(guī)則aprior,FP-TREE

1)關(guān)聯(lián)規(guī)則的一般形式

支持度:項集AB同時發(fā)生的概率

置信度:項集A發(fā)生,則項集B也同時發(fā)生的概率

2)最小支持度和最小置信度

最小支持度:一個閾值,表示項目集在統(tǒng)計意義上的最低重要性;

最小置信度:一個閾值表示關(guān)聯(lián)規(guī)則的最低可靠性。

同時滿足最小支持度閾值和最小置信度閾值的規(guī)則稱作強(qiáng)規(guī)則。

?

函數(shù)文件apirior.py

過程一:找出所有的頻繁項集。

過程二:由頻繁項集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則
def connect_string(x, ms):
????x = list(map(lambda i: sorted(i.split(ms)), x))
????l = len(x[0])
????r = []
????for i in range(len(x)):
????????for j in range(i, len(x)):
????????????if x[i][:l - 1] == x[j][:l - 1] and x[i][l - 1] != x[j][l - 1]:
????????????????r.append(x[i][:l - 1] + sorted([x[j][l - 1], x[i][l - 1]]))
????return r


# 尋找關(guān)聯(lián)規(guī)則的函數(shù)
def find_rule(d, support, confidence, ms=u'--'):
????result?= pd.DataFrame(index=['support', 'confidence']) ?# 定義輸出結(jié)果

????support_series = 1.0 * d.sum() / len(d) ?# 支持度序列
????column = list(support_series[support_series > support].index) ?# 初步根據(jù)支持度篩選
????k = 0

????while len(column) > 1:
????????k = k + 1
????????print(u'\n正在進(jìn)行第%s次搜索...' % k)
????????column = connect_string(column, ms)
????????print(u'數(shù)目:%s...' % len(column))
????????sf = lambda i: d[i].prod(axis=1, numeric_only=True) ?# 新一批支持度的計算函數(shù)

????????# 創(chuàng)建連接數(shù)據(jù),這一步耗時、耗內(nèi)存最嚴(yán)重。當(dāng)數(shù)據(jù)集較大時,可以考慮并行運(yùn)算優(yōu)化。
????????d_2 = pd.DataFrame(list(map(sf, column)), index=[ms.join(i) for i in column]).T

????????support_series_2 = 1.0 * d_2[[ms.join(i) for i in column]].sum() / len(d) ?# 計算連接后的支持度
????????column = list(support_series_2[support_series_2 > support].index) ?# 新一輪支持度篩選
????????support_series = support_series.append(support_series_2)
????????column2 = []

????????for i in column: ?# 遍歷可能的推理,如{A,B,C}究竟是A+B-->C還是B+C-->A還是C+A-->B?
????????????i = i.split(ms)
????????????for j in range(len(i)):
????????????????column2.append(i[:j] + i[j + 1:] + i[j:j + 1])

????????cofidence_series = pd.Series(index=[ms.join(i) for i in column2]) ?# 定義置信度序列

????????for i in column2: ?# 計算置信度序列
????????????cofidence_series[ms.join(i)] = support_series[ms.join(sorted(i))] / support_series[ms.join(i[:len(i) - 1])]

????????for i in cofidence_series[cofidence_series > confidence].index: ?# 置信度篩選
????????????result[i] = 0.0
????????????result[i]['confidence'] = cofidence_series[i]
????????????result[i]['support'] = support_series[ms.join(sorted(i.split(ms)))]

????result?= result.T.sort(['confidence', 'support'], ascending=False) ?# 結(jié)果整理,輸出
????print(u'\n結(jié)果為:')
????print(result)

????return result

使用Apriori算法挖掘菜品訂單關(guān)聯(lián)規(guī)則

#-*- coding: utf-8 -*-
#使用Apriori算法挖掘菜品訂單關(guān)聯(lián)規(guī)則
from __future__ import print_function
import pandas as pd
from apriori import * #導(dǎo)入自行編寫的apriori函數(shù)

inputfile = '../data/menu_orders.xls'
outputfile = '../tmp/apriori_rules.xls' #結(jié)果文件
data = pd.read_excel(inputfile, header = None)


代碼好-轉(zhuǎn)換原始數(shù)據(jù)至0-1矩陣...')有問題


ct = lambda x : pd.Series(1, index = x[pd.notnull(x)]) #轉(zhuǎn)換0-1矩陣的過渡函數(shù)
b = map(ct, data.as_matrix()) #用map方式執(zhí)行
data = pd.DataFrame(list(b)).fillna(0) #實(shí)現(xiàn)矩陣轉(zhuǎn)換,空值用0填充
print(u'\n轉(zhuǎn)換完畢。')
del b #刪除中間變量b,節(jié)省內(nèi)存

support = 0.2 #最小支持度
confidence = 0.5 #最小置信度
ms = '---' #連接符,默認(rèn)'--',用來區(qū)分不同元素,如A--B。需要保證原始表格中不含有該字符

find_rule(data, support, confidence, ms).to_excel(outputfile) #保存結(jié)果

?

4時序模式:

常見的時間序列模型 平滑,趨勢擬合法,組合(加法,乘法)、ARMA,ARMA,ARIMA,ARCH,GARCH,將重點(diǎn)介紹AR模型、MA模型、ARMA模型和ARIMA模型。

時間序列的預(yù)處理(隨機(jī)+平穩(wěn))

拿到一個觀察值序列后,首先要對它的純隨機(jī)性和平穩(wěn)性進(jìn)行檢驗(yàn),這兩個重要的檢驗(yàn)稱為序列的預(yù)處理。根據(jù)檢驗(yàn)結(jié)果可以將序列分為不同的類型,對不同類型的序列會采取不同的分析方法。

對于純隨機(jī)序列,又叫白噪聲序列,就意味著序列的各項之間沒有任何相關(guān)關(guān)系,序列在進(jìn)行完全無序的隨機(jī)波動,可以終止對該序列的分析。

對于平穩(wěn)非白噪聲序列,它的均值和方差是常數(shù),現(xiàn)已有一套非常成熟的平穩(wěn)序列的建模方法。通常是建立一個線性模型來擬合該序列的發(fā)展,借此提取該序列的有用信息。ARMA模型是最常用的平穩(wěn)序列擬合模型;

對于非平穩(wěn)序列,由于它的均值和方差不穩(wěn)定,處理方法一般是將其轉(zhuǎn)變?yōu)槠椒€(wěn)序列,這樣就可以應(yīng)用有關(guān)平穩(wěn)時間序列的分析方法,如建立ARMA模型來進(jìn)行相應(yīng)得研究。如果一個時間序列經(jīng)差分運(yùn)算后具有平穩(wěn)性,成該序列為差分平穩(wěn)序列,可以使用ARIMA模型進(jìn)行分析。

1平穩(wěn)性檢驗(yàn)

對序列的平穩(wěn)性的檢驗(yàn)有兩種檢驗(yàn)方法,一種是根據(jù)時序圖和自相關(guān)圖的特征做出判斷的圖檢驗(yàn),該方法操作簡單、應(yīng)用廣泛,缺點(diǎn)是帶有主觀性;另一種是構(gòu)造檢驗(yàn)統(tǒng)計量進(jìn)行的方法,目前最常用的方法是單位根檢驗(yàn)

1)時序圖檢驗(yàn):如果有明顯的趨勢性或者周期性那它通常不是平穩(wěn)序列。

2)自相關(guān)圖檢驗(yàn)(常用)

??????平穩(wěn)序列具有短期相關(guān)性,隨著延遲期數(shù)的增加,平穩(wěn)序列的自相關(guān)系數(shù) 會比較快的衰減趨向于零,并在零附近隨機(jī)波動,而非平穩(wěn)序列的自相關(guān)系數(shù)衰減的速度比較慢

3)單位根檢驗(yàn)是指檢驗(yàn)序列中是否存在單位根,因?yàn)榇嬖趩挝桓褪欠瞧椒€(wěn)時間序列了。p 值顯著大于0.05===非平穩(wěn)(不是白噪聲)

?

2純隨機(jī)性檢驗(yàn)

純隨機(jī)性檢驗(yàn)也稱白噪聲檢驗(yàn)一般是構(gòu)造檢驗(yàn)統(tǒng)計量來檢驗(yàn)序列的純隨機(jī)性,常用的檢驗(yàn)統(tǒng)計量有 Q 統(tǒng)計量、LB 統(tǒng)計量,計算出對應(yīng)的p 值,如果p值顯著大于顯著性水平,則表示該序列不能拒絕純隨機(jī)的原假設(shè),可以停止對該序列的分析。

平穩(wěn)時間序列分析ARMA

ARMA模型的全稱是自回歸移動平均模型,它是目前最常用的擬合平穩(wěn)序列的模型。

ARMA模型又可以細(xì)分為AR模型、MA模型和ARMA模型三大類。都可以看作是多元線性回歸模型。

下面將分別介紹AR模型、MA模型和ARMA模型三大模型。

平穩(wěn)時間序列的ARMA模型建模步驟。

某個時間序列經(jīng)過預(yù)處理,被判定為平穩(wěn)非白噪聲序列,就可以利用ARMA模型進(jìn)行建模。

AR模型、MA模型和ARMA模型的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì),選擇出合適的模型。

ARMAARMA模型自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)如下:

AR模型:自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)截尾;

MA模型:自相關(guān)系數(shù)截尾,偏自相關(guān)函數(shù)拖尾;

ARMA模型:自相關(guān)函數(shù)和偏自相關(guān)函數(shù)均拖尾。

?

非平穩(wěn)時間序列分析ARIMA

對非平穩(wěn)時間序列的分析方法可以分為確定性因素分解的時序分析和隨機(jī)時序分析兩大類

確定性因素分解的方法把所有序列的變化都?xì)w結(jié)為四個因素(長期趨勢、季節(jié)變動、循環(huán)變動和隨機(jī)波動)的綜合影響。可以建立加法模型和乘法模型等。

根據(jù)時間序列的不同特點(diǎn),隨機(jī)時序分析可以建立的模型有ARIMA模型、殘差自回歸模型、季節(jié)模型、異方差模型等。

1、p階差分相距一期的兩個序 列值之間的減法運(yùn)算稱為 1 階差分運(yùn)算;

2、k步差分相距k期的兩個序列值之間的減法運(yùn)算稱為k步差分運(yùn)算。

3、差分運(yùn)算具有強(qiáng)大的確定性信息提取能力,許多非平穩(wěn)序列差分后會顯示出平穩(wěn)序列的性質(zhì),這時稱這個非平穩(wěn)序列為差分平穩(wěn)序列。

4、對差分平穩(wěn)序列可以使用ARMA模型進(jìn)行擬合。

5、ARIMA模型的實(shí)質(zhì)就是差分運(yùn)算與ARMA模型的組合,掌握了ARMA模型的建模方法和步驟以后,對序列建立ARIMA模型是比較簡單的。 ???

建模步驟:(代碼問題)

?

建模步驟

計算ACFPACF(自相關(guān)圖平穩(wěn)性檢驗(yàn)+白噪聲

?????先計算非平穩(wěn)白噪聲序列的自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF

不平穩(wěn)差分后再用ARIMA模型

import pandas as pd
#讀取數(shù)據(jù),指定日期列為指標(biāo),Pandas自動將“日期”列識別為Datetime格式
discfile = '../data/arima_data.xls'
forecastnum = 5
data = pd.read_excel(discfile, index_col = u'日期')
import matplotlib.pyplot as plt
data.plot()
plt.show()


#自相關(guān)圖和偏自相關(guān)圖選擇模型


from scipy import stats
import matplotlibt.pyplot as plt
import statsmodels.api as sm
from statsmodels.graphics.api import qqplot


fig=sm.graphic.tsa.plot_acf(dta,lags=40,ax=ax1)
fig = sm.graphics.tsa.plot_pacf(dta, lags=40, ax=ax2)
# 一階差分后的自相關(guān)圖與偏自相關(guān)圖
dta = dta.diff(1).dropna() ?# 注意一定要將查分后的空值去掉再取自相關(guān)系數(shù)
fig = sm.graphics.tsa.plot_acf(dta, lags=40, ax=ax3)
fig = sm.graphics.tsa.plot_pacf(dta, lags=40, ax=ax4)

#平穩(wěn)性檢測#白噪聲檢驗(yàn)


from statsmodels.tsa.stattools import adfuller as ADF
print(u'原始序列的ADF檢驗(yàn)結(jié)果為:', ADF(data[u'銷量']))
#返回值依次為adf、pvalue、usedlag、nobs、critical values、icbest、regresults、resstore
D_data=data.diff().dropna()
D_data.columns=[u'銷量差分']
from statsmodels.stats.diagnostic import acorr_ljungbox
print(u'差分序列的白噪聲檢驗(yàn)結(jié)果為:', acorr_ljungbox(D_data, lags=1)) #返回統(tǒng)計量和p值

from statsmodels.tsa.arima_model import ARIMA

#定階
pmax = int(len(D_data)/10) #一般階數(shù)不超過length/10
qmax = int(len(D_data)/10) #一般階數(shù)不超過length/10
bic_matrix = [] #bic矩陣
for p in range(pmax+1):
??tmp = []
??for q in range(qmax+1):
????try: #存在部分報錯,所以用try來跳過報錯。
??????tmp.append(ARIMA(data, (p,1,q)).fit().bic)
????except:
??????tmp.append(None)
??bic_matrix.append(tmp)

bic_matrix = pd.DataFrame(bic_matrix) #從中可以找出最小值
p,q = bic_matrix.stack().idxmin() #先用stack展平,然后用idxmin找出最小值位置。
print(u'BIC最小的p值和q值為:%s、%s' %(p,q))

?

ARMA模型識別

??????AR模型、MA模型和ARMA模型的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì),選擇出合適的模型。

模型定階AIC:確定pq

(1)人為識別的方法:用相關(guān)圖像根據(jù)ARMA模型識別原則進(jìn)行模型定階

(2)第二種方法:相對最優(yōu)模型識別。

計算ARMA(p,q)當(dāng) p 和 q 均小于等于 5 的所有組合的 BIC 信息量,取其中 BIC 信息量達(dá)到最小的模型階數(shù)。ARIMA(P1,Q

模型檢驗(yàn)

確定模型后,需要檢驗(yàn)其殘差序列是否是白噪聲,若不是,說明,殘差中還存在有用的信息,需要修改模型或者進(jìn)一步提取。若其殘差不是白噪聲,重新更換p,q的值,重新確定

?

?p值為:0.627016 ,大于0.05殘差為白噪聲序列,模型通過檢驗(yàn)。

模型預(yù)測

只能進(jìn)行短期預(yù)測

model?= ARIMA(data, (p,1,q)).fit() #建立ARIMA(0, 1, 1)模型
model.summary2() #給出一份模型報告
model.forecast(5)

模型優(yōu)化與應(yīng)用

5離群點(diǎn)檢測

threshold=2
norm = []
for i in range(k): #逐一處理
??norm_tmp = r[['R', 'F', 'M']][r[u'聚類類別'] == i]-model.cluster_centers_[i]
??norm_tmp = norm_tmp.apply(np.linalg.norm, axis = 1) #求出絕對距離
??norm.append(norm_tmp/norm_tmp.median()) #求相對距離并添加

#norm = pd.concat(norm) #合并
norm[norm <= threshold].plot(style = 'go') #正常點(diǎn)
discrete_points = norm[norm > threshold] #離群點(diǎn)
discrete_points.plot(style = 'ro')


for i in range(len(discrete_points)): #離群點(diǎn)做標(biāo)記
??id = discrete_points.index[i]
??n = discrete_points.iloc[i]
??plt.annotate('(%s, %0.2f)'%(id, n), xy = (id, n), xytext = (id, n))

plt.xlabel(u'編號')
plt.ylabel(u'相對距離')
plt.show()


總結(jié)

以上是生活随笔為你收集整理的《python数据分析与挖掘》-步骤的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

国产成人一区二 | 婷婷激情站 | 成人欧美日韩国产 | 白丝av在线| 中文字幕有码在线观看 | 亚洲国产午夜 | 九九久久婷婷 | 国产一级在线观看 | 成人天堂网 | 久久99国产精品视频 | 成人av中文字幕在线观看 | 91最新中文字幕 | 午夜精品一区二区三区可下载 | 黄色午夜网站 | 激情欧美一区二区三区 | 激情大尺度视频 | 在线看黄色av | 精品久久一二三区 | 一区二区视频电影在线观看 | 国产福利在线 | 天天色视频 | 日韩电影在线视频 | 日韩在线无| 中文字幕第 | 久草在线中文888 | 女人18毛片a级毛片一区二区 | 黄色性av | a天堂最新版中文在线地址 久久99久久精品国产 | 久久视频一区 | 日韩特级片 | 久久久久久蜜av免费网站 | 在线观看成年人 | 国产乱码精品一区二区蜜臀 | 国产精品乱码久久久 | 久久99精品久久久久久秒播蜜臀 | 成人av影视 | 日韩欧美v | 久久久亚洲精品 | 成人免费视频网站在线观看 | 激情综合色图 | 国产精品久久久久久久午夜 | 国产亚洲精品久久 | 日韩精品免费专区 | 日韩a在线观看 | 中文十次啦 | 在线视频免费观看 | 国产精品乱码久久久久久1区2区 | 久久精品一级片 | 国产精品中文字幕在线观看 | 亚洲黄色免费观看 | 狠狠网 | 久久兔费看a级 | 亚洲免费在线观看视频 | 永久免费毛片在线观看 | 丁香花在线观看免费完整版视频 | 亚洲aⅴ在线观看 | 欧美一级黄色视屏 | 欧美成人精品欧美一级乱 | 精品视频www | 亚洲亚洲精品在线观看 | 亚洲无线视频 | 国产91九色视频 | 有没有在线观看av | 一区二区三区视频网站 | 免费精品 | 久久99国产精品 | 久久综合久久八八 | 久久影视精品 | 日韩激情视频在线 | 久久免费精品视频 | 黄色视屏在线免费观看 | 久久一区二区三区国产精品 | 婷婷丁香花五月天 | 青青草在久久免费久久免费 | 午夜精品电影一区二区在线 | 日日干激情五月 | 国产精品美女久久久网av | 日本公妇在线观看高清 | 激情婷婷丁香 | 99re亚洲国产精品 | 中文字幕久久精品亚洲乱码 | 99国产精品一区二区 | 亚洲资源视频 | 精品在线视频播放 | 在线成人观看 | 天天色天天射综合网 | 久草网在线视频 | 亚州av成人 | 91精品推荐 | 91视频久久久久久 | 欧美日韩国产伦理 | 国产成人一区二区在线观看 | 国产aaa大片 | av动态图片 | 国产精品久久久久久一区二区三区 | 日韩高清免费无专码区 | 少妇视频一区 | 麻豆成人精品 | 天天久久综合 | 蜜臀av一区二区 | 久久一二三四 | 91在线www | 国产69精品久久久久久久久久 | 国产资源在线免费观看 | 亚洲一区免费在线 | 精品美女视频 | 久久精品麻豆 | 欧美日韩视频网站 | 国产亚洲欧洲 | 国产精品刺激对白麻豆99 | 色综合中文综合网 | 黄av资源 | 国产精品电影一区二区 | 手机在线日韩视频 | 天天操夜夜曰 | 日韩免费一级a毛片在线播放一级 | 日韩高清在线一区二区三区 | 亚州av网站| 91麻豆精品 | 久久国产电影 | 久久在线电影 | 日韩欧美一区二区在线 | 成人理论在线观看 | 久热免费 | 69精品在线| 久久久免费av| 在线播放视频一区 | 免费在线观看国产精品 | 欧美精品免费在线 | 亚洲欧美日本A∨在线观看 青青河边草观看完整版高清 | 成人cosplay福利网站 | 日韩在线视 | 国内精品视频一区二区三区八戒 | 国产精品久久久久av福利动漫 | 黄色网www | 婷婷综合五月天 | 福利一区二区 | 成人a视频在线观看 | 麻豆一精品传二传媒短视频 | 香蕉网在线 | 久久美女精品 | 久久久国产影视 | 成人在线视频论坛 | 深爱开心激情 | 国产精品高清一区二区三区 | 成人18视频 | 日韩欧美视频一区二区 | 开心激情五月网 | 久久成人国产精品免费软件 | www.狠狠色| 天天干天天操天天 | 国产一区二区在线视频观看 | 亚洲精品播放 | 日本激情视频中文字幕 | 最近免费观看的电影完整版 | 中文字幕在线乱 | 婷婷丁香狠狠爱 | 国产清纯在线 | 亚洲视频在线观看网站 | 久草香蕉在线视频 | 久久亚洲影院 | 狠狠综合久久av | 国产精品嫩草影视久久久 | 亚洲人成在线电影 | 日韩精品视频一二三 | av在线a | 在线观看日韩专区 | 国产一区自拍视频 | 97成人免费 | 欧美另类tv | 国产精品久久久久一区二区三区 | 亚洲精品综合在线观看 | 蜜桃视频在线观看一区 | 国产视频99| 97在线观看免费 | 日本激情动作片免费看 | 久色 网 | 中文字幕美女免费在线 | 国产精品一区二区免费在线观看 | 国产日韩一区在线 | 西西444www大胆无视频 | 四虎在线视频 | 天天干天天碰 | 欧美一级电影 | 久99久精品视频免费观看 | 日韩高清av在线 | 丁香激情综合国产 | 国产成人黄色片 | 成人精品电影 | 欧美日韩国产一区二区三区 | 一区二区三区在线播放 | 77国产精品 | 91自拍91| 欧美日韩视频在线一区 | 国产亚洲一区二区在线观看 | 久久人人做| 日韩丝袜在线观看 | 日韩精品免费在线观看视频 | 国产精品一区二区三区在线看 | 欧美另类网站 | 国产精品午夜久久 | 国产在线精品一区 | 精品在线免费观看 | 免费观看特级毛片 | 97超级碰碰碰碰久久久久 | 最新av电影网站 | 中文字幕色播 | 中文字幕日韩高清 | 国产一区二区三区 在线 | 亚洲精品一区二区三区高潮 | 日韩一区二区在线免费观看 | 天天干天天插 | 91av视屏| 国产精品色视频 | 亚洲高清免费在线 | 国产在线视频一区二区三区 | 亚洲天堂精品视频 | 五月开心六月伊人色婷婷 | 一区二区不卡在线观看 | 欧美国产三区 | 国产成人精品一二三区 | 97视频在线观看网址 | 欧美黄色免费 | 91精品国自产在线观看欧美 | 亚洲精品美女在线观看播放 | 精品亚洲视频在线 | 午夜的福利 | 成人免费视频免费观看 | 国产精品久久久久久a | 97视频久久久 | 97超视频免费观看 | 免费电影一区二区三区 | 亚洲国产精品激情在线观看 | 看黄色.com| 超碰在线公开免费 | 亚洲欧美国内爽妇网 | 国产精品久久久久久久久久尿 | 中文字幕色婷婷在线视频 | 欧美一二三视频 | 国产成人精品一区二区三区免费 | 免费91麻豆精品国产自产在线观看 | 欧美日韩不卡在线 | 波多野结衣一区三区 | 九九九九九精品 | 国产午夜精品一区 | 成人app在线播放 | 国产最新视频在线 | 日韩精品一区二区电影 | 香蕉视频最新网址 | 国产91精品看黄网站在线观看动漫 | 午夜10000 | 亚州激情视频 | 五月婷婷影院 | 美女视频一区 | 日韩国产精品毛片 | 粉嫩av一区二区三区四区五区 | 国产精品激情在线观看 | 国产人成看黄久久久久久久久 | 国产综合在线观看视频 | 成年在线观看 | 天天爽人人爽 | 日韩av资源在线观看 | 正在播放国产精品 | 久久久久免费精品视频 | 天天天干天天射天天天操 | 成人av免费看 | 在线观看免费中文字幕 | 97碰碰视频 | 亚洲免费a | 免费观看成人av | 午夜精品久久一牛影视 | 九九免费在线观看视频 | 日韩精品黄 | 深爱激情婷婷网 | 天天艹日日干 | 国产系列在线观看 | 久久精品综合一区 | 不卡的av在线播放 | 欧美精品一级视频 | 99精品视频免费观看视频 | 97av视频在线| 日日夜夜操av | 狠狠干激情 | 九九九九九精品 | 美女国内精品自产拍在线播放 | 超碰最新网址 | 99情趣网视频 | 久久精品伊人 | 日韩乱理 | 91热在线 | 欧美日韩国产在线一区 | 国产精品99免费看 | 欧美精品免费视频 | 亚洲精品久久在线 | 黄色录像av | av在线一级 | 一级片视频免费观看 | 黄色小网站在线观看 | 国产精品久久99精品毛片三a | 久久久久久久久久久久久国产精品 | 日韩影片在线观看 | 97高清视频 | 蜜桃av人人夜夜澡人人爽 | 综合激情婷婷 | 99精品欧美一区二区 | 国产一级黄色免费看 | 免费在线播放av电影 | 五月婷婷丁香六月 | 久久久久一区 | 91精品在线观看视频 | 国产成人精品免高潮在线观看 | 麻豆视频免费在线观看 | 欧美日韩视频在线观看一区二区 | 国产小视频在线免费观看视频 | 日本精品久久久一区二区三区 | 在线观看黄色的网站 | 久久久国产一区二区 | 中文字幕国语官网在线视频 | 人人搞人人干 | 天天干天天干天天色 | 天天操天天操一操 | 国产精品一区二区视频 | 国内精品久久久久久久影视简单 | 亚洲va在线va天堂va偷拍 | 免费视频在线观看网站 | 免费手机黄色网址 | 成人精品福利 | www.香蕉| 国产一区二区三区 在线 | 成人免费精品 | 99热最新在线 | 天天操天天谢 | 日韩有码中文字幕在线 | 黄色特级一级片 | 免费在线观看av电影 | 国产一级a毛片视频爆浆 | 手机av观看 | 91亚洲精品国偷拍自产在线观看 | 操操操日日 | 一区二区三区免费网站 | 在线播放精品一区二区三区 | 午夜久久美女 | 四虎5151久久欧美毛片 | 亚一亚二国产专区 | 国产一区二区在线播放 | 日韩中文字幕视频在线 | 欧美日韩高清免费 | 色婷婷综合久久久久中文字幕1 | 午夜影院日本 | 狠狠狠狠干 | 一级电影免费在线观看 | 在线观看午夜av | 免费精品在线观看 | 久综合网 | 97精品国产一二三产区 | 国产 色 | 国产精品成人久久久 | 成人高清av在线 | 在线午夜| 91桃色在线播放 | 最近最新中文字幕 | 久久精品—区二区三区 | 国产黄色av | 亚洲精品视频在线免费 | 色射色| 国产最新精品视频 | 91看片淫黄大片在线播放 | 久久久久国产一区二区 | 久久午夜影视 | 日日日日 | 99亚洲精品视频 | 成人免费共享视频 | 伊人狠狠操| 欧美二区视频 | 高清不卡毛片 | 亚洲精品视频在线免费播放 | 色婷婷国产精品一区在线观看 | 中文字幕在线观看播放 | 亚州天堂| 国产精品岛国久久久久久久久红粉 | 亚洲日本精品 | 日韩网站一区 | 国产一级电影 | 999久久久久久久久6666 | 日韩免费大片 | 91中文字幕视频 | 日韩黄色一级电影 | 日韩av一区二区三区 | 91网址在线观看 | 久久精品xxx | 国产做aⅴ在线视频播放 | 在线看片视频 | 九九九在线观看视频 | 国产精品久久久久高潮 | 天天干天天干天天干天天干天天干天天干 | 国产视频资源在线观看 | 国产黄色片在线 | 在线免费av播放 | 精品久久久久久久久久岛国gif | 激情五月开心 | 成年人国产在线观看 | 日韩精品免费在线播放 | 久久一区91 | 精选久久 | 久久久久久久久久久久久久电影 | 免费a网站 | 中文字幕日本特黄aa毛片 | 亚洲劲爆av| 国际av在线 | 久久久久国产精品一区 | 福利片视频区 | 91精品视频在线看 | 日韩在线免费视频观看 | 国产精品久久久久久久av大片 | 久久精品亚洲精品国产欧美 | 国产美女在线精品免费观看 | 在线看国产精品 | 丁香在线观看完整电影视频 | 日韩高清精品免费观看 | 欧美另类xxx | 国产精品欧美 | 日韩性久久 | 国产一级一片免费播放放a 一区二区三区国产欧美 | 亚洲高清视频一区二区三区 | free,性欧美 九九交易行官网 | 久草精品视频 | 久久精品波多野结衣 | 日本性xxx| 亚洲欧洲日韩在线观看 | www免费| 免费看特级毛片 | 日韩久久激情 | 最新91在线视频 | 很黄很色很污的网站 | 亚洲国产中文字幕 | 日韩欧美精品在线观看 | 久久久久亚洲最大xxxx | 永久黄网站色视频免费观看w | 精品国产一区二区三区久久久蜜臀 | 国产一级片网站 | 91精品第一页 | 亚洲区视频在线观看 | 成人丁香花 | 久久黄页| www.com.日本一级| 在线观看成人 | 亚洲,国产成人av | 1000部国产精品成人观看 | 亚洲最新av在线 | 六月丁香伊人 | 国产午夜精品免费一区二区三区视频 | 亚洲一区二区三区毛片 | 日韩av在线免费播放 | 在线观看亚洲国产精品 | 日韩av成人在线观看 | 韩国一区二区三区在线观看 | 日本中文字幕影院 | 日韩在线视频精品 | 色综合久久久久综合体 | 国产成人亚洲在线观看 | 福利一区二区三区四区 | 天天干.com| 日韩精品黄 | a在线免费观看视频 | 国内精品在线看 | 久草| 亚洲欧美日本A∨在线观看 青青河边草观看完整版高清 | 亚洲精品tv久久久久久久久久 | 久久久高清 | 在线国产91 | 免费黄色av电影 | 国内视频在线 | 在线精品在线 | 欧洲一区二区在线观看 | 国产二级视频 | 免费av观看网站 | 黄色免费视频在线观看 | 久久综合狠狠综合久久狠狠色综合 | 91看片淫黄大片91 | 欧美日韩一区二区三区在线观看视频 | 探花视频在线版播放免费观看 | 精品国产片 | av中文天堂在线 | 亚洲欧美日本国产 | 777奇米四色 | 亚洲精品乱码久久久久久蜜桃91 | 欧美日韩国产在线 | 在线播放亚洲激情 | 国产精品一区二区白浆 | 99久久日韩精品免费热麻豆美女 | 狠狠干在线 | 综合婷婷| 免费a级观看| 安徽妇搡bbbb搡bbbb | 久久精品男人的天堂 | 在线91精品 | 99久久99久久精品国产片果冰 | 国产精品男女视频 | 色综合天天综合网国产成人网 | 国产在线观看污片 | 久久国产亚洲 | 99免费在线视频观看 | 久久视频在线免费观看 | 涩涩伊人| 欧洲色综合 | 开心色激情网 | 色偷偷97 | 青青草国产在线 | 中文在线www | 2019精品手机国产品在线 | 亚洲黄色免费在线 | 国产亚洲视频在线观看 | 色在线国产 | 中文字幕免费高清 | 91人人人 | 国产精品一区二区无线 | 欧美性猛片 | 亚洲精品国产第一综合99久久 | 91视频高清 | 五月色婷 | 欧美少妇xx | 91热| 久久99精品久久久久久三级 | 欧美日本不卡视频 | 久久99久久99精品 | 国产精品永久免费观看 | 91亚洲视频在线观看 | 国产精品精品久久久 | av在线h| 欧美精品成人在线 | 国产婷婷色 | 精品九九久久 | 久久久久成人精品亚洲国产 | 国产资源网站 | 91精品无人成人www | 国产一区二区三精品久久久无广告 | 国产一区二区在线精品 | 日韩电影精品一区 | 国产精品av在线 | 亚洲一区二区三区91 | 亚州精品成人 | 国产在线精 | 久久精品美女视频 | 偷拍精品一区二区三区 | 午夜在线观看一区 | 午夜精品一区二区三区在线视频 | 成人一级视频在线观看 | 天天色天天射天天操 | 国产操在线 | 亚洲国产精品va在线看黑人动漫 | 亚洲综合小说电影qvod | 天堂av免费在线 | 香蕉影视在线观看 | 日本福利视频在线 | 伊人婷婷色 | 少妇精品久久久一区二区免费 | 91av99| 久久五月婷婷丁香社区 | 人人爽夜夜爽 | 欧美一区二区三区在线播放 | 天天草天天| 久久激情精品 | 国产日韩高清在线 | 成年人看片网站 | 91在线视频在线观看 | 丁香花中文在线免费观看 | 在线你懂的视频 | 美女视频永久黄网站免费观看国产 | 天天干 天天摸 天天操 | 水蜜桃亚洲一二三四在线 | 亚洲欧美日韩国产一区二区 | 欧美日韩在线观看一区二区三区 | 日韩免费网站 | 国内精品视频一区二区三区八戒 | 久久亚洲私人国产精品 | 久久综合精品一区 | 精品欧美在线视频 | 精品夜夜嗨av一区二区三区 | 美女久久久久久久 | 友田真希x88av | 亚洲午夜大片 | 成人av影视在线 | 日韩欧美一区二区三区在线 | 久久久精品国产免费观看一区二区 | 亚洲一区二区三区91 | 狠狠干免费 | 欧美 亚洲 另类 激情 另类 | 国产一区二区精品在线 | av片免费播放 | 怡红院久久 | 久久综合欧美 | 国产99久久精品一区二区永久免费 | 国产原创在线观看 | 成片人卡1卡2卡3手机免费看 | 午夜精品麻豆 | 日韩免费视频观看 | 日韩网站在线免费观看 | 免费看的av片 | 园产精品久久久久久久7电影 | 国产精品久久久久久久久久尿 | 欧美在线视频精品 | 国产一性一爱一乱一交 | 日韩欧美在线观看一区二区三区 | 国产高清精 | 园产精品久久久久久久7电影 | 天天干夜夜夜 | 亚州成人av在线 | 国产黄色精品网站 | 最近2019好看的中文字幕免费 | 日韩理论片在线观看 | 激情图片久久 | 韩国三级在线一区 | 免费能看的黄色片 | 成人午夜黄色 | 视频一区视频二区在线观看 | 天天色婷婷 | 亚洲精品乱码久久久久久蜜桃不爽 | 91网址在线看 | 久久精品国产亚洲a | 国产麻豆视频免费观看 | 午夜123| 久久久穴 | 免费一级片在线 | 91香蕉视频好色先生 | 国产1区2区3区精品美女 | a在线观看国产 | 超碰97在线人人 | 日韩一区二区三区在线看 | 四虎影视成人永久免费观看视频 | 91日韩在线专区 | 视频国产在线观看18 | 国产91精品一区二区绿帽 | 日日夜夜噜噜噜 | 天天干天天做天天爱 | 免费又黄又爽视频 | 久久久久久久久免费视频 | 成人蜜桃网| 黄色一级大片在线观看 | ,午夜性刺激免费看视频 | 综合伊人av | 一区二区三区日韩视频在线观看 | 免费在线国产精品 | 日本巨乳在线 | 蜜臀久久99精品久久久久久网站 | 国产精品免费视频一区二区 | 久草视频视频在线播放 | 青青河边草免费直播 | 国产91精品看黄网站在线观看动漫 | 日日操网 | 中文字幕你懂的 | 亚洲精品乱码久久久久久蜜桃91 | 91在线精品一区二区 | 欧美国产三区 | 亚洲综合色视频 | 国产精品专区一 | 人人射人人插 | 中文字幕在线不卡国产视频 | 在线日韩视频 | 久草综合在线 | 成年人国产精品 | 成人国产亚洲 | 亚洲激情视频在线 | 国产剧在线观看片 | 波多在线视频 | 国产精品18久久久久久不卡孕妇 | 91精品国自产在线偷拍蜜桃 | 99免费看片| 欧美va在线观看 | 亚洲综合色丁香婷婷六月图片 | 国产一级特黄毛片在线毛片 | 国产精品18久久久久久久网站 | 欧美成天堂网地址 | 激情五月婷婷 | 国产精品v a免费视频 | 色视频在线观看免费 | 亚洲三级视频 | 探花视频在线观看免费版 | 99精品视频在线播放观看 | 亚洲免费高清视频 | 99视频导航 | 欧美中文字幕第一页 | 91精品国产91 | 亚洲永久精品在线观看 | 高清精品在线 | 亚洲天堂网在线播放 | 亚洲国产中文字幕在线观看 | 久久精品视频2 | 成全免费观看视频 | 亚洲欧美日韩精品久久奇米一区 | 精品高清视频 | 91视频久久久久 | 96亚洲精品久久 | 亚洲一区二区三区精品在线观看 | 97国产大学生情侣白嫩酒店 | 欧美色精品天天在线观看视频 | 日韩成人免费电影 | 免费福利片 | 精品国产乱码久久久久久三级人 | 中文资源在线播放 | 久草视频在线新免费 | 日韩精品你懂的 | 精品久久久久久国产91 | 日韩免费不卡av | 亚洲精品资源在线 | 亚洲 欧美 综合 在线 精品 | 天天拍天天操 | 亚洲全部视频 | 中文在线字幕免费观看 | 人人草在线视频 | 婷婷丁香在线视频 | 国产91精品一区二区麻豆亚洲 | 91自拍视频在线观看 | 国产精品久久在线 | 色先锋资源网 | 国产精品一区二区三区电影 | 五月婷婷丁香在线观看 | 黄色大片免费网站 | 国产成人福利在线观看 | 蜜臀91丨九色丨蝌蚪老版 | 免费视频 三区 | 成人黄色毛片视频 | 狠狠色丁香婷婷综合久小说久 | 在线观看一区二区精品 | 国产日韩视频在线 | 久草在线手机观看 | 91麻豆操| 国内精品亚洲 | 97小视频 | 国产黄色片久久久 | 成人免费在线播放 | 在线久草视频 | 黄色一级动作片 | 国产一区二区三区黄 | 综合五月婷婷 | 欧美一性一交一乱 | 五月综合激情婷婷 | 日韩二区三区在线观看 | 一区二区三区在线看 | 看片一区二区三区 | 视频91在线 | 午夜免费电影院 | 久久综合色天天久久综合图片 | 91高清不卡 | 成人国产精品久久久久久亚洲 | 玖玖玖精品 | 国产一区二区三区免费在线 | 黄色大片av | 8x成人免费视频 | 91精品国产欧美一区二区 | 中文字幕在线一二 | 激情亚洲综合在线 | 97在线观视频免费观看 | 午夜精品福利影院 | 日韩精品中文字幕在线播放 | 久久综合狠狠综合 | 日韩大片免费在线观看 | 婷婷 中文字幕 | 毛片一级免费一级 | 精品日韩中文字幕 | 黄色成人在线观看 | 亚洲午夜电影网 | 天天干com | 国产精品福利小视频 | 国产免费成人av | av日韩国产 | 蜜臀av性久久久久蜜臀aⅴ流畅 | 98超碰在线观看 | 日韩久久久久久久久久久久 | 久久婷婷五月综合色丁香 | 久久久久在线观看 | 亚洲伊人色 | 99视频在线观看视频 | 国产精品网红福利 | 成人国产一区二区 | 久久免费大片 | 久草影视在线 | 91亚洲精品久久久蜜桃网站 | 在线观看香蕉视频 | 天天干人人干 | 2019中文字幕第一页 | 免费男女羞羞的视频网站中文字幕 | 国产精品专区在线观看 | 特级黄录像视频 | 久久国产午夜精品理论片最新版本 | 午夜免费久久看 | 黄色国产高清 | 狠狠色丁香 | 五月婷婷开心中文字幕 | 91麻豆精品国产91久久久久 | 久久精品国产99国产 | 在线观看黄网站 | 精品1区2区3区 | 欧美性猛片, | 国产分类视频 | 99久久99久久免费精品蜜臀 | 久草线| 国产精品亚 | 91免费高清视频 | 国产在线精品一区二区三区 | 国产成人精品免费在线观看 | 韩日三级在线 | 国产免费又粗又猛又爽 | 国产精品21区 | 国产精品视频久久久 | 99精品视频在线观看免费 | 亚洲精品在线观看不卡 | 日日夜夜天天综合 | av电影中文字幕 | 在线视频麻豆 | 少妇bbw搡bbbb搡bbbb | 波多野结衣在线播放视频 | 欧美成年黄网站色视频 | 天天艹日日干 | 欧美日韩性视频 | 中文字幕在线成人 | 国产黄色大片 | 免费一区在线 | 69国产成人综合久久精品欧美 | 99视频导航 | 99re在线视频观看 | 狠狠婷婷 | 91黄站| 国产黄色一级大片 | 久久免费黄色大片 | 美女精品久久久 | 久久久久久97三级 | 久久久亚洲精品 | 一区二区精品视频 | 国产91在线看 | 成年人免费在线观看 | 小草av在线播放 | 免费日韩 | 欧美一级性生活片 | 99精品视频在线播放免费 | 婷婷色中文 | 天天干婷婷 | 国产视频一区在线免费观看 | 亚洲黄色av网址 | 国产在线视频在线观看 | 欧美一级大片在线观看 | 免费a级毛片在线看 | 97中文字幕 | 天天干婷婷 | 成人h视频在线 | 又紧又大又爽精品一区二区 | 伊人影院在线观看 | 久久综合之合合综合久久 | www.夜色321.com | 天天舔天天射天天操 | 97视频在线观看网址 | 国产精品久久久久久久久久尿 | 天天操天天射天天爱 | 亚洲人成免费网站 | 97免费在线观看视频 | 国产欧美日韩视频 | 中午字幕在线观看 | 日韩天天操 | 91麻豆精品国产91久久久无需广告 | 国产精品久久电影观看 | 日韩av电影中文字幕 | 久久草av| 欧美最爽乱淫视频播放 | 人人澡人人添人人爽一区二区 | 久久一精品 | 国产一区二区不卡视频 | 欧美精品亚州精品 | 精品一区三区 | 亚洲午夜精品一区 | 一区二区三高清 | 精品久久久久久久久亚洲 | 丁香婷婷射 | www激情久久 | 亚洲视频在线观看 | 日韩在线视频精品 | 91丨九色丨国产在线 | 国产免费一区二区三区最新6 | 免费av 在线 | 99视频在线免费 | a黄色片在线观看 | 日韩在线观看精品 | 亚洲综合在线观看视频 | 中文字幕亚洲欧美日韩 | 粉嫩av一区二区三区免费 | 久99久在线视频 | 亚洲精品免费在线观看视频 | 激情av在线资源 | 超碰97国产在线 | 精品久久精品久久 | 中文字幕久久精品亚洲乱码 | 全久久久久久久久久久电影 | 日本在线观看视频一区 | av免费黄色| 天天爽夜夜爽人人爽曰av | 久久成人高清视频 | 在线精品视频免费观看 | 天天射网 | 国产麻豆精品在线观看 | 成人国产精品av | 99免费看片 | 黄色免费大片 | 日本99干网 | 久久久久麻豆v国产 | 91精品一区国产高清在线gif | 国产成人综合精品 | 日韩一区二区三区免费电影 | 一区二区精品久久 | 亚洲精品乱码久久久一二三 | 99精品国产一区二区三区麻豆 | 狠狠色丁香婷婷综合欧美 | 国产精品久久久精品 | 在线不卡中文字幕播放 | 国产999精品久久久 免费a网站 | 免费91麻豆精品国产自产在线观看 | 五月婷婷av在线 | 国产成人精品在线 | 国产日韩精品一区二区 | 国产99色 | 久久最新网址 | 成人网中文字幕 | 一区二区三区 中文字幕 | 人人干在线 | 日韩欧美精品在线观看 | 亚洲日本va在线观看 | 日本一区二区高清不卡 | 久久线视频 | 在线 欧美 日韩 | 成人av影视观看 | 在线看片日韩 | 手机在线看永久av片免费 | 在线观看中文字幕 | 99久久久久免费精品国产 | 久久麻豆精品 | 国产v在线观看 | 在线观看成年人 | 国产高清免费 | av中文字幕电影 | 九九有精品| 九九热1| 国产午夜一级毛片 | 中文字幕亚洲综合久久五月天色无吗'' | 亚洲一二区精品 | 521色香蕉网站在线观看 | 久久精精品视频 | 亚洲免费在线观看视频 | 亚洲 欧美 变态 国产 另类 | 国产精品乱码久久久 | 久久久福利视频 | 在线免费观看视频 | 91禁在线看 | 亚洲特级毛片 | 日韩精品在线播放 | 亚洲理论在线 | 国产看片免费 | 久久精品一区二区三区国产主播 | 亚洲成人资源在线观看 | 97超视频免费观看 | 丁香九月激情 | 亚洲国产日韩一区 | 天天夜夜狠狠操 | 一级淫片a | 91久久黄色| 一区二区三区四区五区六区 | 日韩亚洲国产中文字幕 | 欧美日韩在线观看视频 | 808电影免费观看三年 | 久久伊99综合婷婷久久伊 | 亚洲国产色一区 | 少妇性xxx| 18久久久久久 | 久久99国产精品久久99 | 免费aa大片 | 97国产大学生情侣白嫩酒店 | 国产精品免费在线播放 | 888av| 久久久久久美女 | 久久不见久久见免费影院 | www.亚洲精品视频 | 日本黄色免费在线观看 | 狠狠色狠狠色综合系列 | 精品国产乱码久久 | 免费视频97| 久久久午夜电影 | 欧洲精品码一区二区三区免费看 | 日韩av区 | 成人一级在线 | 粉嫩av一区二区三区四区 | 99久久精品一区二区成人 | 欧美激情奇米色 | 亚洲精品在线观看不卡 | 夜夜操狠狠干 | 久久久久久久久久久免费av | 国产精品毛片久久 | 国产中文字幕大全 | 亚洲电影成人 | 成人羞羞视频在线观看免费 | 免费中午字幕无吗 | 久久人人97超碰国产公开结果 | 亚洲精品国产视频 |