日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据预处理工具_数据预处理

發(fā)布時間:2023/11/29 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据预处理工具_数据预处理 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

數(shù)據(jù)預(yù)處理工具

As the title states this is the last project from Udacity Nanodegree. The goal of this project is to analyze demographics data for customers of a mail-order sales company in Germany.

如標(biāo)題所示,這是Udacity Nanodegree的最后一個項目。 該項目的目的是為德國一家郵購銷售公司的客戶分析人口統(tǒng)計數(shù)據(jù)。

The project is divided into four main steps, each with it its unique goals:

該項目分為四個主要步驟,每個步驟都有其獨特的目標(biāo):

  • Pre-process the data

    預(yù)處理數(shù)據(jù)

  • The goal of this step is to get familiar with the provided data and perform different cleaning steps to use the data in the next stage.

    此步驟的目標(biāo)是熟悉提供的數(shù)據(jù),并執(zhí)行不同的清理步驟以在下一階段使用這些數(shù)據(jù)。

    Some things I did:

    我做了一些事情:

    • Check missing values (columns and rows)

      檢查缺失值(列和行)
    • Transformed features (create dummy variables )

      變換后的特征(創(chuàng)建虛擬變量)
    • Impute values to remove missing values

      估算值以刪除缺失值
    • Scaled features

      縮放功能
    • Dropped highly correlated features

      刪除了高度相關(guān)的功能

    2. Use unsupervised learning algorithms to perform customer segmentation

    2.使用無監(jiān)督學(xué)習(xí)算法進行客戶細(xì)分

    The objective in this step is to find features that differentiate between customers and the general population.

    此步驟的目標(biāo)是找到可以區(qū)分客戶和一般人群的功能。

    Some things I did:

    我做了一些事情:

    • Used PCA to reduce the dimensionality

      使用PCA減少尺寸
    • Interpreted the first components to get an understanding of the attributes

      解釋了第一個組件以了解屬性
    • Used KMeans to cluster the attributes and compared the two different groups

      使用KMeans對屬性進行聚類并比較兩個不同的組

    3. Use supervised learning algorithms to predict if an individual will become a customer

    3.使用監(jiān)督學(xué)習(xí)算法來預(yù)測個人是否會成為客戶

    In this step a new dataset was introduced, which had the same attributes as before but with a column ‘RESPONSE’. This column indicates if an individual became a customer.

    在這一步中,引入了一個新的數(shù)據(jù)集,該數(shù)據(jù)集具有與以前相同的屬性,但帶有“ RESPONSE”列。 此列指示個人是否成為客戶。

    The goal is to train a classification algorithm on that data.

    目標(biāo)是針對該數(shù)據(jù)訓(xùn)練分類算法。

    Some things I did:

    我做了一些事情:

    • Checked multiple classifiers to find the best

      檢查多個分類器以找到最佳分類器
    • Hyperparameter tuning for the best classifier

      超參數(shù)調(diào)整以獲得最佳分類器

    4. Make prediction on an unseen dataset and upload result to Kaggle

    4.對看不見的數(shù)據(jù)集進行預(yù)測,然后將結(jié)果上傳到Kaggle

    In the final step the trained classification algorithm should be used to make prediction on unseen data and upload the results to the Kaggle competition

    在最后一步中,應(yīng)使用訓(xùn)練有素的分類算法對看不見的數(shù)據(jù)進行預(yù)測,并將結(jié)果上傳到Kaggle競賽中

    數(shù)據(jù)預(yù)處理 (Pre-processing of the data)

    In this part I will explain the steps I took to make the data usable. But first lets take a look on the datasets. Udacity provided four datasets for this project and two Excel files with descriptions of the attributes, since they were in German:

    在這一部分中,我將說明為使數(shù)據(jù)可用而采取的步驟。 但是首先讓我們看一下數(shù)據(jù)集。 Udacity為該項目提供了四個數(shù)據(jù)集和兩個帶有屬性描述的Excel文件,因為它們是德語的:

    Udacity_AZDIAS_052018.csv:

    Udacity_AZDIAS_052018.csv:

    • Demographics data for the general population of Germany

      德國總?cè)丝诘娜丝诮y(tǒng)計數(shù)據(jù)
    • 891 211 persons (rows) x 366 features (columns).

      891211人(行)x 366個特征(列)。

    Udacity_CUSTOMERS_052018.csv:

    Udacity_CUSTOMERS_052018.csv:

    • Demographics data for customers of a mail-order company

      郵購公司客戶的人口統(tǒng)計數(shù)據(jù)
    • 191 652 persons (rows) x 369 features (columns).

      191652人(行)x 369個特征(列)。

    Udacity_MAILOUT_052018_TRAIN.csv:

    Udacity_MAILOUT_052018_TRAIN.csv:

    • Demographics data for individuals who were targets of a marketing campaign

      營銷活動目標(biāo)人群的人口統(tǒng)計數(shù)據(jù)
    • 42 982 persons (rows) x 367 (columns).

      42982人(行)x 367(列)。

    Udacity_MAILOUT_052018_TEST.csv:

    Udacity_MAILOUT_052018_TEST.csv:

    • Demographics data for individuals who were targets of a marketing campaign

      營銷活動目標(biāo)人群的人口統(tǒng)計數(shù)據(jù)
    • 42 833 persons (rows) x 366 (columns)

      42833人(行)x 366(列)

    The first step I took was to check for missing values. From the visual assessment I noticed, that the dataset AZDIAS contained missing values (NaNs), but there were also other encodings for missing or unknown data like ‘-1’. A quick check with the Excel file revealed that missing or unknown values are also encoded with -1, 0 or 9.

    我采取的第一步是檢查缺失值。 從視覺評估中,我注意到,數(shù)據(jù)集AZDIAS包含缺失值(NaNs),但是對于缺失或未知數(shù)據(jù)也有其他編碼,例如“ -1”。 快速檢查Excel文件顯示,缺失或未知的值也用-1、0或9編碼。

    It wasn’t possible just to replace the numbers with np.NaN, because 9 or 0 are also encoded with different meanings for other Attributes. So, I loaded the Excel file in pandas and created a DataFrame with the name of each attribute and the corresponding values for missing or unknown data. With a for-loop I looped through the AZDIAS DataFrame and only performed the transformation for attributes that have -1, 0 or 9 as an encoding for missing or unknown data.

    僅用np.NaN替換數(shù)字是不可能的,因為9或0也被編碼為其他屬性具有不同的含義。 因此,我將Excel文件加載到了熊貓中,并創(chuàng)建了一個DataFrame,其中包含每個屬性的名稱以及丟失或未知數(shù)據(jù)的相應(yīng)值。 通過for循環(huán),我遍歷了AZDIAS DataFrame,僅對具有-1、0或9的屬性執(zhí)行了轉(zhuǎn)換,以作為丟失或未知數(shù)據(jù)的編碼。

    At that point I also noticed that the count of the attributes in the Excel file isn’t equal to the columns in the AZDIAS DataFrame. After further inspection I came to the result that only 272 Attributes are in the DataFrame that are also in the Excel file and vice versa. Based on the idea that I only can use attributes for which I have the description I dropped those that weren’t in both files. So, I dropped about 94 attributes. In the limitations section of this article I will address this decision, as it turns out it was quite a unique approach.

    那時,我還注意到Excel文件中的屬性計數(shù)不等于AZDIAS DataFrame中的列。 經(jīng)過進一步檢查,我得出的結(jié)果是,DataFrame中只有272個屬性也位于Excel文件中,反之亦然。 基于我只能使用具有描述的屬性的想法,我刪除了兩個文件中都不存在的屬性。 因此,我刪除了約94個屬性。 在本文的局限性部分,我將討論這個決定,因為事實證明這是一個非常獨特的方法。

    Now that all the missing values are accounted for, I plotted the count of missing values in each column in a histogram:

    現(xiàn)在已經(jīng)考慮了所有缺失值,我在直方圖中繪制了每列中缺失值的計數(shù):

    Count of columns with missing values缺少值的列數(shù)

    Bases on the histogram I removed cloumns with more than 200000 missing value. I also check for missing values on the row level.

    根據(jù)直方圖,我刪除了缺失值超過200000的克隆。 我還檢查行級別的缺失值。

    Based on this histogram I decided to remove columns that had more than 50 missing values. So all in all I removed 7 columns and 153955 rows.

    基于此直方圖,我決定刪除缺失值超過50的列。 因此,我總共刪除了7列和153955行。

    Check non-numeric attributes

    檢查非數(shù)字屬性

    If I want to use the attributes in the learning algorithms, I need to make sure that all of them are numeric. The following attributes were marked as objects.

    如果要在學(xué)習(xí)算法中使用屬性,則需要確保所有屬性都是數(shù)字。 以下屬性被標(biāo)記為對象。

    • CAMEO_DEU_2015: detailed classification variable with more than 44 items on the scale

      CAMEO_DEU_2015:詳細(xì)的分類變量,具有超過44個項目
    • CAMEO_DEUG_2015: classification variable for social status with 9 items but encoded in different dtypes (int and floats in the same column) and some rows contained XX

      CAMEO_DEUG_2015:具有9個項目的社會地位分類變量,但以不同的dtypes編碼(int和float在同一列中),并且某些行包含XX
    • OST_WEST_KZ: indication for former region (West-Germany, Ost-Germany) encoded with W and O

      OST_WEST_KZ:以W和O編碼的先前區(qū)域(西德,東德)的指示

    I made the necessary transformations to CAMEO_DEUG_2015 and OST_WEST_KZ and decided to drop CAMEO_DEU_2015, because there were to many items.

    我對CAMEO_DEUG_2015和OST_WEST_KZ進行了必要的轉(zhuǎn)換,并決定刪除CAMEO_DEU_2015,因為其中有很多項目。

    Now that all of the attributes are numeric, I manually checked for categorical data that needed to be transformed to dummy variables. I discovered 11 categorical features:

    現(xiàn)在,所有屬性都是數(shù)字屬性,我手動檢查了需要轉(zhuǎn)換為虛擬變量的分類數(shù)據(jù)。 我發(fā)現(xiàn)了11個分類功能:

    • ANREDE_KZ, CJT_GESAMTTYP, GEBAEUDETYP, GEBAEUDETYP_RASTER, HEALTH_TYP, KBA05_HERSTTEMP, KBA05_MAXHERST, KBA05_MODTEMP, NATIONALITAET_KZ, SHOPPER_TYP, VERS_TYP

      ANREDE_KZ,CJT_GESAMTTYP,GEBAEUDETYP,GEBAEUDETYP_RASTER,HEALTH_TYP,KBA05_HERSTTEMP,KBA05_MAXHERST,KBA05_MODTEMP,NATIONALITAETET_KZ,SHOPPER_TYP,VERS_TYP

    In the same step I also noted which attributes need to be dropped, because they would add to much complexity to the model (mainly attributes with a scale higher than 10)

    在同一步驟中,我還指出了需要刪除哪些屬性,因為它們會增加模型的復(fù)雜性(主要是比例大于10的屬性)

    • GFK_URLAUBERTYP, LP_FAMILIE_FEIN, LP_LEBENSPHASE_GROB, LP_FAMILIE_GROB, LP_LEBENSPHASE_FEIN

      GFK_URLAUBERTYP,LP_FAMILIE_FEIN,LP_LEBENSPHASE_GROB,LP_FAMILIE_GROB,LP_LEBENSPHASE_FEIN

    Now with the main cleaning steps finished I created a function that cleaned the dataset with the customers data (Udacity_CUSTOMERS_052018.csv). For the next steps it is very important that both datasets have the same shape and columns. I had to remove one column that was created as a dummy variable from the customers dataset ‘GEBAEUDETYP_5.0’.

    現(xiàn)在完成了主要的清理步驟,我創(chuàng)建了一個使用客戶數(shù)據(jù)清理數(shù)據(jù)集的函數(shù)(Udacity_CUSTOMERS_052018.csv)。 對于后續(xù)步驟,兩個數(shù)據(jù)集具有相同的形狀和列非常重要。 我必須從客戶數(shù)據(jù)集“ GEBAEUDETYP_5.0”中刪除作為虛擬變量創(chuàng)建的一列。

    Imputation and scaling features

    插補和縮放功能

    To use columns with missing values I imputed the median for each column. I decided to use the median, because most of the attributes are ordinal scaled, which means that they are categorical but have a quasi linear context. In that case the median is ‘best’ way to impute

    為了使用缺少值的列,我估算了每列的中位數(shù)。 我決定使用中位數(shù),因為大多數(shù)屬性都是按序縮放的,這意味著它們是分類的,但具有準(zhǔn)線性上下文。 在這種情況下,中位數(shù)是“最佳”估算方式

    The second to last thing I did in the preprocessing step was to scale the features. I used to standardize them, which means that the new data has a mean of 0 and a std of 1.

    我在預(yù)處理步驟中所做的倒數(shù)第二件事是縮放功能。 我曾經(jīng)將它們標(biāo)準(zhǔn)化,這意味著新數(shù)據(jù)的平均值為0,std為1。

    And finally, the last thing I did was to eliminate columns that had a correlation above 0.95.

    最后,我要做的最后一件事是消除相關(guān)性高于0.95的列。

    • KBA13_HERST_SONST, KBA13_KMH_250, LP_STATUS_GROB, ANREDE_KZ_2.0, KBA05_MODTEMP_5.0

      KBA13_HERST_SONST,KBA13_KMH_250,LP_STATUS_GROB,ANREDE_KZ_2.0,KBA05_MODTEMP_5.0

    2.使用無監(jiān)督學(xué)習(xí)算法進行客戶細(xì)分 (2. Use unsupervised learning algorithms to perform customer segmentation)

    The first objective was to reduce the dimensions. After the preprocessing step I still had close to 300 features. To reduce dimensionality, we can use Principal Component Analysis. PAC uses Singular Value Decomposition of the data to project it onto a lower dimensional space. Simply put, it reduces the complexity of a high feature model.

    第一個目標(biāo)是減小尺寸。 在預(yù)處理步驟之后,我仍然擁有近300個功能。 為了降低維數(shù),我們可以使用主成分分析。 PAC使用數(shù)據(jù)的奇異值分解將其投影到較低維度的空間上。 簡而言之,它降低了高功能模型的復(fù)雜性。

    According to the book ‘Hands on Machine Learning’, it is important to choose a number of dimensions that add up to a sufficiently large portion of variance, like 95%. So, in this case I can reduce the number of dimensions by roughly 50% down to 150.

    根據(jù)《機器學(xué)習(xí)的動手》一書,選擇許多維數(shù)非常重要,這些維加起來需要足夠大的方差,例如95%。 因此,在這種情況下,我可以將尺寸數(shù)量減少大約50%,減少到150。

    I will briefly explain the first three competent to give an idea what they are about. I printed the top positve and negative weights for each component:

    我將簡要解釋前三名主管,以給出他們的想法。 我打印了每個組件的最高位置和負(fù)重量:

    Principal Component 1

    主要成分1

    The first component is mainly related with wealth, status and number of family houses in region(PLZ8):

    第一部分主要與該地區(qū)的家庭財產(chǎn),地位和數(shù)量有關(guān)(PLZ8):

    • HH_EINKOMMEN_SCORE: estimated household income

      HH_EINKOMMEN_SCORE:估計的家庭收入
    • CAMEO_DEUG_2015: social status of the individual (upper class -> urban working class)

      CAMEO_DEUG_2015:個人的社會地位(上層階級->城市工人階級)
    • PLZ8_ANTG1/3/4: number of family houses in the neighborhood

      PLZ8_ANTG1 / 3/4:附近的家庭住宅數(shù)量
    • MOBI_REGIO: moving patterns (high mobility -> very low mobility)

      MOBI_REGIO:移動模式(高移動性->低移動性)
    • LP_Status_FEIN: social status (typical low-income earners -> top earners)

      LP_Status_FEIN:社會地位(典型的低收入者->最高收入者)

    Principal Component 2

    主要組成部分2

    The second component is related to cars:

    第二部分與汽車有關(guān):

    • KBA13_HERST_BMW_BENZ: share of BMW & Mercedes Benz within the PLZ8

      KBA13_HERST_BMW_BENZ:PLZ8中寶馬和奔馳的份額
    • KBA13_SEG_OBERMITTELKLASSE: share of upper middle-class cars and upper-class cars (BMW5er, BMW7er etc.)

      KBA13_SEG_OBERMITTELKLASSE:上等中產(chǎn)車和上等車(BMW5er,BMW7er等)的份額
    • KBA13_HALTER_50/55/20: age of car owner

      KBA13_HALTER_50 / 55/20:車主的年齡

    Principal Component 3

    主要組成部分3

    The third component is related to age, financial decisions and transactions:

    第三部分與年齡,財務(wù)決策和交易有關(guān):

    • PRAEGENDE_JUGENDJAHRE: dominating movement in the person’s youth (avantgarde or mainstream)

      PRAEGENDE_JUGENDJAHRE:在青年時代(前衛(wèi)或主流)主導(dǎo)運動
    • FINANZ _SPARER: financial typology: money saver (very high -> very low)

      FINANZ _SPARER:財務(wù)類型:省錢(非常高->非常低)
    • D19_GESAMT_ANZ_24: transaction activity TOTAL POOL in the last 24 months (no transaction -> very high activity)

      D19_GESAMT_ANZ_24:過去24個月的交易活動總計TOTAL POOL(無交易->交易量很高)
    • FINANZ_VORSORGER: financial typology be prepared (very high -> very low)

      FINANZ_VORSORGER:準(zhǔn)備財務(wù)類型(非常高->非常低)
    • ALTERSKATEGORIE_GROB: age classification through prename analysis

      ALTERSKATEGORIE_GROB:通過姓氏分析進行年齡分類

    聚類 (Clustering)

    Now that we reduced the number of dimensions in both datasets and get a brief understanding of the first components, it is time to cluster them to see if there are any differences between the clusters from the general population and the ones from the customers population. To achievethis, I will use KMeans.

    現(xiàn)在,我們減少了兩個數(shù)據(jù)集中的維數(shù),并簡要了解了第一個組件,是時候?qū)λ鼈冞M行聚類了,以查看來自一般總體的聚類和來自客戶總體的聚類之間是否存在差異。 為此,我將使用KMeans。

    We can use the ‘Elbow’-method to get ‘right’ number of clusters. An ‘Elbow’ is defined as the point in the above chart where the decrease in Inertia almost flattens. In my case there isn’t a clear ‘Elbow’ point. 10 seems to be a good choice to have enough clusters to compare against but not too much to add unnecessary complexity.

    我們可以使用“肘”方法來獲得“正確的”簇數(shù)。 上圖中的“肘”定義為慣性下降幾乎趨于平穩(wěn)的點。 就我而言,沒有明確的“肘”點。 10有足夠的集群進行比較似乎是一個不錯的選擇,但又不要過多,以免增加不必要的復(fù)雜性。

    Comparing AZDIAS cluster with CUSTOMERS cluster

    比較AZDIAS集群和CUSTOMERS集群

    It is clear to see that almost every cluster differentiate between the customers and the general population. When looking at the bars we can easily see which cluster is overrepresented by the customers, which means that customers can be described by the features for that cluster. Customers can be described with the features from cluster 0, 7and 6.

    顯而易見,幾乎每個集群都在客戶和普通人群之間有所區(qū)別。 當(dāng)查看條形圖時,我們可以輕松地看到客戶代表了哪個集群,這意味著可以通過該集群的功能來描述客戶。 可以使用群集0、7和6中的功能描述客戶。

    We can also describe individuals that won’t become our customers, when we are looking at the clusters where the population is overrepresented, like cluster 8, 3 and 9.

    當(dāng)我們查看人口過多的集群時,例如集群8、3和9,我們還可以描述不會成為客戶的個人。

    The main customers of the company

    公司主要客戶

    An individual part of that clusters 0:

    該部分的單個部分聚集為0:

    • lives in an area with mostly family homes and low unemployment

      生活在大部分家庭住宅和低失業(yè)率的地區(qū)
    • has a higher affinity for a fightfull attitude and is financial prepared.

      對斗志滿滿的態(tài)度有較高的親和力,并且有充分的財務(wù)準(zhǔn)備。
    • but has low financial interest, is not an investor and not good with saving money

      但經(jīng)濟利益低,不是投資者,也不擅長存錢
    • not really culturally minded

      沒有真正的文化意識

    An individual part of clusters 7 is mainly described by its car choice:

    集群7的單個部分主要通過其汽車選擇來描述:

    • has a high income and a high share of upper class cars (BMW 7er etc)

      收入高,高檔轎車比例高(寶馬7er等)
    • high share of cars per household

      每個家庭的汽車占有率很高
    • very few cars with a max speed between 110 and 210 and were built between 2000 and 2003, so mostly new cars

      在2000年至2003年之間生產(chǎn)的極少數(shù)汽車的最高速度在110至210之間
    • has in his area a lot less vans, compared to country average

      與全國平均水平相比,他所在地區(qū)的貨車少很多

    An individual part of this cluster 6:

    該集群的一部分6:

    • lives in a low density area in an old building, with only a few family houses around

      住在一棟舊樓的低密度區(qū)域,周圍只有幾戶人家
    • has low purchasing power but still a higher car share per household

      購買力低,但每個家庭的汽車份額仍然較高
    • is more minimalistic / independent

      更簡約/獨立
    • low financial interest

      財務(wù)利益低
    • high online affinity

      網(wǎng)上親和力高

    Now lets look at clusters where customers are underrepressented

    現(xiàn)在,讓我們看看客戶壓力不足的集群

    An individual part of this cluster 8:

    該集群的一部分8:

    • has high purchasing power, but has a lower income

      具有較高的購買力,但收入較低
    • is part of the lower middle-class / working-class

      是下層中產(chǎn)階級/工人階級的一部分
    • has a low number of family homes in the area

      該地區(qū)的家庭住宅數(shù)量少
    • low online affinity and share of cars per household

      在線親和力低,每戶擁有汽車的比例低
    • low car share per household

      每個家庭的汽車占有率低

    An individual part of this cluster 3:

    該集群的一部分:

    • has high mobility, but a low number of cars with less than 5 seats

      機動性高,但座位數(shù)少于5的汽車數(shù)量少
    • dives mostly small cars (high number of very small cars (Ford Fiesta, Ford Ka) and low number of BMW and Mercedes)

      大多潛水小型車(大量的小型車(福特嘉年華,福特嘉年華)和少量的寶馬和梅賽德斯)
    • is mostly between 21 and 25 and drives cars from Asian manufactures

      通常在21至25歲之間,并駕駛來自亞洲制造商的汽車
    • high share hare of car owners below 31 within the PLZ8

      PLZ8以內(nèi)31歲以下車主的高份額野兔
    • and interestingly high amount of campers

      有趣的是,大量的露營者

    For cluster 9 it is almost the same.

    對于群集9,幾乎是相同的。

    3.使用監(jiān)督學(xué)習(xí)算法來預(yù)測個人是否會成為客戶 (3. Use supervised learning algorithms to predict if am individual will become a customer)

    Now that I have found which parts of the population are more likely to be customers of the mail-order company, it’s time to build the prediction model.

    現(xiàn)在,我已經(jīng)發(fā)現(xiàn)人口中的哪些部分更可能成為郵購公司的客戶,是時候建立預(yù)測模型了。

    I used the provided dataset Udacity_MAILOUT_052018_TRAIN.csv to train various models, select the best one and did some hyper-parameter tuning to increase the effectiveness of my model. But first I had to clean the data.

    我使用提供的數(shù)據(jù)集Udacity_MAILOUT_052018_TRAIN.csv來訓(xùn)練各種模型,選擇最佳模型,并進行一些超參數(shù)調(diào)整,以提高模型的有效性。 但是首先我必須清理數(shù)據(jù)。

    The cleaning was relatively simple because I can use the cleaning function created in the first part of the project. After that I check missing values:

    清理相對簡單,因為我可以使用在項目的第一部分中創(chuàng)建的清理功能。 之后,我檢查缺少的值:

    Based on the histograms I decided to only drop rows with more than 30% missing values.

    根據(jù)直方圖,我決定只刪除缺失值超過30%的行。

    To use the data for the learning algorithm I imputed the median, standardized the data and dropped highly correlated features (>0.95). In each step where I dropped columns, I made sure that I dropped the same columns in the test set (Udacity_MAILOUT_052018_TEST.csv) to make predictions on this unseen dataset.

    為了將數(shù)據(jù)用于學(xué)習(xí)算法,我估算了中位數(shù),對數(shù)據(jù)進行了標(biāo)準(zhǔn)化,并刪除了高度相關(guān)的特征(> 0.95)。 在放置列的每個步驟中,確保將相同的列都放置在測試集中(Udacity_MAILOUT_052018_TEST.csv),以便對該看不見的數(shù)據(jù)集進行預(yù)測。

    Finally, the fun part begins: creating the model and male predictions.

    最后,有趣的部分開始:創(chuàng)建模型和男性預(yù)測。

    First, I check the distribution of the relevant variable ‘RESPONSE’. As it turns out ‘RESPONSE’ is highly imbalanced: 0: 34565 and 1: 435.

    首先,我檢查相關(guān)變量“ RESPONSE”的分布。 事實證明,“響應(yīng)”高度不平衡:0:34565和1:435。

    If the variable of interest is imbalanced it is important to make sure of the following things:

    如果感興趣的變量不平衡,請確保以下幾點很重要:

    • use stratification for the tranig and validation set: Stratification is a technique to distribute the samples evenly based on sample classes so that training set and validation set have similar ratio of classes.

      對成績單和驗證集使用分層:分層是一種根據(jù)樣本類別均勻分配樣本的技術(shù),以便訓(xùn)練集和驗證集具有相似的類別比率。
    • choose the right evaluation metric: Simply choose accuracy won’t give you ‘a(chǎn)ccurate’ evaluations. The best one in this case would be the roc-auc socre This article explains it.

      選擇正確的評估指標(biāo):僅選擇準(zhǔn)確性不會給您“準(zhǔn)確”的評估。 在這種情況下最好的是roc-auc socre 本文對此進行了解釋。

    • use a gradient boosting algorithm: I will run multiple classification algorithms and choose the best one

      使用梯度提升算法:我將運行多種分類算法并選擇最佳的算法

    There are also some advanced techniques to deal with it that I wpn’t implement. You can read about it here.

    還有一些我不會實現(xiàn)的高級技術(shù)。 你可以在這里閱讀。

    Classification algorithms

    分類算法

    I tested the following classifications algorithms in a cross validation method:

    我以交叉驗證方法測試了以下分類算法:

    • LogisticRegression

      Logistic回歸
    • DecisionTreeClassifier

      DecisionTreeClassifier
    • RandomForestClassifier

      隨機森林分類器
    • AdaBoostClassifier

      AdaBoostClassifier
    • GradientBoostingClassifier

      梯度提升分類器

    I used sklearns StratifiedKFold method to make sure I used stratification when doing the evaluation of the classifiers.

    我使用sklearns StratifiedKFold方法來確保在評估分類器時使用分層。

    I created a pipeline where each model in the classifier dictionary gets evaluated on the ‘roc_auc’ scoring technique.

    我創(chuàng)建了一個管道,分類器字典中的每個模型都可以通過“ roc_auc”評分技術(shù)進行評估。

    Results

    結(jié)果

    • LogisticRegression: 0.5388771114225904

      Logistic回歸:0.5388771114225904
    • DecisionTreeClassifier: 0.5065447241661969

      DecisionTreeClassifier:0.5065447241661969
    • RandomForestClassifier: 0.5025457616916987

      隨機森林分類器:0.5025457616916987
    • AdaBoostClassifier: 0.5262902976401282

      AdaBoostClassifier:0.5262902976401282
    • GradientBoostingClassifier: 0.5461740415775044

      梯度提升分類器:0.5461740415775044

    As expected, the classifier using gradiant boosting git the best result. In the next step I used GridSearch to find the best Hyperparameters for the GradientBoostingClassifier

    不出所料,使用gradient boosting git的分類器效果最佳。 在下一步中,我使用GridSearch來找到GradientBoostingClassifier的最佳超參數(shù)

    With all other options on normal:

    在所有其他選項均正常的情況下:

    • learning_rate: 0.1

      學(xué)習(xí)率:0.1
    • max_death: 5

      max_death:5
    • n_estimators: 200

      n_estimators:200

    I increased the score from 0.546 to 0.594.

    我將分?jǐn)?shù)從0.546提高到0.594。

    4.對看不見的數(shù)據(jù)集進行預(yù)測,然后將結(jié)果上傳到Kaggle (4. Make prediction on an unseen dataset and upload result to Kaggle)

    Now that I tuned and trained the best model I can finally make predictions on the unseen dataset (Udacity_MAILOUT_052018_TEST.csv).

    現(xiàn)在,我已經(jīng)調(diào)整和訓(xùn)練了最佳模型,我終于可以對看不見的數(shù)據(jù)集(Udacity_MAILOUT_052018_TEST.csv)進行預(yù)測。

    For the final part I just had to impute the missing values and standardize the new dataset, made sure that the columns were the same and run the trained model on the new data.

    對于最后一部分,我只需要估算缺少的值并標(biāo)準(zhǔn)化新數(shù)據(jù)集,請確保列相同,然后對新數(shù)據(jù)運行經(jīng)過訓(xùn)練的模型。

    I transformed the output to the requirements of the Kaggle competition and uploaded my submission file.

    我將輸出轉(zhuǎn)換為Kaggle競賽的要求,并上傳了提交文件。

    I got a score of 0.536 in the Kaggle Competitio.

    我在Kaggle競賽中獲得0.536分。

    結(jié)論 (Conclusions)

    To recap, the first goal of this project was to perform an unsupervised learning algorithm to uncover differences between customers and the general population. The second goal was to perform a supervised learning algorithm to predict if an individual became a customer and the last goal was to use this trained model to predict on unseen data and upload the results to Kaggle.

    回顧一下,該項目的第一個目標(biāo)是執(zhí)行一種無監(jiān)督的學(xué)習(xí)算法,以發(fā)現(xiàn)客戶與一般人群之間的差異。 第二個目標(biāo)是執(zhí)行監(jiān)督學(xué)習(xí)算法,以預(yù)測個人是否成為客戶,最后一個目標(biāo)是使用經(jīng)過訓(xùn)練的模型來預(yù)測看不見的數(shù)據(jù),并將結(jié)果上傳到Kaggle。

    The first part (unsupervised learning) was very challenging for me. It was the first time that I worked with a huge datafile (> 1GB). So, at first it was quite frustrating working on the provided workspace, since some operations took a while. I decided to download the data to work on it on my local machine.

    第一部分(無監(jiān)督學(xué)習(xí))對我來說非常具有挑戰(zhàn)性。 這是我第一次使用巨大的數(shù)據(jù)文件(> 1GB)。 因此,起初,在提供的工作空間上進行工作非常令人沮喪,因為某些操作花費了一段時間。 我決定下載數(shù)據(jù)以在本地計算機上進行處理。

    Besides the huge dataset, the data cleaning was also very challenging, and I used quite frequently methods that I didn’t used before, so it was on the other side quite rewarding to implement a new method and get the expected result.

    除了龐大的數(shù)據(jù)集之外,數(shù)據(jù)清理也非常具有挑戰(zhàn)性,我經(jīng)常使用以前從未使用過的方法,因此,另一方面,實施一種新方法并獲得預(yù)期結(jié)果也頗有收獲。

    Again, it became clear that the most work a data scientist has is the cleaning step.

    同樣,很明顯,數(shù)據(jù)科學(xué)家要做的最大工作就是清理步驟。

    局限性 (Limitations)

    My final score is compared to others on Kaggle relatively low. I looked at a few other notebooks on github to get an idea why. It seems that my approach, to only keep the columns that are in the dataset and in the excel file is quite unique. To recap, I dropped 94 columns that weren’t in both files, with the idea that I can only use attributes for which I have the description. After the analysis I inspected the excel file and noticed that some Attributes are just spelled differently between the excel file and the dataset. So, all in all I probably dropped some columns that meight would increase my score.

    我的最終成績與Kaggle上的其他人相比較低。 我查看了github上的其他筆記本以了解原因。 看來,僅保留數(shù)據(jù)集中和excel文件中的列的方法非常獨特。 回顧一下,我刪除了兩個文件中都沒有的94列,以為我只能使用具有描述的屬性。 分析之后,我檢查了excel文件,發(fā)現(xiàn)excel文件和數(shù)據(jù)集之間的某些屬性拼寫有所不同。 因此,總的來說,我可能會丟掉一些可能會增加得分的列。

    Another thing that I noticed is that I dropped rows in the supervised learning part. Which is debatable because the variable of interest is to highly imbalanced and one can argue that it would be better to keep rows with missing values, so that there is a higher chance for the imbalanced value to appear.

    我注意到的另一件事是,我在有監(jiān)督的學(xué)習(xí)部分中刪除了行。 這是值得商because的,因為關(guān)注變量的高度不平衡,并且有人可能會說最好保留值缺失的行,這樣就更有可能出現(xiàn)不平衡的值。

    All in all, here are some things that could be checked to enhance the final score:

    總而言之,以下是可以提高最終得分的一些事情:

    • get a better understanding of the attributes and check if you can use more attributes without dropping them (keep attributes with more than 10 items)

      更好地了解屬性,并檢查是否可以使用更多屬性而不刪除它們(保留包含10個以上項目的屬性)
    • don’t drop attributes because they aren’t in the Excel file

      不要刪除屬性,因為它們不在Excel文件中
    • use more advanced methods to impute missing values (imputations based on distributions ore even use a learning algorithm to predict the missing value)

      使用更高級的方法來估算缺失值(基于分布礦的算力甚至使用學(xué)習(xí)算法來預(yù)測缺失值)
    • use more advanced techniques to deal with imbalanced data (Resampling to get more balanced data, weighted classes / cost sensitive learning).

      使用更先進的技術(shù)來處理不平衡的數(shù)據(jù)(重新采樣以獲得更平衡的數(shù)據(jù),加權(quán)類/對成本敏感的學(xué)習(xí))。

    If you are interested in the code, you can take a look at this Github repo.

    如果您對代碼感興趣,可以查看此 Github存儲庫。

    翻譯自: https://medium.com/@markusmller_92879/udacity-data-scientist-nanodegree-capstone-project-using-unsupervised-and-supervised-algorithms-c1740532820a

    數(shù)據(jù)預(yù)處理工具

    總結(jié)

    以上是生活随笔為你收集整理的数据预处理工具_数据预处理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    成人高清在线 | 亚洲人视频在线 | 天天天色 | 国产在线视频一区二区 | 在线免费观看黄色大片 | 18pao国产成视频永久免费 | 国产一在线精品一区在线观看 | 国产一区二区不卡视频 | 免费福利在线观看 | 成人久久亚洲 | 成年人在线免费看视频 | 99 精品 在线 | 亚洲资源片 | 久久99国产综合精品免费 | 999视频精品 | 久久精品99精品国产香蕉 | 亚洲中字幕 | 久久国产精品一二三区 | 久久久人人人 | 国产国语在线 | 91九色porny在线 | 日韩免费一区二区三区 | www.夜夜操| 亚洲va天堂va欧美ⅴa在线 | 黄网站色| 免费一级特黄毛大片 | 波多野结衣精品视频 | 婷婷爱五月天 | 91女子私密保健养生少妇 | 美女黄频在线观看 | 成人在线视频观看 | 国产成人久久77777精品 | 久久成人资源 | 成人a级免费视频 | 在线有码中文字幕 | 91欧美视频网站 | 人人爽人人插 | 久久激情视频免费观看 | 超碰久热| 久久99热久久99精品 | 1024手机基地在线观看 | 精品在线观看视频 | 日韩 在线观看 | 久久精品老司机 | 久草在线资源视频 | 麻豆免费视频观看 | 丝袜网站在线观看 | 久草手机视频 | 欧洲亚洲女同hd | 亚洲老妇xxxxxx| 一区二区三区免费看 | 天天干天天做 | 婷婷综合久久 | 国产日韩欧美在线观看视频 | 亚洲国产人午在线一二区 | 99精品在线直播 | 五月婷在线| 日本黄色免费看 | 人人爽人人爽 | 国产一级在线播放 | 9999精品视频 | 成人国产一区二区 | 四虎国产 | 久久免费的视频 | 天天av综合网 | 国产偷在线 | 亚洲爱爱视频 | av在线免费观看网站 | 丁香免费视频 | 久久成人精品电影 | 国产精品18p | 91在线国内视频 | 一区二区三区日韩在线观看 | 99久久精品国产亚洲 | 天天干天天操天天入 | 免费黄色a网站 | 亚洲性xxxx | 亚洲欧美日韩精品一区二区 | 日日草av | a√天堂中文在线 | 黄色app网站在线观看 | 色夜视频 | 午夜色站 | 激情久久久久 | 久久夜靖品 | 午夜久久影院 | 日韩丝袜| 亚洲三级黄 | 日韩在线电影 | 国产 一区二区三区 在线 | 精品亚洲免费视频 | 天天综合网久久综合网 | 欧美 日韩 国产 成人 在线 | 欧美日韩激情视频8区 | 日韩啪视频 | 麻豆精品视频在线观看免费 | 久久精品久久久久电影 | 91视频3p| 草久在线 | 久草视频在线免费播放 | 欧美日韩国产一区二区在线观看 | 国产精品久久久久久久久久白浆 | 免费a现在观看 | 婷婷在线视频观看 | 国产精品久久艹 | 久久久久久久久爱 | 亚洲精品在线看 | 国产精品第一视频 | 色欧美成人精品a∨在线观看 | 69国产精品视频免费观看 | 天天综合网天天 | 久草视频在线资源 | 在线观看视频一区二区三区 | 国产日韩欧美在线播放 | 欧美日在线 | 欧美午夜性 | 免费日韩 精品中文字幕视频在线 | 国产91精品在线播放 | 久久久国产精品网站 | 久草在线在线视频 | 久久婷婷视频 | 天天操操操操操 | 超碰在线人人艹 | 在线观看视频在线观看 | 欧美激情精品久久久久久免费印度 | 99久久这里有精品 | 福利视频区 | 日韩电影在线观看中文字幕 | av手机版| 欧美国产高清 | 精品影院一区二区久久久 | 四虎影视成人精品国库在线观看 | 欧美日韩国产在线精品 | 久久er99热精品一区二区三区 | 久草青青在线观看 | 特级黄色片免费看 | av大全在线免费观看 | 午夜视频欧美 | 91chinesexxx | 黄色1级大片 | 国产精品99久久免费观看 | 蜜臀久久99精品久久久酒店新书 | 偷拍区另类综合在线 | 丁香六月色| 精品电影一区 | 五月天激情电影 | 亚洲国产mv | 国产精品v欧美精品 | 久久国产精品免费观看 | 国产福利91精品一区 | 黄色毛片视频免费观看中文 | 久久成人精品 | 亚洲免费成人av电影 | 日韩精品中文字幕在线观看 | 日韩高清国产精品 | 久久深夜福利免费观看 | 免费日韩一区二区三区 | 国产男男gay做爰 | 久久人人插| 国产成人久久av免费高清密臂 | 亚洲精品国产综合99久久夜夜嗨 | 国产高清日韩 | 国产高清在线精品 | 999久久久欧美日韩黑人 | 97人人精品 | 怡春院av | 一级做a爱片性色毛片www | 久久国产精品一区二区 | 亚洲少妇天堂 | 一区二区电影在线观看 | 色av网站| 国产精品亚洲片在线播放 | 国产女教师精品久久av | 99精品国产兔费观看久久99 | 国产精品99精品久久免费 | 五月天久久综合 | 又黄又爽又刺激视频 | 亚洲国产欧洲综合997久久, | 草莓视频在线观看免费观看 | 欧美日韩国产一区二区三区 | 日韩在线视频免费看 | 在线观看中文字幕 | 国产一区二区在线免费视频 | 91精品夜夜| 97国产在线播放 | 91麻豆精品国产91久久久使用方法 | 久热这里有精品 | 天天操天天操天天操天天操天天操 | 久久久久国产精品一区二区 | 午夜av片| 久久看视频 | 中午字幕在线观看 | 精品三级av | 狠狠艹夜夜干 | 久久国产美女 | 精品亚洲一区二区 | 天天舔天天搞 | 奇米四色影狠狠爱7777 | 中日韩免费视频 | 五月婷婷久 | 欧美孕交vivoestv另类 | 亚洲精选视频免费看 | 国产精品久久久免费看 | 亚洲欧美国产精品18p | 国产精品成人av电影 | 国产精品毛片一区视频播不卡 | 精品一区二区三区四区在线 | 91av社区 | 中文字幕一区在线观看视频 | 成年人网站免费在线观看 | 欧美一级性视频 | aⅴ视频在线 | 国产一级免费在线观看 | 久久久精品99 | 成人一级片免费看 | 日本aaa在线观看 | 在线视频观看国产 | 中日韩男男gay无套 日韩精品一区二区三区高清免费 | 久久国产精品99久久久久 | 探花视频在线观看 | 中文字幕一区二区三区在线播放 | 欧美天天综合 | 日韩三级久久 | av网站在线观看播放 | 久久第四色 | 9在线观看免费高清完整版在线观看明 | 免费在线国产 | 色婷婷丁香 | 91在线影院 | 国产成人精品av | 日韩一区二区三区免费视频 | 最新中文字幕 | 中文字幕91视频 | 美女一二三区 | 亚州精品国产 | 在线免费看黄色 | 99久视频| 91片网 | av成人在线电影 | 91视频 - x99av| 久久国产露脸精品国产 | 国产精品一区二区av | 国产99精品在线观看 | 一区二区中文字幕在线播放 | 国产专区在线视频 | 亚洲视频免费视频 | 国产群p| x99av成人免费| 免费韩国av | 久久精品一二三区白丝高潮 | 人人网av | 欧美人操人| 亚洲国产黄色片 | 99精品久久只有精品 | 欧美日韩xx | 欧美日韩视频在线观看免费 | 久久精品—区二区三区 | 久久伊人精品一区二区三区 | 中文字幕人成乱码在线观看 | www99精品 | 久久精品99北条麻妃 | 欧美 日韩 国产 成人 在线 | 日韩黄色中文字幕 | 成人精品久久久 | 五月天激情婷婷 | 日日夜夜国产 | 就要色综合| av免费网页 | 成年人黄色免费视频 | 久久久久国产成人精品亚洲午夜 | 久久av伊人| 国产福利精品视频 | 九九精品视频在线 | 日韩一级电影在线观看 | 免费黄色一区 | 国产精品18久久久久久久久久久久 | 美女又爽又黄 | 欧美性春潮 | 中文字幕免费 | 天干啦夜天干天干在线线 | 亚洲三级网 | 国产流白浆高潮在线观看 | 国产精品久久久久久久久免费看 | 欧美日韩免费一区 | 二区三区av | 毛片网站在线观看 | 国产视频欧美视频 | 亚洲精品视频在线播放 | 国产黑丝袜在线 | 日产乱码一二三区别免费 | 亚洲黄色免费电影 | 99国产视频 | 911av视频 | 91精品一区二区三区久久久久久 | 激情五月婷婷综合 | 看片一区二区三区 | 欧美另类调教 | 在线观看亚洲免费视频 | 日本99久久 | 在线视频app | 激情视频在线高清看 | 日韩在线精品视频 | 视频一区二区免费 | 国产在线97 | 国产精品麻 | 2019中文| 2022国产精品视频 | 欧美日韩激情网 | 亚洲 欧美 综合 在线 精品 | 久久久久久久综合色一本 | 国产精品手机在线播放 | 精品国产一区二区三区在线观看 | 视频在线一区二区三区 | 欧美色图亚洲图片 | 97日日碰人人模人人澡分享吧 | 午夜av免费在线观看 | 中文字幕字幕中文 | 亚洲国产电影在线观看 | 天天色天天综合 | 免费久草视频 | www.av小说| 色婷婷骚婷婷 | 五月天高清欧美mv | 亚洲高清精品在线 | 天天天干天天射天天天操 | 久久久久久久久久久高潮一区二区 | 欧美在线视频第一页 | 九月婷婷人人澡人人添人人爽 | 日韩动态视频 | 国产精品毛片一区 | 免费成人在线视频网站 | 九九免费观看视频 | 三级av片 | 日本黄色免费在线观看 | 黄色大全免费网站 | 国产色资源 | 国产成人久久精品一区二区三区 | 五月婷婷开心中文字幕 | 午夜av在线| 久精品在线 | 九七视频在线 | 国产精品日韩在线播放 | www.av中文字幕.com| 激情亚洲综合在线 | 日本 在线 视频 中文 有码 | 国产v亚洲v | 在线免费观看视频 | 欧美亚洲另类在线视频 | 久久天| 国产高清久久久 | 一区二区三区中文字幕在线 | 亚洲第一中文网 | 亚洲精品乱码久久久久v最新版 | 欧美亚洲一区二区在线 | 久久久午夜电影 | 成人黄色电影在线观看 | 在线视频观看你懂的 | 色射爱 | 亚洲国产97在线精品一区 | 久久夜色精品亚洲噜噜国4 午夜视频在线观看欧美 | 婷婷色网视频在线播放 | 亚洲午夜精品久久久久久久久 | 久久精品福利 | 绯色av一区 | 国产亚洲精品久久久久久无几年桃 | aa一级片 | 久草色在线观看 | 欧美在线视频日韩 | 国产午夜麻豆影院在线观看 | 一区二区不卡视频在线观看 | 欧美精品三级在线观看 | 精品乱码一区二区三四区 | 亚洲日日射 | 夜夜骑首页| 夜夜爽88888免费视频4848 | 欧洲精品视频一区 | 激情自拍av| 99久热精品 | 欧美 日韩 视频 | 亚洲全部视频 | 一级免费av| 久久久久久福利 | 欧洲成人av| 亚洲精品一区二区在线观看 | 国产精品久久久久久久久久久不卡 | 极品久久久久久久 | av黄色av | 天天做天天爱夜夜爽 | 激情网婷婷| 蜜桃视频精品 | 精品亚洲视频在线 | 夜夜躁日日躁狠狠躁 | 欧美最猛性xxxxx免费 | 在线观看一级片 | 欧美日本日韩aⅴ在线视频 插插插色综合 | 亚洲男男gaygay无套 | 91手机视频在线 | 五月天欧美精品 | 色噜噜日韩精品一区二区三区视频 | 最新av免费在线 | 成人一区二区在线 | 亚洲综合射 | 就操操久久 | 欧美日韩xxxxx| 亚洲一区精品二人人爽久久 | 国产97在线看 | 精品a视频 | 国产精品美女久久久久久2018 | 欧美性色综合网站 | 亚州国产精品久久久 | 久久人人做 | 亚洲va在线va天堂 | 亚洲精品小视频在线观看 | 国产高清福利在线 | 久久高清毛片 | 四虎在线永久免费观看 | 精品在线视频观看 | 亚洲国产精品成人av | 国产在线观 | 欧美久久久久久 | 亚洲黄色免费 | 四虎影视欧美 | 日韩免费一二三区 | 久久99国产精品二区护士 | 国产香蕉在线 | 欧美性色黄大片在线观看 | 啪啪小视频网站 | 日韩免费一区二区三区 | 中文字幕一区二区三区在线播放 | 欧美国产精品一区二区 | 伊人国产在线观看 | 国产一级在线视频 | av在线影片 | 草莓视频在线观看免费观看 | 色就色,综合激情 | 亚洲韩国一区二区三区 | 日韩视频免费观看高清完整版在线 | 国产精品18久久久久久不卡孕妇 | 狠狠干成人 | 色婷婷国产在线 | 99久久久久久国产精品 | 天天av综合网| 欧美日韩视频在线观看一区二区 | 日韩一级片观看 | 免费在线观看午夜视频 | 一级黄色片毛片 | 六月天色婷婷 | 中文字幕在线乱 | 久99久精品视频免费观看 | 午夜精品电影一区二区在线 | 欧美久久99 | 亚洲天天草| 国产理伦在线 | 国产成人av一区二区三区在线观看 | 日本精品久久久久中文字幕 | 国产精品高潮呻吟久久久久 | 欧美整片sss| 最新极品jizzhd欧美 | 欧美一区二区三区在线观看 | 国产精品入口传媒 | 国产成人99av超碰超爽 | 九九导航 | 天天干天天怕 | 国产黄大片| 免费福利视频导航 | 欧美精品一级视频 | 91大神视频网站 | 国产伦理一区 | 香蕉久久国产 | 91丨精品丨蝌蚪丨白丝jk | avove黑丝 | 精品日本视频 | 亚洲一区二区三区精品在线观看 | 日日干网| 免费看色的网站 | 日本一区二区三区免费看 | 五月婷婷婷婷婷 | 国产福利久久 | 日日操网站 | 国产成人黄色网址 | 亚洲最新av网址 | 国产黄色免费 | 日韩免费在线播放 | 精品婷婷 | 国产专区欧美专区 | 在线国产观看 | 一区二区三高清 | av一级片在线观看 | 91精品一区在线观看 | 国产在线免费观看 | 最新真实国产在线视频 | 国产精品99久久久久久宅男 | 亚洲乱亚洲乱妇 | 日本精品一区二区三区在线观看 | 激情五月婷婷综合网 | 亚洲综合在线一区二区三区 | 久草免费手机视频 | 91在线精品一区二区 | 手机色在线 | 欧日韩在线 | 精品麻豆入口免费 | 国产精品二区在线观看 | 婷婷五月情 | 一本一道波多野毛片中文在线 | 美女一二三区 | 亚洲精品欧美视频 | 草久在线 | 成人四虎 | 狠狠色丁婷婷日日 | 欧美一级看片 | 国产精品久久久久久久久久久久午夜 | 国产黄色特级片 | 五月婷婷.com | 综合激情婷婷 | 日韩在线观看的 | 91免费版在线观看 | 成人av动漫在线观看 | 国产又粗又猛又色又黄网站 | 天堂中文在线视频 | 日韩中文字幕网站 | av免费看在线| 欧美日韩国产一区二区在线观看 | 久久乐九色婷婷综合色狠狠182 | 91高清免费 | 美女免费视频一区二区 | 欧美一区二视频在线免费观看 | 国产不卡在线播放 | 午夜天天操 | 久久婷婷精品视频 | 高清av不卡| 少妇18xxxx性xxxx片 | 国产精品资源网 | 亚洲视频在线视频 | 精品国产一区二区三区久久久蜜臀 | 国产人成一区二区三区影院 | 久久成人欧美 | 久久免费精品视频 | 日韩网站免费观看 | 亚洲黄色在线免费观看 | 国产黄色成人 | 色婷婷午夜 | 99国产高清| 福利视频在线看 | 黄色小网站免费看 | 日韩精品视频在线免费观看 | 国产免费黄视频在线观看 | 色综合天天在线 | 丰满少妇在线观看资源站 | 欧美精品在线观看一区 | 国产精品久久一区二区三区不卡 | 天天摸天天舔天天操 | 久久国产精品免费一区二区三区 | 色综合狠狠干 | 91av电影在线观看 | 99视频在线免费观看 | 成人av亚洲| 免费网址在线播放 | 色大片免费看 | 极品久久久久久久 | 亚洲国产精品久久久久婷婷884 | 成人av在线播放网站 | 久久久久国产精品视频 | 国产中文伊人 | 黄色日批网站 | 国产精品xxxx18a99 | www.成人精品 | 国产精品免费观看视频 | 国产成人免费网站 | 黄色小说免费观看 | 色资源网在线观看 | 99色国产| 亚洲免费在线看 | 在线视频你懂 | 欧洲色综合 | 亚洲色视频 | 91豆麻精品91久久久久久 | 日韩精品一区二区久久 | 久久久一本精品99久久精品 | 久久黄色小说 | 精品一二区 | 色婷婷色| 99精品热| 91精品91 | 日韩va在线观看 | 日韩a在线看 | 激情欧美日韩一区二区 | 国产亚洲在线 | 久久精品国产第一区二区三区 | a黄色一级 | 久爱精品在线 | 国产精品精品国产 | 久草在线综合 | 欧美色综合久久 | 一级片观看 | 人人干人人干人人干 | 97碰碰碰| 91成人看片| 国产99一区二区 | 超碰com| 精品久久视频 | 97国产精品亚洲精品 | 国产精品成人aaaaa网站 | 好看av在线| 日本女人b | 久久久免费视频播放 | 久久久午夜剧场 | 丁香花在线视频观看免费 | 国产精品一区二区三区在线播放 | 免费看片黄色 | 久久久久欠精品国产毛片国产毛生 | 人人爽网站| 91九色在线视频观看 | 久久久免费 | 深爱激情站 | 中文亚洲欧美日韩 | 亚洲片在线观看 | 五月婷社区 | 亚洲一二三区精品 | 高清在线观看av | 一区二区三区 中文字幕 | 午夜电影av| 99精品国产一区二区三区麻豆 | free. 性欧美.com | 激情五月在线观看 | 狠狠做深爱婷婷综合一区 | 欧美做受高潮 | 波多野结衣在线播放视频 | 亚洲精品乱码久久久久久久久久 | 国产午夜一级毛片 | 丁香九月激情 | 一区二区视频在线播放 | 国产四虎影院 | 99久久久国产免费 | 中文在线免费观看 | 日韩精品免费在线观看 | 亚洲国产精彩中文乱码av | 亚洲精品国产综合久久 | 综合天天网 | 久久综合久久综合久久综合 | 日本视频精品 | 欧美在线视频a | 精品一区二区精品 | av免费电影在线 | 亚洲视频在线播放 | 国产亚洲欧美在线视频 | 亚洲天堂在线观看完整版 | 一区二区三区四区五区在线视频 | 天天干天天综合 | av成人免费| 日韩最新中文字幕 | 亚洲精品美女在线 | 欧美va天堂va视频va在线 | 91亚色视频在线观看 | 免费看一级黄色大全 | 国产一区二区三区 在线 | 国产精品va在线播放 | 日韩中文字幕电影 | 综合网欧美 | 久久亚洲私人国产精品 | 操久 | 五月天伊人| 高潮久久久久久久久 | 久久99电影 | av中文在线播放 | 日韩电影在线观看一区二区三区 | 亚洲成人免费在线观看 | 夜夜骑日日 | 91黄色在线观看 | 欧美精品免费在线 | 中文字幕在线观看网址 | 日韩av电影国产 | 日日操天天操夜夜操 | 午夜精品久久久久久久99 | 97视频免费观看 | 色综合婷婷 | 日韩videos | 综合色狠狠 | 亚洲精品自拍 | 四虎永久国产精品 | 天天天天爱天天躁 | 久久久久99精品国产片 | 色av男人的天堂免费在线 | 六月丁香在线视频 | 在线免费观看黄 | 日韩草比 | 日本久久免费视频 | 成片视频在线观看 | 黄色中文字幕在线 | 国产在线免费av | 中文字幕久久精品一区 | 一区二区中文字幕在线播放 | 国产成人综合精品 | 日韩三级中文字幕 | 久久伊人色综合 | 黄色大片网 | 国产精品久久久久久久7电影 | av看片在线观看 | 亚洲精品成人免费 | 91福利社区在线观看 | 中文字幕永久免费 | 最近中文字幕大全中文字幕免费 | 又爽又黄又无遮挡网站动态图 | 免费看黄在线看 | 欧美日本不卡视频 | 亚洲国产精品久久 | 国产成人综合图片 | 成人免费观看完整版电影 | 97色涩| 国产麻豆传媒 | 亚洲九九九在线观看 | a级黄色片视频 | 婷婷丁香久久五月婷婷 | 国产精品精品视频 | 亚洲成人频道 | 精品视频一区在线 | 国产精品中文 | 手机av观看 | 日韩另类在线 | 天天干婷婷 | 国产亚洲精品久久久久久久久久 | 国产亚洲aⅴaaaaaa毛片 | 狠狠躁18三区二区一区ai明星 | 久久久久国产精品免费 | 国产精品永久免费视频 | 日韩成人精品一区二区三区 | 亚洲日韩中文字幕 | 色婷婷狠狠操 | 国产亚洲精品无 | 中文字幕日韩一区二区三区不卡 | 在线观看电影av | 欧美日韩一区二区久久 | 五月婷视频 | 欧美午夜精品久久久久久孕妇 | a色网站| 国产精品va视频 | 久久一区精品 | 精品久久久精品 | 美女黄久久 | 综合av在线 | 婷婷.com| 色综合狠狠干 | 综合国产视频 | 中文字幕黄色网 | 免费在线观看av片 | 国产福利a | 超碰在线人人草 | 国产成人一区二区精品非洲 | 91精品成人久久 | 视频在线观看日韩 | 国产永久免费 | 欧美在线aa| 国产一区二区高清视频 | 3d黄动漫免费看 | 最新国产在线观看 | 国产一级性生活 | 日韩性xxxx| 欧美一级久久久久 | 国产黑丝一区二区三区 | 久久精品五月 | 高清久久久 | 精品国产aⅴ麻豆 | 亚洲小视频在线观看 | 国产精品久久久久9999吃药 | 色多多在线观看 | 日韩av美女| 亚洲劲爆av| 亚洲国产高清在线观看视频 | 成人av免费看 | av一区二区在线观看中文字幕 | 少妇av片 | 中文有码在线视频 | 久久久精品一区二区三区 | 婷婷激情小说网 | 日本黄色黄网站 | 中文字幕在线观看完整版电影 | 中文久久精品 | 伊在线视频 | 91伊人| 九九爱免费视频在线观看 | 欧美另类性| 又黄又爽又色无遮挡免费 | 日韩精品无码一区二区三区 | 中文在线a∨在线 | 天天干天天摸天天操 | 人人看看人人 | 免费在线一区二区三区 | 国产黄a三级 | 国产精品无 | 久久亚洲精品国产亚洲老地址 | 00av视频 | 91成人观看| 免费在线国产 | 日韩手机在线观看 | 欧美精品久久天天躁 | 日韩一级成人av | 久久99在线观看 | 久久艹久久 | 久久99热精品 | 91精品久久久久久综合乱菊 | 亚洲欧美日韩国产一区二区 | 精品在线观看国产 | 日本电影久久 | 国产成人高清在线 | 精品自拍网| 日日夜夜婷婷 | 天天插日日射 | 奇米网在线观看 | 国产中出在线观看 | 国语自产偷拍精品视频偷 | av直接看 | 国内精品久久久久久久影视麻豆 | 国产人成精品一区二区三 | 丁香激情视频 | 综合色中文 | 亚洲精品国产精品国自产 | 91精品视频在线看 | 久久久久亚洲最大xxxx | 亚洲婷婷在线视频 | 91精品专区| 国产麻豆剧果冻传媒视频播放量 | 亚洲视频久久久 | 一区二区在线电影 | 日韩在线影视 | 天天操夜夜想 | 人人草人 | 国内精品久久天天躁人人爽 | 国产三级国产精品国产专区50 | 国产精品一码二码三码在线 | 日韩城人在线 | 青青草在久久免费久久免费 | 日韩精品一区二区三区丰满 | 97超碰在线播放 | 一本一道久久a久久综合蜜桃 | 色偷偷88888欧美精品久久 | 黄色小说免费观看 | 免费视频一区 | 一本到视频在线观看 | 中日韩在线 | 成人亚洲综合 | 天天综合天天做 | 婷婷午夜 | 久久高清免费视频 | 国产在线永久 | 成人av动漫在线 | 亚洲精品毛片一级91精品 | 夜夜夜草 | 国产精品久久99综合免费观看尤物 | 久久久久网址 | 丝袜美腿av | 国产精品久久久久一区二区国产 | 99热精品在线 | 麻豆国产视频下载 | 三级黄在线 | 激情网色 | 国产.精品.日韩.另类.中文.在线.播放 | 在线免费观看羞羞视频 | 欧美调教网站 | 中文字幕在线播放日韩 | 在线黄av | 天天干人人插 | 国产一线天在线观看 | 最近免费中文字幕mv在线视频3 | 亚洲狠狠操 | 欧美色噜噜 | 亚洲理论在线观看 | 日韩av一区二区三区在线观看 | 色综合色综合色综合 | 91成版人在线观看入口 | 成人黄色大片网站 | 久久综合欧美 | 五月天婷亚洲天综合网鲁鲁鲁 | 在线黄色免费av | 欧美视频xxx | 亚洲九九九在线观看 | 免费看日韩 | 在线免费观看不卡av | 久久久久久久久久久久久影院 | 亚洲激情在线视频 | 99热在线精品观看 | 亚洲午夜久久久综合37日本 | 99久久99久久精品 | 精品福利在线观看 | 日韩成人在线一区二区 | 国产午夜视频在线观看 | 中文字幕国产精品一区二区 | 日韩视频在线观看视频 | 精品福利在线视频 | 99国产视频 | www狠狠操 | 欧美一级性生活片 | 在线观看av免费 | 久久av电影 | 国产精品不卡视频 | 成人黄色在线 | 一区二区三区在线免费观看视频 | 久久久久久蜜桃一区二区 | 精品高清美女精品国产区 | 五月婷婷精品 | 四虎影视成人永久免费观看亚洲欧美 | 超碰激情在线 | 亚洲va欧美va | 久久精品中文字幕少妇 | 国产免费黄视频在线观看 | 中文字幕一区在线观看视频 | 99热官网| 免费看黄的视频 | 激情视频免费观看 | 国产成人一二三 | 黄色免费视频在线观看 | 亚洲国产精品激情在线观看 | 丝袜av网站 | 美女久久一区 | 精品福利av | 中文字幕亚洲欧美 | 免费午夜av | 亚洲国产影院av久久久久 | 日韩在线免费不卡 | 99久久激情视频 | www.天天射.com | 久久精品一级片 | 精品91在线 | 亚洲成人xxx| 免费看搞黄视频网站 | 国产精品专区h在线观看 | 操操操操网 | 亚洲最新av在线 | 亚洲精区二区三区四区麻豆 | 国产91九色蝌蚪 | 国产精品毛片一区二区 | 欧美日韩视频一区二区三区 | 激情综合站 | 国内揄拍国内精品 | 国产一区二区三精品久久久无广告 | 男女视频久久久 | 欧美一级艳片视频免费观看 | 精品视频网站 | 亚洲 欧美 国产 va在线影院 | 日韩综合一区二区 | 中文字幕日本电影 | 伊色综合久久之综合久久 | 福利网址在线观看 | 国产精品一区二区三区99 | 中文字幕亚洲在线观看 | 狠狠操影视 | 国产精品久久久久9999吃药 | 五月天国产 | 日韩免费在线观看视频 | 日韩色一区二区三区 | 久久经典视频 | 久久精品麻豆 | 操老逼免费视频 | 97福利| 国产在线精品视频 | 久久精品99久久久久久 | 五月天久久激情 | 久久久免费观看完整版 | 欧美极度另类 | 成人一区二区三区中文字幕 | 美女免费视频观看网站 | 国产一卡久久电影永久 | 国产精品18久久久久久首页狼 | 日韩久久激情 | 亚洲电影自拍 | 国产一区二区三区高清播放 | 天天做天天爱天天综合网 | 久久99欧美 | 国产精品久久久久久久毛片 | 蜜臀91丨九色丨蝌蚪老版 | 国产视频在线观看一区 | www.夜夜| 国内精品福利视频 | 免费看黄在线网站 | 国产高清免费视频 | 一区三区视频 | 国产精品美女久久久久久久久 | www,黄视频 | 蜜臀av夜夜澡人人爽人人桃色 | 成人香蕉视频 | 亚洲欧美日韩不卡 | 一级黄色网址 | 99精品视频免费 | 99欧美精品| 天天干com | 手机看片国产日韩 | 久草在线网址 | 日韩深夜在线观看 | 国产精品自产拍在线观看蜜 | 天天干天天想 | 午夜视频在线观看一区二区三区 | 国产精品白虎 | 欧美日韩高清一区二区 国产亚洲免费看 | 日韩大片在线免费观看 | 国产亚洲视频在线免费观看 | 成人一级视频在线观看 | 国产一级免费av | 亚欧日韩av | 久久久久成人精品 | 日韩成人邪恶影片 |