日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

4-3 数据离散化(无error版本)

發(fā)布時(shí)間:2023/12/20 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 4-3 数据离散化(无error版本) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
#-*- coding: utf-8 -*- #數(shù)據(jù)規(guī)范化 import pandas as pd if __name__=="__main__":datafile = '../data/discretization_data.xls' #參數(shù)初始化data = pd.read_excel(datafile) #讀取數(shù)據(jù)data = data[u'肝氣郁結(jié)證型系數(shù)'].copy()k = 4d1 = pd.cut(data, k, labels = range(k)) #等寬離散化,各個(gè)類比依次命名為0,1,2,3#等頻率離散化w = [1.0*i/k for i in range(k+1)]w = data.describe(percentiles = w)[4:4+k+1] #使用describe函數(shù)自動計(jì)算分位數(shù)w[0] = w[0]*(1-1e-10)d2 = pd.cut(data, w, labels = range(k))from sklearn.cluster import KMeans #引入KMeanskmodel = KMeans(n_clusters = k, n_jobs = 4) #建立模型,n_jobs是并行數(shù),一般等于CPU數(shù)較好kmodel.fit(data.values.reshape((len(data), 1))) #訓(xùn)練模型c = pd.DataFrame(kmodel.cluster_centers_).sort_values(0) #輸出聚類中心,并且排序(默認(rèn)是隨機(jī)序的)w = pd.rolling_mean(c, 2).iloc[1:] #相鄰兩項(xiàng)求中點(diǎn),作為邊界點(diǎn)w = [0] + list(w[0]) + [data.max()] #把首末邊界點(diǎn)加上d3 = pd.cut(data, w, labels = range(k))def cluster_plot(d, k): #自定義作圖函數(shù)來顯示聚類結(jié)果import matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標(biāo)簽plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負(fù)號plt.figure(figsize = (8, 3))for j in range(0, k):plt.plot(data[d==j], [j for i in d[d==j]], 'o')plt.ylim(-0.5, k-0.5)return pltcluster_plot(d1, k).show()cluster_plot(d2, k).show()cluster_plot(d3, k).show()



使用python3.5,數(shù)據(jù)集(discretization_data.xls)為:

肝氣郁結(jié)證型系數(shù)
0.056
0.488
0.107
0.322
0.242
0.389
0.246
0.330
0.257
0.205
0.330
0.235
0.267
0.281
0.184
0.271
0.100
0.173
0.302
0.176
0.172
0.195
0.281
0.245
0.156
0.168
0.211
0.255
0.279
0.341
0.230
0.266
0.252
0.227
0.277
0.329
0.320
0.053
0.152
0.269
0.042
0.179
0.239
0.167
0.209
0.432
0.354
0.247
0.328
0.215
0.433
0.294
0.237
0.244
0.199
0.286
0.219
0.261
0.316
0.221
0.326
0.284
0.242
0.268
0.257
0.174
0.251
0.237
0.298
0.288
0.263
0.273
0.233
0.243
0.299
0.202
0.229
0.348
0.369
0.186
0.270
0.302
0.216
0.320
0.167
0.228
0.108
0.253
0.303
0.274
0.225
0.180
0.195
0.219
0.169
0.234
0.279
0.114
0.225
0.169
0.175
0.170
0.223
0.166
0.217
0.256
0.252
0.299
0.247
0.344
0.272
0.159
0.219
0.240
0.187
0.278
0.227
0.280
0.285
0.388
0.134
0.230
0.195
0.220
0.448
0.323
0.104
0.102
0.196
0.176
0.229
0.199
0.278
0.241
0.207
0.163
0.253
0.222
0.277
0.290
0.211
0.186
0.418
0.175
0.238
0.160
0.198
0.329
0.180
0.242
0.287
0.216
0.318
0.308
0.211
0.129
0.285
0.139
0.218
0.177
0.209
0.386
0.137
0.193
0.302
0.350
0.323
0.102
0.198
0.110
0.173
0.417
0.123
0.109
0.111
0.166
0.303
0.128
0.157
0.134
0.314
0.288
0.107
0.295
0.300
0.171
0.057
0.504
0.102
0.316
0.251
0.383
0.243
0.323
0.271
0.200
0.346
0.251
0.266
0.295
0.200
0.267
0.100
0.184
0.294
0.174
0.188
0.193
0.291
0.264
0.168
0.169
0.208
0.267
0.295
0.346
0.235
0.269
0.259
0.228
0.287
0.339
0.324
0.054
0.159
0.273
0.055
0.181
0.238
0.164
0.210
0.432
0.363
0.247
0.330
0.211
0.427
0.296
0.247
0.257
0.212
0.285
0.216
0.271
0.328
0.219
0.332
0.294
0.246
0.282
0.272
0.173
0.250
0.242
0.313
0.296
0.274
0.281
0.237
0.249
0.303
0.193
0.227
0.347
0.373
0.197
0.276
0.304
0.235
0.325
0.166
0.226
0.115
0.253
0.306
0.277
0.223
0.176
0.205
0.238
0.173
0.243
0.292
0.122
0.224
0.177
0.176
0.183
0.229
0.158
0.221
0.250
0.252
0.308
0.247
0.355
0.282
0.155
0.226
0.247
0.190
0.282
0.228
0.288
0.296
0.389
0.140
0.231
0.198
0.235
0.456
0.322
0.108
0.110
0.205
0.179
0.245
0.206
0.287
0.254
0.215
0.155
0.254
0.227
0.280
0.305
0.214
0.188
0.420
0.177
0.254
0.169
0.193
0.345
0.174
0.253
0.289
0.232
0.324
0.318
0.216
0.142
0.281
0.144
0.217
0.183
0.217
0.400
0.147
0.191
0.309
0.345
0.319
0.110
0.210
0.115
0.185
0.435
0.138
0.119
0.111
0.173
0.310
0.132
0.168
0.134
0.329
0.303
0.104
0.300
0.298
0.187
0.034
0.474
0.085
0.304
0.231
0.377
0.226
0.304
0.247
0.184
0.325
0.218
0.258
0.273
0.181
0.263
0.083
0.169
0.288
0.158
0.161
0.186
0.258
0.233
0.146
0.149
0.195
0.247
0.275
0.326
0.213
0.251
0.233
0.209
0.253
0.308
0.303
0.042
0.135
0.253
0.026
0.158
0.229
0.158
0.198
0.411
0.337
0.226
0.312
0.191
0.417
0.283
0.219
0.239
0.191
0.275
0.204
0.247
0.312
0.208
0.318
0.270
0.229
0.251
0.250
0.155
0.228
0.219
0.293
0.270
0.243
0.265
0.214
0.230
0.277
0.182
0.215
0.341
0.366
0.170
0.251
0.274
0.216
0.305
0.161
0.212
0.091
0.235
0.279
0.250
0.199
0.169
0.186
0.210
0.149
0.214
0.254
0.106
0.213
0.157
0.166
0.163
0.202
0.144
0.207
0.240
0.232
0.290
0.226
0.328
0.245
0.140
0.198
0.232
0.166
0.257
0.202
0.266
0.266
0.366
0.126
0.206
0.175
0.215
0.429
0.298
0.094
0.087
0.180
0.155
0.216
0.175
0.267
0.233
0.193
0.151
0.238
0.198
0.258
0.270
0.188
0.173
0.397
0.166
0.217
0.145
0.178
0.326
0.173
0.239
0.277
0.216
0.298
0.294
0.190
0.122
0.273
0.125
0.203
0.162
0.204
0.368
0.118
0.165
0.289
0.324
0.312
0.092
0.195
0.089
0.161
0.400
0.118
0.101
0.095
0.164
0.288
0.124
0.147
0.122
0.306
0.284
0.087
0.272
0.286
0.151
0.045
0.487
0.089
0.304
0.232
0.375
0.229
0.317
0.248
0.193
0.317
0.226
0.254
0.277
0.184
0.263
0.089
0.169
0.290
0.165
0.163
0.180
0.268
0.240
0.150
0.154
0.205
0.252
0.270
0.328
0.215
0.254
0.243
0.211
0.269
0.319
0.308
0.045
0.144
0.262
0.033
0.173
0.229
0.158
0.202
0.417
0.342
0.236
0.317
0.206
0.424
0.279
0.233
0.241
0.193
0.276
0.207
0.252
0.304
0.216
0.314
0.264
0.228
0.263
0.249
0.163
0.242
0.223
0.289
0.278
0.260
0.260
0.224
0.232
0.292
0.191
0.212
0.333
0.362
0.173
0.263
0.291
0.214
0.312
0.156
0.210
0.105
0.238
0.289
0.264
0.208
0.165
0.179
0.218
0.155
0.228
0.266
0.105
0.210
0.163
0.159
0.163
0.214
0.151
0.215
0.238
0.245
0.292
0.243
0.337
0.262
0.147
0.211
0.234
0.177
0.272
0.210
0.265
0.269
0.375
0.125
0.218
0.183
0.212
0.432
0.311
0.094
0.092
0.188
0.157
0.217
0.191
0.270
0.238
0.198
0.144
0.237
0.209
0.271
0.285
0.206
0.179
0.411
0.165
0.232
0.143
0.184
0.326
0.166
0.233
0.275
0.216
0.309
0.299
0.197
0.120
0.268
0.129
0.211
0.166
0.200
0.383
0.134
0.175
0.292
0.337
0.314
0.093
0.195
0.097
0.162
0.408
0.117
0.099
0.098
0.162
0.294
0.126
0.145
0.130
0.304
0.283
0.103
0.283
0.287
0.161
0.049
0.488
0.098
0.313
0.237
0.381
0.239
0.323
0.254
0.195
0.326
0.233
0.259
0.277
0.184
0.266
0.098
0.171
0.293
0.171
0.171
0.188
0.276
0.244
0.153
0.164
0.208
0.253
0.277
0.336
0.221
0.256
0.247
0.217
0.273
0.327
0.317
0.049
0.146
0.268
0.041
0.177
0.232
0.163
0.202
0.426
0.344
0.243
0.322
0.207
0.425
0.284
0.236
0.242
0.193
0.283
0.213
0.256
0.313
0.217
0.323
0.274
0.236
0.264
0.254
0.167
0.246
0.233
0.293
0.285
0.263
0.267
0.225
0.237
0.294
0.192
0.219
0.341
0.366
0.178
0.264
0.293
0.216
0.317
0.163
0.219
0.106
0.247
0.297
0.268
0.217
0.172
0.188
0.218
0.163
0.231
0.272
0.107
0.217
0.166
0.167
0.166
0.217
0.156
0.217
0.248
0.247
0.293
0.244
0.341
0.264
0.153
0.216
0.236
0.183
0.277
0.22
0.273
0.277
0.383
0.133
0.226
0.193
0.218
0.439
0.317
0.098
0.098
0.192
0.166
0.227
0.194
0.278
0.238
0.205
0.153
0.247
0.216
0.273
0.289
0.207
0.183
0.415
0.171
0.237
0.152
0.192
0.327
0.173
0.239
0.284
0.216
0.311
0.302
0.206
0.127
0.277
0.135
0.214
0.173
0.205
0.384
0.134
0.184
0.294
0.341
0.317
0.098
0.195
0.102
0.172
0.415
0.122
0.106
0.107
0.165
0.302
0.127
0.152
0.131
0.311
0.284
0.103
0.287
0.296
0.169


總結(jié)

以上是生活随笔為你收集整理的4-3 数据离散化(无error版本)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。