python 识别数字字母 训练集_Python 实现训练集、测试集随机划分
隨機從列表中取出元素:
import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)
以下函數,使用于我最近的一個機器學習的項目,將數據集數據按照比例隨機劃分成訓練集數據和測試集數據:
import csv
import random
def getDataSet(proportion):
"""
:exception
獲取訓練集和測試集(將數據按比例隨機劃分)
:parameter
proportion - 測試集/數據集
:return
trainDataSet - 訓練集
testDataSet - 測試集
author
肖政宇
modify
2019年5月10日
"""
dataSet = open('數據集.csv')
dataSetReader = csv.reader(dataSet)
"""
:exception
將數據保存到數組
"""
dataSet = []
next(dataSetReader, 'none') # 跳過表頭
data = next(dataSetReader, 'none')
while (data != 'none'):
dataSet.append(data)
data = next(dataSetReader, 'none')
"""
:exception
按照比例隨機劃分出訓練集和測試集
"""
dataNumber = dataSet.__len__() # 數據集數據條數
testNumber = int(dataNumber * proportion) # 測試集數據條數
testDataSet = [] # 測試數據集
trainDataSet = [] # 訓練數據集
testDataSet = random.sample(dataSet, testNumber) # 測試集
for testData in testDataSet: # 將已經選定的測試集數據從數據集中刪除
dataSet.remove(testData)
trainDataSet = dataSet # 訓練集
return trainDataSet, testDataSet
以上這篇Python 實現訓練集、測試集隨機劃分就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持python博客。
總結
以上是生活随笔為你收集整理的python 识别数字字母 训练集_Python 实现训练集、测试集随机划分的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mongodb添加创建修改时间_mong
- 下一篇: 时间序列 预处理 python_【Pyt