r语言c5.0要求因子输出,R语言中因子的创建与使用
原標(biāo)題:R語言中因子的創(chuàng)建與使用
因子在R語言中可以用來表示名義型變量或有序變量。名義變量一般表示類別,如性別,種族等等。有序變量是有一定排序順序的變量,如職稱,年級等等。在R語言中,名義變量和有序變量可以使用因子來表示。
創(chuàng)建因子
在R語言中可以使用factor()函數(shù)和gl()函數(shù)來創(chuàng)建因子變量。
(1)使用factor()函數(shù)
factor()函數(shù)的語法格式為:
f
其中:
x 為創(chuàng)建因子的數(shù)據(jù),是一個(gè)向量;
levels:因子數(shù)據(jù)的水平,默認(rèn)是x中不重復(fù)的值;
labels:標(biāo)識某水平的名稱,與水平一一對應(yīng),以方便識別,默認(rèn)取levels的值;
exclude:從x中剔除的水平值,默認(rèn)為NA值;
ordered:邏輯值,因子水平是否有順序(編碼次序),若有取TRUE,否則取FALSE;
nmax:水平個(gè)數(shù)的限制。
下面給出幾個(gè)具體的例子來說明具體使用方法:
fc1
fc2
grade
fc3
fc4
本部分執(zhí)行情況如下圖所示:
(2)使用gl()函數(shù)
gl()函數(shù)用于定義有規(guī)律的因子向量,其語法格式如下:
gl(n, k, length = n*k, labels = 1:n, ordered = FALSE)
其中參數(shù)的含義如下:
n: 正整數(shù),表示因子的水平個(gè)數(shù)
k:正整數(shù),表示每個(gè)水平重復(fù)的次數(shù);
length: 正整數(shù),表示因子向量的長度,默認(rèn)為n*k
labels: 表示因子水平的名稱,默認(rèn)值為1:n
ordered: 邏輯變量,表示因子水平是否是有次序的,默認(rèn)值為FALSE
g1
g2
g3
本部分的結(jié)果情形如下圖所示:
因子的索引
fc1[1] #訪問輸出第一個(gè)水平
fc1[1:3] #訪問輸出1~3個(gè)水平
fc1[c(1, 4, 7)] #訪問輸出第1,4,7個(gè)水平值
fc1[-1] #排除第一個(gè)
fc1[-c(1:4)] #排除第1~4個(gè)
fc1[fc1 != 1] #過濾掉等于1的因子水平
fc3[fc3 > 'Junior'] #對于有序因子可以使用>,>=,
注意:因?yàn)橐蜃右话惚硎久x變量或有序變量,如非有序因子,則使用>,>=,
本部分執(zhí)行情況如下圖所示:
因子的修改
fc1[1]
fc1[1:3]
fc1[-1]
fc1[-c(1,4,7)]
執(zhí)行情況如下:
-------------------
歡迎關(guān)注本號,本號近期持續(xù)更新R語言的內(nèi)容。從簡入深,從基本語法到實(shí)際的數(shù)據(jù)分析應(yīng)用。返回搜狐,查看更多
責(zé)任編輯:
總結(jié)
以上是生活随笔為你收集整理的r语言c5.0要求因子输出,R语言中因子的创建与使用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: php 查找键名,array_key_e
- 下一篇: java开源笔记软件下载_开发常用软件笔