数据描述与可视化
標(biāo)準(zhǔn)化
注:均值的意義不是很大,容易受到特別大或特別小的數(shù)的嚴(yán)重影響。使得得出的結(jié)果沒有代表性,不夠準(zhǔn)確
Data Description
χ2的測試
下象棋與不下象棋的人數(shù)之比為1:4,下圖紅色代表假設(shè)下象棋與喜歡科幻小說不相關(guān),這時相應(yīng)的人數(shù)之比也應(yīng)該是1:4
數(shù)據(jù)的可視化(Data Visualization)
高維數(shù)據(jù)的處理——Box Plots
高維數(shù)據(jù)的處理——Parallel Coordinates
文獻(xiàn)的可視化——CiteSpace
Gephi
Gephi是一款開源免費跨平臺基于JVM的復(fù)雜網(wǎng)絡(luò)分析軟件, 其主要用于各種網(wǎng)絡(luò)和復(fù)雜系統(tǒng),動態(tài)和分層圖的交互可視化與探測開源工具。可用作:探索性數(shù)據(jù)分析,鏈接分析,社交網(wǎng)絡(luò)分析,生物網(wǎng)絡(luò)分析等。
gephi是一款信息數(shù)據(jù)可視化利器。
注:r=0 說明X和Y線性不相關(guān),但不一定不相關(guān)。
箱形圖(Box Plots)
箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計圖。因形狀如箱子而得名。在各種領(lǐng)域也經(jīng)常被使用,常見于品質(zhì)管理。它主要用于反映原始數(shù)據(jù)分布的特征,還可以進(jìn)行多組數(shù)據(jù)分布特征的比較。箱線圖的繪制方法是:先找出一組數(shù)據(jù)的最大值、最小值、中位數(shù)和兩個四分位數(shù);然后, 連接兩個四分位數(shù)畫出箱子;再將最大值和最小值與箱子相連接,中位數(shù)在箱子中間。
作用:能提供有關(guān)數(shù)據(jù)位置和分散情況的關(guān)鍵信息,尤其在比較不同的母體數(shù)據(jù)時更可表現(xiàn)其差異。
? ? ? ? ? 顯示數(shù)據(jù)的離散的分布情況效果不錯
兩個可視化軟件的名字:CiteSpace、Gephi
總結(jié)
- 上一篇: 类别不平衡问题 —— 各种评估指标
- 下一篇: 安全如何入门