2021亚太杯数学建模竞赛
亞太杯數(shù)學(xué)建模競(jìng)賽
數(shù)據(jù)類型題涉及的知識(shí)點(diǎn)及基本模型講解
本人曾參加亞太杯四次,三次都是 First Prize,其中有一次因中途電腦燒壞了就暫停編寫建模論文因而拿了Second Prize;我們立足當(dāng)前,著眼長(zhǎng)遠(yuǎn),按照社會(huì)價(jià)值導(dǎo)向,輔導(dǎo)學(xué)生跨越夢(mèng)想的橋梁;全面推進(jìn)每個(gè)學(xué)子數(shù)學(xué)建模競(jìng)賽的獲獎(jiǎng)目標(biāo),切實(shí)抓好編程與數(shù)學(xué)模型的任務(wù)重點(diǎn)。
可以說(shuō)亞太杯是所有建模競(jìng)賽中最容易獲獎(jiǎng)的數(shù)學(xué)建模競(jìng)賽,不論這次亞太杯的題目是研究算法效率的、還是探尋數(shù)據(jù)規(guī)律的、還是有固定范圍計(jì)算結(jié)果答案的,我們都可以屢試不爽的使用我接下來(lái)介紹的數(shù)據(jù)描述基本模型:
數(shù)據(jù)的基本統(tǒng)計(jì)描述
– 目的
– 數(shù)據(jù)的基本統(tǒng)計(jì)描述
? 更好地識(shí)別數(shù)據(jù)的性質(zhì),把握數(shù)據(jù)全貌。
? 中心趨勢(shì)度量、數(shù)據(jù)分散度量、數(shù)據(jù)的圖形表示
– 中心趨勢(shì)度量
? 均值、加權(quán)算數(shù)均值、中位數(shù)、眾數(shù)、中列數(shù)
– 數(shù)據(jù)分散度量
? 極差、分位數(shù)和四分位數(shù)、方差和標(biāo)準(zhǔn)差
– 數(shù)據(jù)的圖形顯示
? 箱圖、餅圖、頻率直方圖、散點(diǎn)圖
有的人可能會(huì)說(shuō)你這個(gè)寫這么簡(jiǎn)單的東西,根本入不了評(píng)委的眼睛,不好意思,我年年這么干,年年First Prize,因?yàn)槟銛?shù)據(jù)分析前:第一要做數(shù)據(jù)處理;第二宏觀上了解數(shù)據(jù)的情況這一步就叫做數(shù)據(jù)的基本統(tǒng)計(jì)描述;第三步然后才是具體有針對(duì)的分析數(shù)據(jù)變量
1. 中心趨勢(shì)度量
– 均值(Mean)
? 令x1,x2,…,xN為某數(shù)值屬性X的N個(gè)觀測(cè)值,該值集合的均值如式
(2-1)所示。
– 加權(quán)算數(shù)平均數(shù)(Weighted Mean)
? 對(duì)于i=1,…,N,每個(gè)值xi都有一個(gè)權(quán)重wi。
– 分組數(shù)據(jù)中位數(shù)(Grouped Median)
? 根據(jù)N/2確定中位數(shù)所在的組
Me:中位數(shù),L:中位數(shù)所在組的下限,Sm-1:中位數(shù)所在組以下各組的
累計(jì)頻數(shù),fm:中位數(shù)所在組的頻數(shù),d:中位數(shù)所在組的組距。
– 眾數(shù)(Mode):數(shù)據(jù)中出現(xiàn)最頻繁的值
– 中列數(shù)(Midrange):數(shù)據(jù)集中最大值和最小值的算術(shù)平均值
2. 數(shù)據(jù)分散度量
– 極差(又稱全距,Range):是集合中最大值與最小值之間的差距,
即最大值減最小值后所得數(shù)據(jù)。
– 分位數(shù)(Quantile):取自數(shù)據(jù)分布的每隔一定間隔上的點(diǎn),把數(shù)據(jù)
劃分成基本上大小相等的連貫集合。
– 方差(樣本方差):是每個(gè)數(shù)據(jù)分別與平均數(shù)之差的平方的平均數(shù)。
3. 數(shù)據(jù)的圖形顯示(數(shù)據(jù)可視化)
每次數(shù)學(xué)建模競(jìng)賽中都必須得繪圖,但你真的了解數(shù)據(jù)的圖形顯示么?你知道該怎么繪圖么?你知道什么情況下繪制直方圖,什么情況下繪制散點(diǎn)圖,什么情況下繪制密度直方圖么?你知道為什么你繪圖了,結(jié)果也對(duì)為什么沒獲獎(jiǎng)么?**是因?yàn)槟愀静恢朗裁辞闆r下繪制什么可視化圖形。**我在這里告訴你一下:沒有比較就沒有鑒別,只知其一,一無(wú)所知。
– 盒圖(又稱箱線圖,Box-plot),是一種用來(lái)描述數(shù)據(jù)分布的統(tǒng)計(jì)圖形,
可以表現(xiàn)觀測(cè)數(shù)據(jù)的中位數(shù)、四分位數(shù)和極值等描述性統(tǒng)計(jì)量。
– 餅圖(又稱圓形圖或餅形圖,Pie Graph),通常用來(lái)表示整體的構(gòu)成
部分及各部分之間的比例關(guān)系。餅圖顯示一個(gè)數(shù)據(jù)系列中各項(xiàng)的大小
與各項(xiàng)總和的比例關(guān)系。
– 頻率直方圖(又稱頻率分布直方圖,Frequency Histogram), 是在統(tǒng)
計(jì)學(xué)中表示頻率分布的圖形。
– 散點(diǎn)圖(Scatter Diagram):將樣本數(shù)據(jù)點(diǎn)繪制在二維平面或三維空
間上,根據(jù)數(shù)據(jù)點(diǎn)的分布特征,直觀地研究變量之間的統(tǒng)計(jì)關(guān)系以及
強(qiáng)弱程度。
標(biāo)稱屬性的鄰近性度量
? 相異性
? p是對(duì)象的屬性總數(shù),m是匹配的屬性數(shù)目(即對(duì)象i和j狀態(tài)相
同的屬性數(shù))
? 相似性
數(shù)據(jù)的相異性判別方法有:
歐幾里得距離(Euclidean Distance ):又稱直線距離。
曼哈頓距離(Manhattan Distance):又稱城市塊距離。
閔可夫斯基距離(Minkowski Distance )。
切比雪夫距離(Chebyshev Distance ):又稱上確界距離,定義兩個(gè)對(duì)
象之間的上確界距離為其各坐標(biāo)數(shù)值差的最大值。
如果你想了解更多,并且在競(jìng)賽中取得榮譽(yù),那就努力學(xué)習(xí)吧。大學(xué)學(xué)習(xí)沒有徘徊,沒有迷茫,沒有糾結(jié),專注的走自己腳下這條學(xué)習(xí)的道路,走的更遠(yuǎn)登的更高,不回頭,然后有一天當(dāng)你往腳下看群星在你腳下燦爛。
總結(jié)
以上是生活随笔為你收集整理的2021亚太杯数学建模竞赛的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 部署OpenStack问题汇总(五)--
- 下一篇: 全国计算机等级考试题库二级C操作题100