日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数学建模之倚天剑与屠龙刀

發布時間:2023/12/20 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数学建模之倚天剑与屠龙刀 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?

https://gitbook.cn/books/5a589d5adf0f795ef280c338/index.html

導言

本Chat基于競賽基礎整理,非技術深度博文!

1.認識數學建模

??數學建模:從1985年美國的MCM(Mathematical Contest in Modeling)一直發展至今。

??亞里士多德說,“智慧不僅僅存在于知識之中,而且還存在于應用知識的能力中”。數學建模就是對數學知識最好的應用,通過數學建模,你會發現,生活中很多有意思的事情都可以靠它來解決,其結構如下:

2.應該怎么查找數據

??數據來源查找主要有三個模式:   

  • 題目來源數據     
  • 題目來源數據+中外文期刊數據庫(含統計年鑒)     
  • 題目來源數據+中外文期刊數據庫(含統計年鑒)+爬蟲數據     

中外文數據庫 

  中文:CNKI、VIP、萬方 

外文:EBSCO、Elserive、ProQuest、Springerlink、EI、ISI Web of Knowledge 

統計年鑒:國家數據、國家統計年鑒、各類型統計數據官方網站。

開放實驗數據源:C Irvine Machine Learning Repository:UCI指的是加州大學歐文分校。UCI機器學習庫主要是收集的機器學習領域的一些相關數據集和數據生成器,可以用來做一些基本的實驗。

下圖即可看見非常經典的iris數據。

3.數據預處理和數據異常處理之間有什么區別

??數據預處理包含數據異常處理。數據預處理常常會包含:數據異常處理,數據空缺處理,無效數據處理,數據分類處理等。常常使用的辦法會有:剔除數據點,擬合模擬數據,對數據進行統計分類等。

4.軟件很多、算法很多,到底應該如何選擇

this is a 故事:

??某男到醫院就診,醫生親切地問了一些該男的癥狀,最后得出結論:“我懷孕了。。。”

??血淋淋的故事告訴我們: 需要一個好的模型診斷器,根據病人的一系列癥狀,得出病人患的是什么病。

4.1 軟件方面

??對于數學建模用到最多的軟件有:Matlab、Mathmatic、 Lingo/LinDo、SAS、SPSS。其中前兩個主要為計算軟件(也可做優化),中間的那個為優化軟件,最后兩個為統計分析軟件。由于時間太緊了,Java、C++之類則在競賽中很少用。

個人推薦:R和Python,從定位角度看,R致力于提供更好的,對用戶友好的數據分析、統計分析和繪圖模型;而Python則強調生產效率和代碼的可讀性。

4.2 算法方面

??數學建模常常可以劃分成不同的模型需求:比如說優化模型、微分方程模型、統計模型、概率模型、圖論模型、決策模型。

??數學建模算法中常用的涉及:類比法、二分法、差分法、變分法、圖論法、層次分析法、數據擬合法、回歸分析法、數學規劃(線性規劃,非線性規劃,整數規劃,動態規劃,目標規劃)、機理分析、排隊方法、對策方法、決策方法、模糊評判方法、時間序列方法、灰色理論方法、現代優化算法(禁忌搜索算法,模擬退火算法,遺傳算法,神經網絡)等。

??其中層次分析法(AHP)是為數不多的主觀方法,在評價模型中經常被引用,尤其當沒有模型選擇時,可以考慮使用!

??在優化方法中在,決策變量、目標函數(盡量簡單、光滑)、約束條件、求解方法是四個關鍵因素。其中包括無約束規則、線性規則(用 Lingo實現實現比較方便)非線性規則、0-1規劃,多目標規劃(有目標加權、效用函數)動態規劃、整數規劃,適合軟件(Matlab、 Lingo、R和python)

??回歸分析:對具有相關關系的現象,根據其關系形態,選擇一個合適的數學模型,用來近似地表示變量間的平均變化關系的一種統計方法 (一元線性回歸、多元線性回歸、非線性回歸),回歸分析在一組數據的基礎上研究這樣幾個問題:建立因變量與自變量之間的回歸模型(經驗公式);對回歸模型的可信度進行檢驗;判斷每個自變量對因變量的影響是否顯著;判斷回歸模型是否適合這組數據;利用回歸模型對進行預報或控制。相對應的有線性回歸、多元二項式回歸、非線性回歸(比較方便的軟件Matlab、Mathmatic、Lingo/LinDo、SAS、SPSS、R和python)。

??逐步回歸分析:從一個自變量開始,視自變量作用的顯著程度,從大到地依次逐個引入回歸方程:當引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉;引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步;對于每一步都要進行值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對作用顯著的變量;這個過程反復進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止(軟件方面SAS、matlab、R和python)。

??時間序列是按時間順序排列的、隨時間變化且相互關聯的數據序列—通過對預測目標自身時間序列的處理,來研究其變化趨勢(長期趨勢變動、季節變動、循環變動、不規則變動)。

時間序列建模的基本步驟

  • 數據的預處理:數據的剔取及提取趨勢項。
  • 取n=1,擬合ARMA(2n,2n-1)(即ARMA(2,1))模型。
  • n=n+1,擬合ARMA(2n,2n-1)模型。
  • 用F準則檢驗模型的適用性。若檢驗顯著,則轉入第2步。若檢驗不顯著,轉入第5步。
  • 檢查遠端時刻的系數值的值是否很小,其置信區間是否包含零。若不是,則適用的模型就是ARMA(2n,2n-1) 。若很小,且其置信區間包含零,則擬合ARMA(2n-1,2n-2) 。
  • 利用F準則檢驗模型ARMA(2n,2n-1)和ARMA(2n-1,2n-2) ,若F值不顯著,轉入第7步;若F值顯著,轉入第8步。
  • 舍棄小的MA參數,擬合m<2n-2的模型ARMA(2n-1,m) ,并用F準則進行檢驗。重復這一過程,直到得出具有最小參數的適用模型為止。
  • 舍棄小的MA參數,擬合m<2n-1的模型ARMA(2n,m) ,并用F準則進行檢驗。重復這一過程,直到得出具有最小參數的適用模型為止。
  • ?聚類方法聚類方法對比直通車:

    ?圖論方法:

    1.最短路問題:兩個指定頂點之間的最短路徑—給出了一個連接若干個城鎮的鐵路網絡,在這個網絡的兩個指定城鎮間,找一條最短鐵路線 (Dijkstra算法 )每對頂點之間的最短路徑 (Dijkstra算法、Floyd算法 )。

    2.最小生成樹問題:連線問題—欲修筑連接多個城市的鐵路設計一個線路圖,使總造價最低(prim算法、Kruskal算法 )。

    3.圖的匹配問題:人員分派問題:n個工作人員去做件n份工作,每人適合做其中一件或幾件,問能否每人都有一份適合的工作?如果不能,最多幾人可以有適合的工作?(匈牙利算法)。

    4.遍歷性問題:中國郵遞員問題—郵遞員發送郵件時,要從郵局出發,經過他投遞范圍內的每條街道至少一次,然后返回郵局,但郵遞員希望選擇一條行程最短的路線。

    5.最小費用問題:在運輸問題中,人們總是希望在完成運輸任務的同時,尋求一個使總的運輸費用最小的運輸方案。

    5.建立了模型,某些相關參數偏差很厲害,是否懷疑過模型?

    ??遇到這種問題以后,首先要做的就是確定模型的建立的合理性,依據是哪些。如果模型是合理的,那么比較重要的一點,就是需要將數據進行分析。數據建模中的許多數據都是實際數據,而模型,是一種標準化。實際數據放在模型中去驗證,很多都是有問題。出現這些問題的原因,不是模型錯誤,而是數據不一定有效。下面就舉幾種數據不一定有效的情況:

    • 第一種情況是由于某些原因造成的缺少數據。
    • 第二種情況是由于人為的一些原因造成的數據錯誤。
    • 第三種情況是由于數據采集過程中,不恰當采集,造成的臟數據。

    還有很多種情況,就不在這里細說。 遇到這樣的事情,首先要做到的就是剔除掉無效數據,然后再論文中說明,為什么要剔除這些數據,然后再驗證模型的合理性。

    6.監督學習與非監督學習該如何應用

    何謂機器學習

    ??斯坦福大學的Machine Learning課程是這樣解釋:

    ??Machine Learning is field of study that gives computers the ability to learn without being explicitly programmed.

    ??也就是說機器學習不需要制定具體的模型,而是讓計算機根據龐大的數據量自己訓練模型。

    一、監督學習(Supervised learning)

    ??數據集中的每個樣本有相應的“正確答案”,根據這些樣本做出預測,分有兩類:回歸問題和分類問題

    (1)回歸問題

    ??例如預測房價,根據樣本集擬合出一條連續曲線

    (2)分類問題

    ??例如:根據腫瘤特征判斷良性還是惡性,得到的是結果是“良性”或者“惡性”,是離散的

    二、非監督學習(Unsupervised learning)

    ??非監督學習的數據集跟監督學習不同,沒有任何標簽,即沒有相應的“正確答案”。從數據集中可以通過非監督學習得到數據的某種結構,可能是把數據分成兩個不同的聚集簇,稱為聚類算法。

    例如:從數據設置上看:

    ??無監督學習:訓練樣本數據和待分類的類別已知,但訓練樣本數據皆為非標簽數據;

    ?? 監督學習:訓練樣本數據和待分類的類別已知,且訓練樣本數據皆為標簽數據;

    7. 團隊如何分配任務

    ?? 雖然涉及大概三點:數學,編程,寫作。那么安排一個負責文檔、一個負責算法、一個負責編程這樣不一定對,分工太明確了,會讓人產生依賴思想,不愿去動腦子。有多少團隊是內部瓦解,如同創業合伙人散伙一樣,合則雙贏。理想的分工是這樣的:數學建模競賽小組中的每一個人,都能勝任其它人的工作,就算小組只剩下她(他)一個人,也照樣能夠搞定數學建模競賽。在競賽中的分工,只是為了提高工作的效率,做出更好的結果。

    8.以后具體該向哪個方向找工作

    ?? 首先告訴你:中國研究生數學建模獲獎上海落戶加分,最多加10分,具體請參見當年上海積分落戶制度細則。

    工作方向:大數據、機器學習、人工智能都可涉獵,具體崗位比如說在金融方面,金融量化,金融建模,數據分析師等,隨便到一個網站一搜就有很多,具體就不列舉了。

    附上以前收集的比較文檔,下載連接如下,目前CSDN無法設置0積分,沒有積分的可以聯系我。

    下載文件地址:寫好數學建模競賽答卷注意事項(參賽寶典)

    數學建模模板(建模論文競賽標準版)

    9.案例

    根據對某地區小區數據依據距離進行k-means聚類(從原理入手,并未引入算法模塊,希望大家平時聯系也是如此,有利于對原理的深入理解) 數據結構如下:(租金(元/㎡/月)、房齡(年)、小區名稱)

    聚類結果如下(不同顏色代表不同類別):

    總結

    以上是生活随笔為你收集整理的数学建模之倚天剑与屠龙刀的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。