2022华中杯C题矿井提升机钢丝绳的缺陷分析思路讲解
立志每天五點起床的我,腦子非常清醒!啊,題目沒見過…所以我們一起來讀題,理解理解,作為python常年數模玩家,不能慫!
一、題目導讀
第一自然段:就是介紹,大概看一下,用這個東西挖礦的嘛。
第二自然段:這里介紹了“磁平衡”方法檢測缺陷
以及相關測量判斷結果:
二、問題
2.1 第一問
場景:對于一個六繩長度為960米的鋼絲繩,升降十次。要求:對該場景的數據出現不同程度的噪音去噪,并找出所有缺陷數量,程度,位置。
既然給了數據,就一起來看下數吧,打不開文件就尷尬,用文本形式打開就好了:
數據似乎看不懂,所以看看數據說明:
文件格式:
1號電壓,2號電壓,3號電壓,4號電壓,5號電壓,6號電壓,方向, 脈沖, 時間戳
1.61, 1.06, 0.97, 0.95, 0.98, 1.47, 1, 1, 102070423
電壓值一共有六個,對應了六根鋼絲繩的數據。一行數據就是一幀數據。第一列表示第一根繩子的電壓值,第二列表示第二根繩子的電壓值,…,第六列表示第六根繩子的電壓值。
方向“0”代表下行,方向“1”表示上行。
脈沖:其實就是距離,通過距離傳感器得到。從1到n遞增,每一幀(一行數據代表一幀數據)對應一個脈沖數字,脈沖數每增加1,代表距離增加了0.4米。
可能有多幀數據對應一個脈沖(表示在0.4米內進行了多次測量)。在繪制波形圖時,每一幀所對應的距離等于0.4米除以幀數。
鋼絲繩長為960米,斷絲的位置可以用幀表示。
每一個文件記錄一次運行的監測數據,10個文件記錄了10次往返運行的監測數據。注意上行和下行的監測數據不是從同一端記錄。
依次對應九列數據,這樣的數據轉成csv不就好了?用pandas處理! 看了數據說明,數據就理解了。
2.2 第二問
基于第一問結果,建立模型,給出鋼絲繩的性能安全評價方法。
大概就是評價模型吧。
三、第一問解析
3.1 數據噪音是什么?
題目說到了有噪音,那么肯定要先去噪,什么是數據噪音搞明白了嗎?噪聲數據是指數據中存在著錯誤或異常(偏離期望值)的數據,這些數據對數據的分析造成了干擾。
說一下引擎噪聲數據原因,以便于理解:引起噪聲數據的原因可能是硬件故障、編程錯誤、語音或光學字符識別程序(OCR)識別出錯等。
3.2 噪音數據去噪方法?
方法如下:
回歸方法:
如果變量之間存在依賴關系,即y=f(x),那么我們可以設法求出依賴關系f,從而根據x來預測y,這也是回歸問題的實質。實際中更常見的假設是P(y)=N(f(x)),N是正態分布。假設y是觀測值且存在噪聲,如果我們能求出x和y之間的依賴關系,從而根據x來更新y的值,就可以去除其中的隨機噪聲,這就是回歸去噪的原理。
異常值檢測方法:
數據中的噪聲可能有兩種,一種是隨機誤差,另外一種可能是錯誤,比如我們手上有一份學生的體重數據,其中某一位學生的體重紀錄是20KG,很明顯,這是一個錯誤,如果這個樣本進入了我們訓練數據可能會對結果產生很大影響,這也是去噪中使用異常值檢測的意義所在。
MAD 法:
MAD 又稱為絕對值差中位數法。MAD 是一種先需計算所有因子與平均值之間的距離總和來檢測離群值的方法。
箱型圖分析:
箱型圖提供了一個識別異常值的標準,即大于或小于箱型圖設定的上下界的數值即為異常值,箱型圖如下圖所示
聚類:
將物理的或抽象對象的集合分組為由類似的對象組成的多個類。找出并清除那些落在簇之外的值(孤立點),這些孤立點被視為噪聲。聚類方法有很多,這里不詳細介紹,看我知乎。
以上方法均可用于去噪,我不能說誰好誰壞,你們可能在網上只看到了一種方法,請不要局限于如此狹隘的思路。去除噪音后,可看清楚題目要求,根據噪音處理后的數據進行求相關結果。后續更新看知乎吧,說得差不讀了。
四、第二問解析
鋼絲繩安全性能的量化評價方法: 關鍵詞,“評價”
這里介紹幾個評價方法:
還請讀者自行嘗試,以上的評價方法,我的數模專欄只講過2,3,更新文章確實費時間,大家自行選擇嘗試吧。
總結
以上是生活随笔為你收集整理的2022华中杯C题矿井提升机钢丝绳的缺陷分析思路讲解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【作业锦集】机器人学导论-空间变换及Ma
- 下一篇: 【机器人学导论】第四章.传感器