2021美赛C题M奖思路
2021美賽C題亞洲大黃蜂思路
序言:
第一題的模型就用種群繁衍,然后用python做地圖的可視化,這就是數(shù)學(xué)公式啦,把地球近似成一個(gè)球體然后用角度和勾股定理模擬三代的繁衍(一開始只有三個(gè)巢穴是官方給的文獻(xiàn)能夠找到)
1.圖像識(shí)別
CNN卷積神經(jīng)網(wǎng)絡(luò)
2.TF-IDF
Term Frequency - Inverse Document Frequency = 詞頻-逆文本頻率
把語言向量化,TF-IDF把每一個(gè)文檔 夠早晨一個(gè)相量 把這個(gè)相量放在一個(gè)空間中 計(jì)算機(jī)計(jì)算空間的效率是最高的,深度學(xué)習(xí)就是把一個(gè)向量計(jì)算出來然后放在一個(gè)空間中去計(jì)算位置與位置的距離,角度與角度之間的大小,通過對(duì)比,最終實(shí)現(xiàn)搜索和匹配,閑聊機(jī)器人、搜索,基于這種底層邏輯!
就是說 像在賣房的中介說了一大堆話,我怎么知道他說的話里面哪句話對(duì)我是最重要的
把正確發(fā)現(xiàn)大黃蜂的描述文本創(chuàng)建一個(gè)TF-IDF,把后面每一個(gè)需要判斷的文本都輸入進(jìn)來計(jì)算TF*IDF最后計(jì)算兩個(gè)的余弦相似度,作為一個(gè)評(píng)分。
不足:不同領(lǐng)域的IDF不同,(中文結(jié)巴分詞)這里沒有特定的分領(lǐng)域。
3. 地點(diǎn)
用圖論
4.整合成一個(gè)模型
把上述三種不同的描述方面,整合成一個(gè)單獨(dú)的能夠判斷下一次上報(bào)的信息的可能性的一個(gè)模型
這里我們用的是層次分析法,首先是去量綱,然后歸一化,查閱相關(guān)的文獻(xiàn),然后給三個(gè)不同的判斷方向的,
5.分類與模型靈敏度分析
我們的需求是通過概率來分類,我們這里用二分類,要么消息是真的,要么是假的,這個(gè)時(shí)候ROC曲線當(dāng)仁不讓,用的是stata
TPR是真陽性檢出率(靈敏度)
FPR是假陽性率 = 1 - 真陰性檢出率(特異度)
我們要讓假陽性盡可能的小,真陽性盡可能的大,所以要越往左上角靠越好。我們要定義評(píng)分體系的最合理的“及格”分?jǐn)?shù)是多少,就要用到ROC的約登指數(shù)來找出最佳閾值
約登指數(shù) = 敏感度+特異度-1
ps:2021-10-01來看上榜了, 感謝大家支持啦~~~~
總結(jié)
以上是生活随笔為你收集整理的2021美赛C题M奖思路的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 刷网课seleinum 小程序
- 下一篇: 计算机无法访问权限,局域网共享无法访问权