當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

数据建模中的大坑判断

發(fā)布時(shí)間：2023/12/20 编程问答 39 豆豆

生活随笔收集整理的這篇文章主要介紹了数据建模中的大坑判断小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

上述圖形使用的是百度的思維導(dǎo)圖．

因?yàn)橛行┕緦?duì)于人工智能技術(shù)非常的腦熱，認(rèn)為只要招人給錢(qián)就能通吃包打天下，這個(gè)其實(shí)是不對(duì)的行為．

不可以建立模型的數(shù)據(jù)舉例：
例如根據(jù)學(xué)生翻動(dòng)ppt次數(shù)來(lái)判斷他的學(xué)業(yè)成績(jī)，然后進(jìn)行建模．（明顯扯淡對(duì)不？但是卻通過(guò)了國(guó)家973計(jì)劃）

數(shù)據(jù)不可獲取的情況舉例：
不打標(biāo)簽的，初創(chuàng)公司數(shù)據(jù)不夠但是想搞深度學(xué)習(xí)的．

非線性規(guī)律：
因?yàn)樯窠?jīng)網(wǎng)絡(luò)對(duì)特征進(jìn)行組合只能滿足線性組合，不可能進(jìn)行非線性組合（例如兩個(gè)特征的乘積構(gòu)造成一個(gè)新的特征），因?yàn)閿?shù)據(jù)集的相關(guān)的業(yè)務(wù)知識(shí)能讓你知道哪幾個(gè)特征的非線性組合對(duì)目標(biāo)是有幫助的．
如果是線性組合，那么即使不具備相關(guān)的業(yè)務(wù)知識(shí)，純粹依靠神經(jīng)網(wǎng)絡(luò)的訓(xùn)練，也能訓(xùn)練得到合理的模型．

一定要注意:
數(shù)據(jù)如果十分龐大，那往往也就不需要你了，因?yàn)辇嫶蟮臄?shù)據(jù)集，找個(gè)沒(méi)畢業(yè)的初高中生調(diào)包也能做到90％以上的準(zhǔn)確率，那企業(yè)花3000塊錢(qián)的月薪來(lái)招人來(lái)做就行，還要你干嘛？

數(shù)據(jù)的建模門(mén)檻，要么是數(shù)據(jù)相關(guān)的專業(yè)知識(shí)不夠，要么是數(shù)據(jù)集不太夠，要么不會(huì)對(duì)開(kāi)源包進(jìn)行合理利用．
另外由于AutoML的逐漸發(fā)展以及計(jì)算機(jī)算力的逐漸提升，到后期，如果算力高度發(fā)達(dá)，那么幾個(gè)開(kāi)源包的選擇上，計(jì)算機(jī)可以暴力窮舉判斷，這個(gè)時(shí)候就不需要所謂的調(diào)參工程師了．

總結(jié)

以上是生活随笔為你收集整理的数据建模中的大坑判断的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：使用cython加密python代码
下一篇： kaggle奖牌发放体系(转)