数据建模中的大坑判断
上述圖形使用的是百度的思維導(dǎo)圖.
因?yàn)橛行┕緦?duì)于人工智能技術(shù)非常的腦熱,認(rèn)為只要招人給錢(qián)就能通吃包打天下,這個(gè)其實(shí)是不對(duì)的行為.
不可以建立模型的數(shù)據(jù)舉例:
例如根據(jù)學(xué)生翻動(dòng)ppt次數(shù)來(lái)判斷他的學(xué)業(yè)成績(jī),然后進(jìn)行建模.(明顯扯淡對(duì)不?但是卻通過(guò)了國(guó)家973計(jì)劃)
數(shù)據(jù)不可獲取的情況舉例:
不打標(biāo)簽的,初創(chuàng)公司數(shù)據(jù)不夠但是想搞深度學(xué)習(xí)的.
非線性規(guī)律:
因?yàn)樯窠?jīng)網(wǎng)絡(luò)對(duì)特征進(jìn)行組合只能滿足線性組合,不可能進(jìn)行非線性組合(例如兩個(gè)特征的乘積構(gòu)造成一個(gè)新的特征),因?yàn)閿?shù)據(jù)集的相關(guān)的業(yè)務(wù)知識(shí)能讓你知道哪幾個(gè)特征的非線性組合對(duì)目標(biāo)是有幫助的.
如果是線性組合,那么即使不具備相關(guān)的業(yè)務(wù)知識(shí),純粹依靠神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,也能訓(xùn)練得到合理的模型.
一定要注意:
數(shù)據(jù)如果十分龐大,那往往也就不需要你了,因?yàn)辇嫶蟮臄?shù)據(jù)集,找個(gè)沒(méi)畢業(yè)的初高中生調(diào)包也能做到90%以上的準(zhǔn)確率,那企業(yè)花3000塊錢(qián)的月薪來(lái)招人來(lái)做就行,還要你干嘛?
數(shù)據(jù)的建模門(mén)檻,要么是數(shù)據(jù)相關(guān)的專業(yè)知識(shí)不夠,要么是數(shù)據(jù)集不太夠,要么不會(huì)對(duì)開(kāi)源包進(jìn)行合理利用.
另外由于AutoML的逐漸發(fā)展以及計(jì)算機(jī)算力的逐漸提升,到后期,如果算力高度發(fā)達(dá),那么幾個(gè)開(kāi)源包的選擇上,計(jì)算機(jī)可以暴力窮舉判斷,這個(gè)時(shí)候就不需要所謂的調(diào)參工程師了.
總結(jié)
以上是生活随笔為你收集整理的数据建模中的大坑判断的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 使用cython加密python代码
- 下一篇: kaggle奖牌发放体系(转)