【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目...
00
?導讀
每一個項目的第一步就是立項,立項需要進行充分的調(diào)研才能確定是否值得啟動一個項目。調(diào)研主要要做好兩個方向:1,算法調(diào)研,它主要是確定可行的技術(shù)路線。更具體的說,需要清楚想做的事情是否已經(jīng)到達落地的水準,也就是可行性的驗證。2,市場調(diào)研,它主要確定的是,所選中的方案是否有市場需求,是否已經(jīng)有成熟的競爭對手和市場。
下面分別從這兩個方向進行講述,我們以圖像風格化為例,所謂圖像風格化,學術(shù)名詞是image style transfer,研究起源于這一篇論文A neural algorithm of artistic style[1],3年前我的公眾號《與有三學AI》也做過報導,大家有興趣可以去看,
它是采用神經(jīng)網(wǎng)絡(luò)的方法,分別學習到一幅圖像的紋理和風格,從而實現(xiàn)從一幅圖像風格到另一幅圖像的遷移,如下,將圖2的風格,應(yīng)用到圖1上。
當然,現(xiàn)在已經(jīng)有了很多新的應(yīng)用,尤其是基于人臉的非常多,詳細的介紹和技術(shù)原理,大家可以去參考我以前開設(shè)的AI攝影基礎(chǔ)課程。其中詳細地講述了攝影中各方面的圖像知識。
下面言歸正傳,回到風格化研究的調(diào)研。
01
從哪些地方開始調(diào)研?
1.1 市場調(diào)研
在做算法調(diào)研之前,先要做市場調(diào)研。市場調(diào)研需要涵蓋主流的產(chǎn)品形態(tài),包括 app,普通的網(wǎng)頁應(yīng)用以及小程序;所面對的目標用戶(年齡層次,地域分布),現(xiàn)有的市場份額,以及潛在的競爭對手等也需要了解。
這一塊沒有多少可說的,平時多關(guān)注關(guān)注新聞,相關(guān)朋友圈的分享,相關(guān)公眾號即可,比如當年非常火的prisma,作為從業(yè)人員想忽視也不容易的。
?然后到ios平臺和安卓平臺去搜搜關(guān)鍵詞,看看各大公司是否已經(jīng)跟上推出類似產(chǎn)品。
我們一調(diào)研就知道,國內(nèi)幾大圖像算法公司,騰訊的天天P圖,美圖科技的美圖秀秀,Camera360的MIX濾鏡都有相關(guān)產(chǎn)品,其他小產(chǎn)品也不少。
我們分別拿一張人臉和風景圖做測試。
試試美圖黑科技中繪畫機器人
天天P圖中的各類風格。
MIX中藝術(shù)濾鏡。
當然,現(xiàn)在已經(jīng)存在非常多類似的app了,初步的調(diào)研結(jié)果顯示,基于圖片的風格化技術(shù)已經(jīng)成熟,而且產(chǎn)品面世也已經(jīng)不止兩年了,我們偶爾會在朋友圈里看到類似的分享,當然具體的用戶比例,可能需要我們自己去做一些調(diào)研問卷,投票之類的。
不過,還沒有看到比較好的基于視頻的調(diào)研結(jié)果,所以這可能是一個突破點。
最后我們要總結(jié)一下調(diào)研的結(jié)果:
建議從以下幾個方向:
技術(shù)成熟度
受眾
產(chǎn)品使用頻率
競爭對手
1.2 算法調(diào)研
1.2.1 國內(nèi)外前沿學術(shù)研究
可以找一些好的博士碩士論文,相關(guān)綜述,看看總結(jié)和方向。再找學術(shù)界和工業(yè)界的相關(guān)比賽,以及數(shù)據(jù)集。
1.2.1.1 中文調(diào)研
(1) 首先調(diào)研綜述類文章,查看cnki相關(guān)關(guān)鍵詞的博士碩士論文,以及優(yōu)秀中文期刊的綜述。
還是以圖像風格化為例,到中國知網(wǎng)平臺,http://www.cnki.net/
搜索結(jié)果如下:
根據(jù)下載量與被引用因子,可以初步判斷文章的質(zhì)量,同時發(fā)表時間也需要作為參考。
(2) 百度學術(shù)調(diào)研
雖然百度學術(shù)與Google學術(shù)相差甚遠,但是也可以作為輔助。
這其中可以調(diào)研到發(fā)表時間,來源期刊,同時可以獲取到引用格式,這在寫作學術(shù)論文和調(diào)研報告中也會非常有用。
1.2.1.2 英文調(diào)研
中文調(diào)研應(yīng)該作為一個入門的了解,而英文文獻的調(diào)研,才是了解最前沿技術(shù)的正確方法,必須使用好Google學術(shù)以及Google通用搜索引擎。同時,由于現(xiàn)在很多的論文在接收和正式發(fā)表之前,都已經(jīng)發(fā)在了arprint平臺上,所以為了獲取最新的研究結(jié)果,這個也是必須的。
(1) Google與Google學術(shù)。
Google學術(shù)擅長于尋找正式發(fā)表的學術(shù)論文,而Google通用搜索引擎則可以廣泛瀏覽相關(guān)內(nèi)容,都需要去仔細篩選。
另外,Google和百度都提供了一個api調(diào)研關(guān)鍵詞的熱度趨勢
https://trends.google.com/trends/
? ? ? https://zhishu.baidu.com/#/
(2) Arxiv
https://arxiv.org/
學術(shù)界最新的研究成果往往是先發(fā)表在這里,甚至可能領(lǐng)先正式出版機構(gòu)一年以上,所以這也是需要去認真調(diào)研的。機器學習相關(guān)的在computer science欄目下。
在調(diào)研學術(shù)論文的時候,優(yōu)先看綜述,然后重點關(guān)注知名的研究機構(gòu),引用量大的論文。
比如這個方向,就能找到一篇綜述文章Neural Style Transfer: A Review【2】,若干經(jīng)典文章,比如開啟這個方向的【1】,首次將其實時化的李飛飛組的研究【3】等。
通過閱讀綜述文章和一系列經(jīng)典文章和前沿文章之后,就能對該方向的技術(shù)路線等有了很明確的認知。
當然如果有機會參與一些比較牛逼的團隊或者身邊有相關(guān)人脈,則更有可能獲得最新的研究成果,那也是極好的。
1.3 行業(yè)媒體調(diào)研
在機器學習領(lǐng)域,現(xiàn)在有很多的優(yōu)秀自媒體,他們也會經(jīng)常總結(jié)一些前沿的研究,所以這也是一個很好的調(diào)研渠道。
筆者下面做一些推薦。
機器之心,新智元,AI科技評論,AI科技大本營,都是人工智能媒體與產(chǎn)業(yè)服務(wù)平臺,注重總結(jié)學術(shù)界的最新研究與工業(yè)界的最新動向,干貨很多。
深度學習大講堂,Paperweekly,國內(nèi)CV界的前沿研究推送,學術(shù)為主,解讀前沿論文。
大數(shù)據(jù)文摘,內(nèi)容不限于AI與機器學習,所有與大數(shù)據(jù)相關(guān)東西,所以也會顯得更加全而雜亂。
36氪,虎嘯網(wǎng)等,注重商業(yè)報告,尤其強調(diào)行業(yè)趨勢,創(chuàng)業(yè)的朋友肯定是需要經(jīng)常關(guān)注。
知乎微博,雖然現(xiàn)在知乎內(nèi)容越來越多整體質(zhì)量下滑嚴重,但是仍然是國內(nèi)尤其是技術(shù)精英喜歡逛的地方。雖然微博娛樂泛濫,但是也不能完全否定它上面也有一些還不錯的自媒體,像每天堅持截取論文研究結(jié)果的“愛可可愛生活”,以及各大新聞媒體,新浪科技,大佬的微博動向,比如雷軍每次都會介紹自家小米的產(chǎn)品。
當然厚臉皮推薦一下自己在鼓搗的技術(shù)公眾號《與有三學AI》以及知乎專欄《深度學習模型訓練經(jīng)驗與代碼剖析》,水平有限未形成規(guī)模,歡迎大家加入。
1.4 github
Github的重要性就不用多說了吧,鑒于它已經(jīng)成為了國內(nèi)最大的技術(shù)人員交友平臺,所以在這里調(diào)研技術(shù)再適合不夠。
以image style transfer為例,一找就找到一個高質(zhì)量的資源。
https://github.com/ycjing/Neural-Style-Transfer-Papers
帶有相當完整的論文list與開源代碼,再精讀這些資源之后,想不了解都難了。
而且,等正式開始干活之后,這些資源很有可能就會成為起點。
02
怎樣寫好調(diào)研報告
上面既然已經(jīng)完成了調(diào)研,那么要交出去給別人看的時候,就一定要寫好調(diào)研報告。下面我們就要作出一些總結(jié),主要從以下幾個方向入手,還是以圖像風格化為例。
2.1 用戶調(diào)研總結(jié)
潛在用戶
AI技術(shù)愛好者,這一類人喜歡嘗試新鮮技術(shù)。
攝影愛好者,喜歡研究各類濾鏡。
女性,對于美顏和人臉風格化有需求的廣大女性。
使用地點,時間點和頻次
朋友圈等社交平臺。屬于日常低頻需求,朋友圈偶見轉(zhuǎn)發(fā),可能集中在特定節(jié)日。比如5-4青年節(jié)天天P圖推出的民國風格。
用戶需求
求新與切合時間點,喜歡不斷嘗試新的濾鏡,喜歡在特定時間段集中爆發(fā)嘗試與轉(zhuǎn)發(fā)。
使用平臺
移動端app和網(wǎng)頁應(yīng)用。
總結(jié):圖像風格化實際上是一個低頻非剛需,它與美顏有著本質(zhì)的區(qū)別,因為后者只是對圖像的微調(diào),而前者則是一個新的創(chuàng)作。因此,如果做這一類產(chǎn)品,結(jié)合特定時間點做趣味性強的短期爆款制造營銷事件比特意開發(fā)一個app會更加符合一個新的產(chǎn)品定位。
2.2 競爭對手調(diào)研總結(jié)
美圖秀秀與天天P圖等國內(nèi)app
對手特點,技術(shù)一流,產(chǎn)品全面且受眾廣,總是能在特殊時間點制造營銷爆點,正面PK技術(shù)實力和產(chǎn)品設(shè)計都面臨很大的考驗,失敗風險大。
小蟻AI藝術(shù)等小程序
產(chǎn)品簡單,效果相比主流app較差,有視頻風格化。
總結(jié):針對大公司技術(shù)實力強但是不敢輕易嘗試非成熟技術(shù),而小公司技術(shù)實力弱但是產(chǎn)品可以快速迭代的特點,我們可以以短小精美的前端界面+最新技術(shù)探索的方式,甚至嘗試非主流擦邊球的形態(tài)來突然推出爆款。
2.3 技術(shù)調(diào)研總結(jié)
靜態(tài)圖片風格化
技術(shù)路線已經(jīng)比較成熟且風格化效果較好,相關(guān)app已經(jīng)大量出現(xiàn),門檻較低,有經(jīng)驗的工程師一個月內(nèi)實現(xiàn)一個demo上線沒問題。
視頻風格化
計算代價較高相關(guān)競品很少,需要具備一流研發(fā)能力的團隊。
最終總結(jié):磨刀不誤砍柴工,在正式想好做一個項目之前,最好先做好上面的3步調(diào)研,免得閉門造車。
【1】Gatys L A, Ecker A S, Bethge M. A neural algorithm of artistic style[J]. arXiv preprint arXiv:1508.06576, 2015.
【2】Jing Y, Yang Y, Feng Z, et al. Neural style transfer: A review[J]. arXiv preprint arXiv:1705.04058, 2017.
【3】Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European Conference on Computer Vision. Springer, Cham, 2016: 694-711.
如果想加入我們,后臺留言吧
微信
Longlongtogo
公眾號內(nèi)容
1 圖像基礎(chǔ)|2 深度學習|3 行業(yè)信息
往期精彩
?
【技術(shù)綜述】如何Finetune一個小網(wǎng)絡(luò)到移動端(時空性能分析篇)
?
【技術(shù)綜述】一文道盡softmax loss及其變種
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【从caffe到Tensorflow 1
- 下一篇: 【学员分享】深度学习计算机视觉,两个星期