日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪(fǎng)問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目...

發(fā)布時(shí)間:2025/3/20 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目... 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

00

?導(dǎo)讀

每一個(gè)項(xiàng)目的第一步就是立項(xiàng),立項(xiàng)需要進(jìn)行充分的調(diào)研才能確定是否值得啟動(dòng)一個(gè)項(xiàng)目。調(diào)研主要要做好兩個(gè)方向:1,算法調(diào)研,它主要是確定可行的技術(shù)路線(xiàn)。更具體的說(shuō),需要清楚想做的事情是否已經(jīng)到達(dá)落地的水準(zhǔn),也就是可行性的驗(yàn)證。2,市場(chǎng)調(diào)研,它主要確定的是,所選中的方案是否有市場(chǎng)需求,是否已經(jīng)有成熟的競(jìng)爭(zhēng)對(duì)手和市場(chǎng)。

下面分別從這兩個(gè)方向進(jìn)行講述,我們以圖像風(fēng)格化為例,所謂圖像風(fēng)格化,學(xué)術(shù)名詞是image style transfer,研究起源于這一篇論文A neural algorithm of artistic style[1],3年前我的公眾號(hào)《與有三學(xué)AI》也做過(guò)報(bào)導(dǎo),大家有興趣可以去看,

它是采用神經(jīng)網(wǎng)絡(luò)的方法,分別學(xué)習(xí)到一幅圖像的紋理和風(fēng)格,從而實(shí)現(xiàn)從一幅圖像風(fēng)格到另一幅圖像的遷移,如下,將圖2的風(fēng)格,應(yīng)用到圖1上。

當(dāng)然,現(xiàn)在已經(jīng)有了很多新的應(yīng)用,尤其是基于人臉的非常多,詳細(xì)的介紹和技術(shù)原理,大家可以去參考我以前開(kāi)設(shè)的AI攝影基礎(chǔ)課程。其中詳細(xì)地講述了攝影中各方面的圖像知識(shí)。

下面言歸正傳,回到風(fēng)格化研究的調(diào)研。

01

從哪些地方開(kāi)始調(diào)研?

1.1 市場(chǎng)調(diào)研

在做算法調(diào)研之前,先要做市場(chǎng)調(diào)研。市場(chǎng)調(diào)研需要涵蓋主流的產(chǎn)品形態(tài),包括 app,普通的網(wǎng)頁(yè)應(yīng)用以及小程序;所面對(duì)的目標(biāo)用戶(hù)(年齡層次,地域分布),現(xiàn)有的市場(chǎng)份額,以及潛在的競(jìng)爭(zhēng)對(duì)手等也需要了解。

這一塊沒(méi)有多少可說(shuō)的,平時(shí)多關(guān)注關(guān)注新聞,相關(guān)朋友圈的分享,相關(guān)公眾號(hào)即可,比如當(dāng)年非常火的prisma,作為從業(yè)人員想忽視也不容易的。

?然后到ios平臺(tái)和安卓平臺(tái)去搜搜關(guān)鍵詞,看看各大公司是否已經(jīng)跟上推出類(lèi)似產(chǎn)品。

我們一調(diào)研就知道,國(guó)內(nèi)幾大圖像算法公司,騰訊的天天P圖,美圖科技的美圖秀秀,Camera360的MIX濾鏡都有相關(guān)產(chǎn)品,其他小產(chǎn)品也不少。

我們分別拿一張人臉和風(fēng)景圖做測(cè)試。

試試美圖黑科技中繪畫(huà)機(jī)器人

天天P圖中的各類(lèi)風(fēng)格。

MIX中藝術(shù)濾鏡。

當(dāng)然,現(xiàn)在已經(jīng)存在非常多類(lèi)似的app了,初步的調(diào)研結(jié)果顯示,基于圖片的風(fēng)格化技術(shù)已經(jīng)成熟,而且產(chǎn)品面世也已經(jīng)不止兩年了,我們偶爾會(huì)在朋友圈里看到類(lèi)似的分享,當(dāng)然具體的用戶(hù)比例,可能需要我們自己去做一些調(diào)研問(wèn)卷,投票之類(lèi)的。

不過(guò),還沒(méi)有看到比較好的基于視頻的調(diào)研結(jié)果,所以這可能是一個(gè)突破點(diǎn)。

最后我們要總結(jié)一下調(diào)研的結(jié)果:

建議從以下幾個(gè)方向:

  • 技術(shù)成熟度

  • 受眾

  • 產(chǎn)品使用頻率

  • 競(jìng)爭(zhēng)對(duì)手

1.2 算法調(diào)研

1.2.1 國(guó)內(nèi)外前沿學(xué)術(shù)研究

可以找一些好的博士碩士論文,相關(guān)綜述,看看總結(jié)和方向。再找學(xué)術(shù)界和工業(yè)界的相關(guān)比賽,以及數(shù)據(jù)集。

1.2.1.1 中文調(diào)研

(1) 首先調(diào)研綜述類(lèi)文章,查看cnki相關(guān)關(guān)鍵詞的博士碩士論文,以及優(yōu)秀中文期刊的綜述。

還是以圖像風(fēng)格化為例,到中國(guó)知網(wǎng)平臺(tái),http://www.cnki.net/

搜索結(jié)果如下:

根據(jù)下載量與被引用因子,可以初步判斷文章的質(zhì)量,同時(shí)發(fā)表時(shí)間也需要作為參考。

(2) 百度學(xué)術(shù)調(diào)研

雖然百度學(xué)術(shù)與Google學(xué)術(shù)相差甚遠(yuǎn),但是也可以作為輔助。

這其中可以調(diào)研到發(fā)表時(shí)間,來(lái)源期刊,同時(shí)可以獲取到引用格式,這在寫(xiě)作學(xué)術(shù)論文和調(diào)研報(bào)告中也會(huì)非常有用。

1.2.1.2 英文調(diào)研

中文調(diào)研應(yīng)該作為一個(gè)入門(mén)的了解,而英文文獻(xiàn)的調(diào)研,才是了解最前沿技術(shù)的正確方法,必須使用好Google學(xué)術(shù)以及Google通用搜索引擎。同時(shí),由于現(xiàn)在很多的論文在接收和正式發(fā)表之前,都已經(jīng)發(fā)在了arprint平臺(tái)上,所以為了獲取最新的研究結(jié)果,這個(gè)也是必須的。

(1) Google與Google學(xué)術(shù)。

Google學(xué)術(shù)擅長(zhǎng)于尋找正式發(fā)表的學(xué)術(shù)論文,而Google通用搜索引擎則可以廣泛瀏覽相關(guān)內(nèi)容,都需要去仔細(xì)篩選。

另外,Google和百度都提供了一個(gè)api調(diào)研關(guān)鍵詞的熱度趨勢(shì)

https://trends.google.com/trends/

? ? ? https://zhishu.baidu.com/#/

(2) Arxiv

https://arxiv.org/

學(xué)術(shù)界最新的研究成果往往是先發(fā)表在這里,甚至可能領(lǐng)先正式出版機(jī)構(gòu)一年以上,所以這也是需要去認(rèn)真調(diào)研的。機(jī)器學(xué)習(xí)相關(guān)的在computer science欄目下。

在調(diào)研學(xué)術(shù)論文的時(shí)候,優(yōu)先看綜述,然后重點(diǎn)關(guān)注知名的研究機(jī)構(gòu),引用量大的論文。

比如這個(gè)方向,就能找到一篇綜述文章Neural Style Transfer: A Review【2】,若干經(jīng)典文章,比如開(kāi)啟這個(gè)方向的【1】,首次將其實(shí)時(shí)化的李飛飛組的研究【3】等。

通過(guò)閱讀綜述文章和一系列經(jīng)典文章和前沿文章之后,就能對(duì)該方向的技術(shù)路線(xiàn)等有了很明確的認(rèn)知。

當(dāng)然如果有機(jī)會(huì)參與一些比較牛逼的團(tuán)隊(duì)或者身邊有相關(guān)人脈,則更有可能獲得最新的研究成果,那也是極好的。

1.3 行業(yè)媒體調(diào)研

在機(jī)器學(xué)習(xí)領(lǐng)域,現(xiàn)在有很多的優(yōu)秀自媒體,他們也會(huì)經(jīng)常總結(jié)一些前沿的研究,所以這也是一個(gè)很好的調(diào)研渠道。

筆者下面做一些推薦。

  • 機(jī)器之心,新智元,AI科技評(píng)論,AI科技大本營(yíng),都是人工智能媒體與產(chǎn)業(yè)服務(wù)平臺(tái),注重總結(jié)學(xué)術(shù)界的最新研究與工業(yè)界的最新動(dòng)向,干貨很多。

  • 深度學(xué)習(xí)大講堂,Paperweekly,國(guó)內(nèi)CV界的前沿研究推送,學(xué)術(shù)為主,解讀前沿論文。

  • 大數(shù)據(jù)文摘,內(nèi)容不限于AI與機(jī)器學(xué)習(xí),所有與大數(shù)據(jù)相關(guān)東西,所以也會(huì)顯得更加全而雜亂。

  • 36氪,虎嘯網(wǎng)等,注重商業(yè)報(bào)告,尤其強(qiáng)調(diào)行業(yè)趨勢(shì),創(chuàng)業(yè)的朋友肯定是需要經(jīng)常關(guān)注。

  • 知乎微博,雖然現(xiàn)在知乎內(nèi)容越來(lái)越多整體質(zhì)量下滑嚴(yán)重,但是仍然是國(guó)內(nèi)尤其是技術(shù)精英喜歡逛的地方。雖然微博娛樂(lè)泛濫,但是也不能完全否定它上面也有一些還不錯(cuò)的自媒體,像每天堅(jiān)持截取論文研究結(jié)果的“愛(ài)可可愛(ài)生活”,以及各大新聞媒體,新浪科技,大佬的微博動(dòng)向,比如雷軍每次都會(huì)介紹自家小米的產(chǎn)品。

  • 當(dāng)然厚臉皮推薦一下自己在鼓搗的技術(shù)公眾號(hào)《與有三學(xué)AI》以及知乎專(zhuān)欄《深度學(xué)習(xí)模型訓(xùn)練經(jīng)驗(yàn)與代碼剖析》,水平有限未形成規(guī)模,歡迎大家加入。

    1.4 github

    Github的重要性就不用多說(shuō)了吧,鑒于它已經(jīng)成為了國(guó)內(nèi)最大的技術(shù)人員交友平臺(tái),所以在這里調(diào)研技術(shù)再適合不夠。

    以image style transfer為例,一找就找到一個(gè)高質(zhì)量的資源。

    https://github.com/ycjing/Neural-Style-Transfer-Papers

    帶有相當(dāng)完整的論文list與開(kāi)源代碼,再精讀這些資源之后,想不了解都難了。

    而且,等正式開(kāi)始干活之后,這些資源很有可能就會(huì)成為起點(diǎn)。

    02

    怎樣寫(xiě)好調(diào)研報(bào)告

    上面既然已經(jīng)完成了調(diào)研,那么要交出去給別人看的時(shí)候,就一定要寫(xiě)好調(diào)研報(bào)告。下面我們就要作出一些總結(jié),主要從以下幾個(gè)方向入手,還是以圖像風(fēng)格化為例。

    2.1 用戶(hù)調(diào)研總結(jié)

    • 潛在用戶(hù)

    AI技術(shù)愛(ài)好者,這一類(lèi)人喜歡嘗試新鮮技術(shù)。

    攝影愛(ài)好者,喜歡研究各類(lèi)濾鏡。

    女性,對(duì)于美顏和人臉風(fēng)格化有需求的廣大女性。

    • 使用地點(diǎn),時(shí)間點(diǎn)和頻次

    朋友圈等社交平臺(tái)。屬于日常低頻需求,朋友圈偶見(jiàn)轉(zhuǎn)發(fā),可能集中在特定節(jié)日。比如5-4青年節(jié)天天P圖推出的民國(guó)風(fēng)格。

    • 用戶(hù)需求

    求新與切合時(shí)間點(diǎn),喜歡不斷嘗試新的濾鏡,喜歡在特定時(shí)間段集中爆發(fā)嘗試與轉(zhuǎn)發(fā)。

    • 使用平臺(tái)

    移動(dòng)端app和網(wǎng)頁(yè)應(yīng)用。

    總結(jié):圖像風(fēng)格化實(shí)際上是一個(gè)低頻非剛需,它與美顏有著本質(zhì)的區(qū)別,因?yàn)楹笳咧皇菍?duì)圖像的微調(diào),而前者則是一個(gè)新的創(chuàng)作。因此,如果做這一類(lèi)產(chǎn)品,結(jié)合特定時(shí)間點(diǎn)做趣味性強(qiáng)的短期爆款制造營(yíng)銷(xiāo)事件比特意開(kāi)發(fā)一個(gè)app會(huì)更加符合一個(gè)新的產(chǎn)品定位。

    2.2 競(jìng)爭(zhēng)對(duì)手調(diào)研總結(jié)

    • 美圖秀秀與天天P圖等國(guó)內(nèi)app

    對(duì)手特點(diǎn),技術(shù)一流,產(chǎn)品全面且受眾廣,總是能在特殊時(shí)間點(diǎn)制造營(yíng)銷(xiāo)爆點(diǎn),正面PK技術(shù)實(shí)力和產(chǎn)品設(shè)計(jì)都面臨很大的考驗(yàn),失敗風(fēng)險(xiǎn)大。

    • 小蟻AI藝術(shù)等小程序

    產(chǎn)品簡(jiǎn)單,效果相比主流app較差,有視頻風(fēng)格化。

    總結(jié):針對(duì)大公司技術(shù)實(shí)力強(qiáng)但是不敢輕易嘗試非成熟技術(shù),而小公司技術(shù)實(shí)力弱但是產(chǎn)品可以快速迭代的特點(diǎn),我們可以以短小精美的前端界面+最新技術(shù)探索的方式,甚至嘗試非主流擦邊球的形態(tài)來(lái)突然推出爆款。

    2.3 技術(shù)調(diào)研總結(jié)

    • 靜態(tài)圖片風(fēng)格化

    技術(shù)路線(xiàn)已經(jīng)比較成熟且風(fēng)格化效果較好,相關(guān)app已經(jīng)大量出現(xiàn),門(mén)檻較低,有經(jīng)驗(yàn)的工程師一個(gè)月內(nèi)實(shí)現(xiàn)一個(gè)demo上線(xiàn)沒(méi)問(wèn)題。

    • 視頻風(fēng)格化

    計(jì)算代價(jià)較高相關(guān)競(jìng)品很少,需要具備一流研發(fā)能力的團(tuán)隊(duì)。

    最終總結(jié):磨刀不誤砍柴工,在正式想好做一個(gè)項(xiàng)目之前,最好先做好上面的3步調(diào)研,免得閉門(mén)造車(chē)。

    【1】Gatys L A, Ecker A S, Bethge M. A neural algorithm of artistic style[J]. arXiv preprint arXiv:1508.06576, 2015.

    【2】Jing Y, Yang Y, Feng Z, et al. Neural style transfer: A review[J]. arXiv preprint arXiv:1705.04058, 2017.

    【3】Johnson J, Alahi A, Fei-Fei L. Perceptual losses for real-time style transfer and super-resolution[C]//European Conference on Computer Vision. Springer, Cham, 2016: 694-711.



    如果想加入我們,后臺(tái)留言吧

    微信

    Longlongtogo

    公眾號(hào)內(nèi)容

    1 圖像基礎(chǔ)|2 深度學(xué)習(xí)|3 行業(yè)信息

    往期精彩

    ?

    【技術(shù)綜述】如何Finetune一個(gè)小網(wǎng)絡(luò)到移動(dòng)端(時(shí)空性能分析篇)

    ?

    【技術(shù)綜述】一文道盡softmax loss及其變種

    與50位技術(shù)專(zhuān)家面對(duì)面20年技術(shù)見(jiàn)證,附贈(zèng)技術(shù)全景圖

    總結(jié)

    以上是生活随笔為你收集整理的【深度学习图像项目实战-从入门到上线1】怎样学会科学的调研并启动一个项目...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。