日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文落地 101:算法工程化的那些坑

發布時間:2024/10/8 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文落地 101:算法工程化的那些坑 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


筆者就職于泛化智能,一家專注于 AI 落地的計算機視覺公司。三年來,我們服務了大量需要 AI 的行業,比如電網、醫院、無人機、機場甚至野生動物保護。在做這些項目的過程中,我們積累了很多經驗(踩過很多,也挖過很多坑)。為了避免在工程中重復犯錯,我們內部在做工程項目前,都會根據下面這個 check list 逐條檢查。這里擴展一下,整理為 AI 落地中的常見問題,分享給大家:


你有顯卡,我有顯卡,但用戶有顯卡嗎?


也許你不相信一個擁有幾百人 IT 團隊的公司會沒有顯卡,不過你真的確定你用戶那里有顯卡嗎?在自己公司或者實驗室內部,我們的硬件條件基本都能得到滿足;但到了用戶那里,一切可能都不一樣了。?


有很多項目,必須要在客戶的電腦/服務器上去運行,而很多環境下是沒有 GPU 的——或者說,如果你做工程化,GPU 可能是種奢侈品。對于計算機視覺項目來說,假如客戶需要把模型搭載到他特有的硬件上(比如智能制造領域的缺陷檢測設備),事先與用戶確認硬件配置是至關重要的。?


一個簡單的判別標準:和客戶交流的時候,客戶知不知道什么是 GPU,絕對是合作難易程度的分水嶺。知道且清楚什么是 GPU 的,合作起來會更簡單;而如果對 GPU 一無所知的,或者只用過 Intel GPU的,項目落地難度就指數級增加。?


顯卡難求,務必事先與用戶溝通。? ?


數據有了嗎?


我們所有項目,內部討論時的第一個問題一定是:這項目有數據嗎?


技術人員復現論文的時候,往往會有現成的數據集,清洗過的數據。一旦開始做工程化,取得數據集和數據集預處理才是最耗費時間的環節。我們接過很多項目,所有商務細節都談好了,項目啟動后,技術人員才發現客戶沒數據,或者數據不夠。


數據有了,你......能看懂嗎?


接著上一個問題,對于絕大部分計算機視覺項目來說,客戶的數據我們真不一定能看懂。比如醫療影像,數據標注是醫生都需要經過多年培訓才能做好的事情,沒有任何醫療背景的程序員很難在短時間內看懂這些數據。年初的時候我們給某工廠做缺陷識別,用什么網絡什么部署模式都想好了,結果就是看不懂圖片不能做標注。我們看所有地方都像是壞了,但工廠的質檢員就能一眼分辨出來正常和缺陷。這種行業的 know how 很重要。


?心臟造影圖,非醫務人員很難看出圖中哪些是對診斷有幫助的血管


你了解對方的預期嗎?


由于近年來媒體對人工智能行業夸大其詞的報道,給大家造成了一種印象「人工智能是萬能的」。用戶與技術人員的信息不對稱性就導致了對項目不同的預期。面對完全沒接觸過人工智能的用戶,要確保用戶明白以下幾點:


1. 只保證測試集的準確率,但不能保證這個準確率在任何跟訓練數據相差非常遠的情況下,還能復現;


2. 機器學習項目不能做到 100% 的準確率;


3. 訓練需要時間,不像是買個 Microsoft Office 下載就能用。


最后,工程化最煩的一點是,我們要給客戶做特別多的 demo。任何一個需求都需要先給他們做個 demo 看看。這些 demo 太浪費時間了,但又不能不做。所以我們為了節省每個計算機視覺項目的時間,制作了 TeguCV——一款可視化計算機視覺以及神經網絡工具。


TeguCV 支持 Windows,純本地運行,目前支持圖像識別、視頻分類、人臉比對和車牌識別,同時包含自動參數選擇、http server 等功能。十分鐘開始訓練計算機視覺模型。很多簡單工作,直接用 TeguCV 就能實現。方便開發者快速做技術落地,而且可以把很多簡單工作剝離出來。


?TeguCV軟件截圖


比如點擊閱讀原文,就可以看到我們如何用半小時內的時間,為無人機航拍圖像做識別。


掃描下方二維碼添加客服可以獲得 TeguCV 免費下載鏈接。




?


現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧



關于PaperWeekly


PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。


▽ 點擊 |?閱讀原文?| 查看案例分享

總結

以上是生活随笔為你收集整理的论文落地 101:算法工程化的那些坑的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。