日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

labelme标注需要精确标注吗_国内需要一个数据标注平台

發布時間:2025/4/16 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 labelme标注需要精确标注吗_国内需要一个数据标注平台 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、數據團隊業務的痛點

過去一年中,我加入美圖數據團隊,雖然我的職位是開發,但平時也主動和leader以及同事聊到目前數據上的業務流程。先來說說美圖公司的數據業務吧。

1、數據業務

即然是業務,就有甲方與乙方。乙方為甲方服務。數據業務中,算法人員是甲方,算法同學在做AI相關的工作,跑模型需要數據,此時就會向數據團隊提出需求,eg:需要1w張嬰兒的圖片。提到任務后數據團隊的工作可分為三部分

  • 數據采集:主要使用python等網絡爬蟲技術
  • 數據管理:數據集的管理,包括采集完的數據,標注過濾好的數據
  • 數據標注:以外包模式將標注任務分配出去

數據團隊業務

2、數據業務的痛點

數據業務腦圖
  • 數據集管理瑣碎:目前對采集完、標注完的數據都是以目錄+文件形式保存在鏡像服務器中。當數據團隊接手項目多時,需要花較長時間找到對應數據集
  • 數據標注工具多樣,學習成本高:目前團隊有超過十種標注工具(由Windows平臺部進行開必),工具運行在Windows系統。工具過多,而且工具的用戶體驗不好(工具界面類似下圖Windows標注工具)。工具的學習成本挺高,和同事交流,像人臉點的標注,一般需要3~5才能熟練掌握。
  • 數據標注任務分配過于封閉。目前任務的分配是通過QQ、微信下發給外包組長,包括時間點,任務量(內部需求如圖2.2)。缺點QQ、微信下發task具有封閉性,團隊其它成員無法快速了解標注任務目前的進度。
  • 算法產品需求文檔要不明確導致溝通成本加大。內部需求文檔如圖2.3. 目前的流程是算法把需求文檔給數據團隊,數據團隊再將需求下發給外包leader。中間經過兩層溝通,一旦算法同學給的需求標準不明確,出現歧義,出現的隱性的溝通成本是巨大的。

Windows標注工具

對接外包下發任務

算法需求標準

3、針對痛點的解決方案

我們希望有一個數據標注平臺的產品,來解決團隊業務上的痛點,提高工作效率。該產品主要的功能模塊如圖所示。

數據標注平臺功能模塊
  • 為了方便數據管理,希望拋棄舊的‘本地保存數據’模式,而是將數據保存到數據庫。直接在產品進行增刪改查等業務操作。
  • 產品具有多種標注方式,只需在工具欄切換即可(目前業務有畫點、框、polyline、polygon、bitmap、固定點數的keypoints等)
  • 數據團隊成員在給外包分配任務時,同團隊的成員應是類似Admin權限,如看到所有的task流當前進度。外包leader、外包成員應只能看到一部分數據集(即數據團隊分配的數據集)。需將權限分清,更深入權限系統還需后繼進行競品分析。
  • 為了減少溝通成本,可以考慮添加實時溝通系統。類似墨刀,如圖

實時溝通模塊

二、確定目標用戶

1、用戶類別

以當前團隊的業務來看,產品的用戶可大致分為三類:

目標用戶分類

2、需求調研

騰訊問卷:https://wj.qq.com/s2/3035254/b82a/

3、競品分析

前程明亮:數據標注平臺—競品分析?zhuanlan.zhihu.com

總結

以上是生活随笔為你收集整理的labelme标注需要精确标注吗_国内需要一个数据标注平台的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。