日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

labelme标注需要精确标注吗_国内需要一个数据标注平台

發(fā)布時間:2025/4/16 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 labelme标注需要精确标注吗_国内需要一个数据标注平台 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、數據團隊業(yè)務的痛點

過去一年中,我加入美圖數據團隊,雖然我的職位是開發(fā),但平時也主動和leader以及同事聊到目前數據上的業(yè)務流程。先來說說美圖公司的數據業(yè)務吧。

1、數據業(yè)務

即然是業(yè)務,就有甲方與乙方。乙方為甲方服務。數據業(yè)務中,算法人員是甲方,算法同學在做AI相關的工作,跑模型需要數據,此時就會向數據團隊提出需求,eg:需要1w張嬰兒的圖片。提到任務后數據團隊的工作可分為三部分

  • 數據采集:主要使用python等網絡爬蟲技術
  • 數據管理:數據集的管理,包括采集完的數據,標注過濾好的數據
  • 數據標注:以外包模式將標注任務分配出去

數據團隊業(yè)務

2、數據業(yè)務的痛點

數據業(yè)務腦圖
  • 數據集管理瑣碎:目前對采集完、標注完的數據都是以目錄+文件形式保存在鏡像服務器中。當數據團隊接手項目多時,需要花較長時間找到對應數據集
  • 數據標注工具多樣,學習成本高:目前團隊有超過十種標注工具(由Windows平臺部進行開必),工具運行在Windows系統(tǒng)。工具過多,而且工具的用戶體驗不好(工具界面類似下圖Windows標注工具)。工具的學習成本挺高,和同事交流,像人臉點的標注,一般需要3~5才能熟練掌握。
  • 數據標注任務分配過于封閉。目前任務的分配是通過QQ、微信下發(fā)給外包組長,包括時間點,任務量(內部需求如圖2.2)。缺點QQ、微信下發(fā)task具有封閉性,團隊其它成員無法快速了解標注任務目前的進度。
  • 算法產品需求文檔要不明確導致溝通成本加大。內部需求文檔如圖2.3. 目前的流程是算法把需求文檔給數據團隊,數據團隊再將需求下發(fā)給外包leader。中間經過兩層溝通,一旦算法同學給的需求標準不明確,出現歧義,出現的隱性的溝通成本是巨大的。

Windows標注工具

對接外包下發(fā)任務

算法需求標準

3、針對痛點的解決方案

我們希望有一個數據標注平臺的產品,來解決團隊業(yè)務上的痛點,提高工作效率。該產品主要的功能模塊如圖所示。

數據標注平臺功能模塊
  • 為了方便數據管理,希望拋棄舊的‘本地保存數據’模式,而是將數據保存到數據庫。直接在產品進行增刪改查等業(yè)務操作。
  • 產品具有多種標注方式,只需在工具欄切換即可(目前業(yè)務有畫點、框、polyline、polygon、bitmap、固定點數的keypoints等)
  • 數據團隊成員在給外包分配任務時,同團隊的成員應是類似Admin權限,如看到所有的task流當前進度。外包leader、外包成員應只能看到一部分數據集(即數據團隊分配的數據集)。需將權限分清,更深入權限系統(tǒng)還需后繼進行競品分析。
  • 為了減少溝通成本,可以考慮添加實時溝通系統(tǒng)。類似墨刀,如圖

實時溝通模塊

二、確定目標用戶

1、用戶類別

以當前團隊的業(yè)務來看,產品的用戶可大致分為三類:

目標用戶分類

2、需求調研

騰訊問卷:https://wj.qq.com/s2/3035254/b82a/

3、競品分析

前程明亮:數據標注平臺—競品分析?zhuanlan.zhihu.com

總結

以上是生活随笔為你收集整理的labelme标注需要精确标注吗_国内需要一个数据标注平台的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。