Label Studio 入门
概述
Label Studio是一個獨立的Web應用程序,用于多類型數據標記和探索。
后端是用純Python編寫的,由Django提供支持。
前端部分是一個與后端無關的React+MST應用程序,包括在一個預編譯腳本中。
以下是Label Studio工作流背后的主要概念:
- Tasks表示單個數據集項。
Label Studio是一個多類型的標簽工具-您可以導入文本、圖像、音頻URL、HTML文本或這些數據資源的任意數量和組合。 - Completions是JSON格式的標記結果。
它們可以以各種通用格式導出,隨時可以在機器學習管道中使用。 - Predictions是具有相同格式的可選標記結果,但與完成不同,它們用于在注釋過程中生成預標記,或驗證模型預測。
- Machine learning backend將流行的機器學習框架連接到Label Studio,以便動態學習和生成模型預測。
- Labeling-config是一個簡單的XML樹,帶有標記,用于配置UI元素,連接輸入數據和輸出標簽方案。
- Project包含任務、配置、預測和完成在一個獨立的目錄中。
- Frontend Labeling UI可以從任何瀏覽器訪問,以預編譯的js/css腳本的形式發布,并且可以通過新的標簽標簽輕松擴展。
您還可以將Label Studio用戶界面嵌入到應用程序中。
快速啟動
先決條件
在Linux、Windows和MacOSX上運行的Python 3.5或更高版本支持Label Studio。
注意:對于Windows用戶,默認安裝可能無法構建lxml包。
考慮從非官方的Windows二進制文件中手動安裝它。
如果您在x64上運行python3.8,請運行pip install lxml?4.5.0?cp38?cp38?win_amd64.whl。
使用 pip 運行
要通過pip安裝Label Studio,需要Python>=3.5并運行:
pip install label-studio然后啟動一個新項目,該項目將所有標簽數據存儲在本地目錄my_labeling_項目中:
label-studio start my_labeling_project --init默認瀏覽器在自動打開http://localhost:8080/。
通過 Docker 運行
Label Studio也作為docker容器分發。
確保您的本地計算機上安裝了Docker。
安裝并啟動Label Studio在http://localhost:8080,將所有標簽數據存儲在./my_labeling_項目目錄中:
docker run --rm -p 8080:8080 -v `pwd`/my_labeling_project:/label-studio/my_labeling_project --name label-studio heartexlabs/label-studio:latest注意:如果./my_labeling_project文件夾存在,將引發異常。
請刪除此文件夾或使用–force選項。
注意:對于Windows,您必須修改由-v選項設置的卷路徑
您可以通過附加任何可用的命令行參數來重寫默認啟動命令:
docker run -p 8080:8080 -v `pwd`/my_project:/label-studio/my_project --name label-studio heartexlabs/label-studio:latest label-studio start my_project --init --force --template image_mixedlabel如果要生成本地映像,請運行:
docker build -t heartexlabs/label-studio:latest .通過源碼運行
如果要使用夜間構建或擴展功能,請考慮使用Git下載源代碼并在本地運行Label Studio:
git clone https://github.com/heartexlabs/label-studio.git cd label-studio python setup.py develop然后創建一個新的項目,它將所有標簽數據存儲在本地目錄my_labeling_project中:
label-studio start my_labeling_project --init默認瀏覽器將在自動打開http://localhost:8080。
多會話模式
您可以在多會話模式下啟動Label Studio-每個瀏覽器 session 都創建自己的項目,并將關聯的 session ID作為名稱。
要以多會話模式啟動Label Studio并將所有項目保留在單獨的目錄會話項目中,請運行
label-studio start-multi-session --root-dir ./session_projects命令行參數
您可以通過命令行界面指定輸入任務、項目配置、機器學習后端和其他選項。
運行label-studio start --help查看所有可用選項。
使用登錄名和密碼進行身份驗證
您可以使用基本HTTP身份驗證來限制對LS實例的訪問。
label-studio start my_labeling_project --username user --password pwd或者在項目的config.json中輸入用戶名和密碼。
{ ..."username": "user", "password": "pwd",... }所有用戶的用戶名和密碼都是相同的。
總結
以上是生活随笔為你收集整理的Label Studio 入门的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Flask-RESTful 快速入门
- 下一篇: 104. Maximum Depth o