日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【机器学习】人工智能典型应用:班组工作日志转绩效类型

發布時間:2025/3/12 编程问答 14 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【机器学习】人工智能典型应用:班组工作日志转绩效类型 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

應用背景:

通信運檢一班績效的機制是利用每天的工作日志,將工作內容按照《一線班組工作積分制考核實施方案(20190108修訂)》中的工作基本額定標準庫進行對應,就可以知道每天的工分,每月工分相加就是每位員工的核心工作積分。部分工作日志如下圖所示。

其中最有價值的部分是工作內容這一列。平時班組的績效員根據自己的經驗將工作內容和《工作基本額定標準庫》進行人工一一對應,部分標準庫如下圖所示。

此人工過程相當費時費力,如果能用人工智能解決工作內容和工作基本額定標準庫的智能對應,將大大提升績效評定工作的效率。

數據集和標簽:

選取一班今年1月的數據進行實驗:

將數據人工打上標簽,標簽一定不能打錯,否則會影響模型最終的判斷。平時普通的人工方法其實就是人工打標簽的過程,此過程非常耗時,亟待優化。打好標簽的數據如下圖所示。

只需要建立深度學習模型將這個對應關系學習出來,就可以利用深度學習模型對沒有打標簽的日志表,自動打上標簽。以前1小時的工作量可以縮短為5分鐘(登陸人工智能平臺,上傳數據,運行,得到結果),大大提升績效評定工作的效率。

人工智能自然語言處理介紹:

自然語言處理的核心是通過編程設計讓系統模仿人的智能去處理各項工作,這是使得新時期的文本分類工作開始朝著自動化、智能化方向發展的關鍵。

從數學的角度來看,文本分類工作其實只不過是一個映射的過程。可以一對一的映射,把一些被表明類別的文本信息映射到現有的種類當中,完成分類工作。也可以一對多的映射,比如,有些文本當中既有這種類別的特征,也含有其他類別的分類特征,因此需要將同一個文本分別存放在不同的類別中。所以在文本分類中,可以看作是一個集合的值映射到一個矩陣上。將相同類別的文本劃入同一個矩陣當中,就完成了基礎的文本分類工作。

模型選擇:

本次項目選用的模型是百度PaddleHub中的ERNIE模型。

ERNIE通過建模海量數據中的詞、實體及實體關系,學習真實世界的語義知識。相較于BERT學習原始語言信號,ERNIE直接對先驗語義知識單元進行建模,增強了模型語義表示能力,以Transformer為網絡基本組件,以Masked Bi-Language Model和Next Sentence Prediction為訓練目標,通過預訓練得到通用語義表示,再結合簡單的輸出層,應用到下游的NLP任務,在多個任務上取得了SOTA的結果。其可用于文本分類、序列標注、閱讀理解等任務。預訓練數據集為百科類、資訊類、論壇對話類數據等中文語料。

啟動項目:

在ai studio中新建項目,上傳打好標簽的數據和沒打標簽需要預測的數據。

日志轉績效類型.xlsx中的數據如下圖所示。

預測.xlsx中的數據如下圖所示。

程序編寫:

導包:

import csv import paddle import pandas as pd import paddlehub as hub from paddlehub.datasets.base_nlp_dataset import InputExample,TextClassificationDataset

數據導入:

DATA_DIR = "./work" data = pd.read_excel("./work/日志轉績效類型.xlsx") data.to_csv("./work/train1.csv",index=None) test = pd.read_excel("./work/預測.xlsx") test.to_csv("./work/test1.csv",index=None)

模型建立:

classes = list(data.iloc[:,1].unique()) #把第二列的類型找出來,也就是最后要輸出的類別 model = hub.Module(name="ernie", task="seq-cls", num_classes = len(classes)) #ERNIE通過建模海量數據中的詞、實體及實體關系,學習真實世界的語義知識。 #task任務名稱,可為seq-cls文本分類任務 #num_classes:分類任務的類別數

數據加載:

class classifi(TextClassificationDataset):label_list = classesdef __init__(self, tokenizer, max_seq_len: int = 128, mode: str = "train"):if mode == "train":data_file = "train1.csv"elif mode == "test":data_file = "test1.csv"else:data_file = "dev.csv"super().__init__(base_path=DATA_DIR,data_file=data_file,tokenizer=tokenizer, max_seq_len=max_seq_len, mode=mode,is_file_with_header=True,label_list=self.label_list)def _read_file(self, input_file, is_file_with_header: bool = False) :with open(input_file,'r',encoding='UTF-8') as f:examples = []seq_id =0reader = csv.reader(f,delimiter = ',')header = next(reader) if is_file_with_header else Nonefor line in reader:example = InputExample(guid=seq_id, text_a=line[0],label=line[1])seq_id += 1examples.append(example)return examplestrain_dataset = classifi(model.get_tokenizer(),mode = 'train',max_seq_len=128)

選擇優化器和運行配置:

optimizer = paddle.optimizer.Adam(parameters=model.parameters(),learning_rate=1e-5) trainer = hub.Trainer(model,optimizer=optimizer,checkpoint_dir='./check_point',use_gpu=True)

模型訓練:

trainer.train(train_dataset,epochs=20,batch_size=10,save_interval=4)

acc即是accuracy準確度,準確度高達96%,沒到100%的原因是訓練的數據集不夠大,模型還沒有看完所有的情況。也就是只要他見過的類似題他就一定解得出,沒過類似題的,就有小概率會解錯。

模型預測:

#預測 label_map = {idx:label for idx,label in enumerate(classifi.label_list)} data = pd.read_csv("./work/test1.csv",delimiter=',',header=None) data.columns = ['預測輸入']#得到預測數據中的字符串組成列表 text = [[i[0]] for i in data.values ]#讀取模型 model_train = hub.Module(name="ernie", task="seq-cls",load_checkpoint = "./check_point/epoch_20/model.pdparams",label_map = label_map)result=model_train.predict(text,max_seq_len = 128, batch_size=1,use_gpu = True) #data:待預測數據 #max_seq_len:模型處理文本的最大長度 #batch_size:模型批處理大小 #use_gpu:是否使用gpu,默認為False。對于GPU用戶,建議開啟use_gpudata['預測結果'] = result data.to_csv("a.csv",index = None,sep = ',')

在生成的a.csv中即可得到利用模型去預測的結果。

本次實驗結果如下圖所示:

肉眼可見準確率近乎100%,想要達到完全100%的效果只需要找出預測錯誤的項,將正確的標簽加入日志轉績效類型.xlsx文件重新訓練模型,即可達到準確率100%效果。

項目總結:

在平時工作中,文本分類的場景非常普遍,只要大家善于發現場景,重視數據的收集和提煉,再結合人工智能技術,就可以達到事半功倍的效果,效率呈幾何級增長。

希望各位同事留意梳理應用場景,提升數據收集處理意識。

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件

本站qq群554839127,加入微信群請掃碼:

總結

以上是生活随笔為你收集整理的【机器学习】人工智能典型应用:班组工作日志转绩效类型的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 麻豆极品| 中文字幕在线欧美 | 成人高清免费 | 国产在线999 | 天天操狠狠操 | 国产美女一区二区 | 国产日本精品视频 | 91porny丨首页入口在线 | 国产乱码精品一品二品 | wwwxxxxx日本| 性欧美4khd高清极品 | 日本爽爽爽爽爽爽在线观看免 | 成年人网站免费观看 | 福利社午夜影院 | 国产一区二区视频在线观看免费 | 一本色道久久综合无码人妻 | 在线免费观看国产精品 | 免费看片网站91 | 91自啪| 日韩欧美高清视频 | 国产精品色婷婷 | 国产一区视频免费观看 | 韩国美女被c | 69精品丰满人妻无码视频a片 | 欧美一区二区三区爽爽爽 | 午夜小影院| 99这里只有精品视频 | 三级黄毛片 | 亚洲欧美中文日韩在线v日本 | 久久久黄色大片 | 草逼视频网站 | 亚洲一区二区福利视频 | 关之琳三级做爰 | 欧美成人片在线观看 | 啪网站| 中文字幕国产亚洲 | 欧美日a | 亚洲久久在线 | 国产精品国色综合久久 | 色小姐在线视频 | 波多野结衣不卡视频 | 欧美黑人性生活 | 自拍偷拍亚洲综合 | 98av视频| 亚洲午夜久久久久久久久久久 | 欧美在线播放一区 | 岛国av电影在线观看 | 免费在线国产 | 按摩ⅹxxx性hd中国 | 国产精品国产三级国产三级人妇 | 中文字幕在线观看免费高清 | 国产999在线观看 | 国产精品第四页 | 久久午夜视频 | 福利在线看 | 99精品一区二区三区无码吞精 | 亚洲精品国产乱伦 | 888奇米影视 | 大陆明星乱淫(高h)小说 | 德国性经典xxxx性hd | va婷婷在线免费观看 | 看毛片的网址 | 欧美性猛交xxx乱久交 | 在线播放av片| 色视频在线观看免费 | av中文资源 | 黄页视频在线免费观看 | 精品少妇久久久久久888优播 | 精品不卡在线 | 天堂av中文| 中国人妖和人妖做爰 | 色综合狠狠操 | 国产情侣91| 色婷婷777 | 村上凉子av | 午夜影院在线播放 | 免费黄色国产 | 欧美不卡高清 | 欧美裸体按摩 | 69人人| 日韩 欧美 综合 | 综合激情视频 | 国产91视频在线观看 | 亚洲精品一区二区三区蜜桃久 | 国产噜噜噜噜噜久久久久久久久 | 亚洲不卡视频在线 | 国产麻豆91视频 | 中文字幕午夜 | 日美av | 天堂在线日本 | av网站在线免费播放 | 亚洲网址在线观看 | 国产77777 | 任我爽在线 | 色av色 | 免费视频一区二区 | 久久亚洲精选 | 久热在线| 性爱视频日本 |