带有下标的赋值维度不匹配_KDD 2019|?结构感知的神经网络对人才-组织匹配的影响...
你和“懂AI”之間,只差了一篇論文
很多讀者給芯君后臺留言,說看多了相對簡單的AI科普和AI方法論,想看點有深度、有厚度、有眼界……以及重口味的專業論文。
為此,在多位AI領域的專家學者的幫助下,我們解讀翻譯了一組頂會論文。每一篇論文翻譯校對完成,芯君和編輯部的老師們都會一起笑到崩潰,當然有的論文我們看得抱頭痛哭。
同學們現在看不看得懂沒關系,但芯君敢保證,你終有一天會因此愛上一個AI的新世界。
讀芯術讀者論文交流群,請加小編微信號:zhizhizhuji。等你。
這是讀芯術解讀的第143篇論文
KDD 2019 Research Track Paper
人才-組織匹配在人才管理中的影響:一種結構感知的神經網絡方法
The Impact of Person-Organization Fit on Talent Management: A Structure-Aware Convolutional Neural Network Approach
中國科學院計算技術研究所,百度
本文是中國科學院計算技術研究所和百度TIC聯合發表于KDD 2019的工作,文章提出了一種數據驅動的神經網絡模型來建模人和組織間的適配性及它與人才管理中兩個關鍵問題——離職和工作表現的關系。為此,我們首先設計了一種組織結構感知的卷積神經網絡來抽取組織環境特征,進一步地,我們使用帶有注意力機制的循環神經網絡來建模人-組織匹配的動態特性。實驗結果表明我們的模型能有效提高離職預測和績效預測的效果。
原文:
Ying Sun, Fuzhen Zhuang, Hengshu Zhu, XinSong, Qing He, Hui Xiong, The Impact of Person-Organization Fit on TalentManagement: A Structure-Aware Convolutional Neural Network Approach, InProceedings of the 25th ACM SIGKDD International Conference on KnowledgeDiscovery and Data Mining (KDD-2019) , Anchorage, Alaska, 2019
1 引言
在當今競爭激烈、瞬息萬變的商業環境中,如何有效地吸引和選拔合適的人才來從事合適的工作,成為現代企業面臨的一個重要挑戰。因此,人-組織匹配的研究成為組織行為學和人才分析領域的一個重要研究方向。人-組織匹配是指員工與其組織之間的相容性,根據吸引-選擇-損耗(A-S-A)理論,組織在選擇過程中傾向于雇傭具有相似價值觀的人,而個人也會相應地被具有相似文化的組織所吸引。事實上,人-組織匹配被廣泛認為是人才管理的一個有效指標,它對工作態度、離職傾向和工作績效等結果有顯著影響,例如一個較好的人-組織匹配通常意味著較高組織承諾和較低的人才流失率,反之亦然。
傳統組織行為學研究中,雖然已經有大量工作嘗試理解人-組織匹配,并且產生了許多有趣的發現,例如根據大五人格理論,高宜人性的人通常更適合于支持性的組織氛圍。但這些研究大多嚴重依賴于問卷調查以及經典的數學統計模型,這些方法有很好的理論基礎,能夠揭示一些規律,但也帶來了應用層面的局限性。首先,問卷調查中使用的指標通常是主觀設計的,不能客觀、自動地捕捉到人才與組織的相容性特征。其次,由于人和組織的動態特性,人-組織匹配總是隨時間而變化,傳統的調查方式由于成本高昂,很難時序地跟蹤這種變化。第三,由于現實世界的管理場景非常復雜,利用調查數據盡管可以發現相關關系,但仍舊難以定量地建模人-組織匹配及其對人才管理的影響。
幸運的是,大數據時代的到來給人才管理提供了大量的人才數據,這為管理提供了前所未有的機會。這些數據可以幫助我們以動態、定量和客觀的方式了解人才和組織行為,并獲得有關人-組織匹配的有形知識。
為此,我們提出一種新的數據驅動的解決方案,名為人-組織匹配神經網絡來動態建模人-組織匹配以及它與人才管理中離職意向和工作績效的關系。具體來說,受實際管理場景的啟發,我們首先創造性地設計了一種組織結構感知的卷積神經網絡來層級地抽取組織環境特征,以替代傳統工作中手動設計指標來對組織進行畫像的過程。進一步地,為了捕捉人-組織匹配的動態特性,我們設計了一種帶有注意力機制的循環神經網絡來建模時序的人-組織匹配信息。最后,我們在實際人才數據上將我們的模型與一系列基線模型相比較,實驗結果證明我們的模型在離職預測和績效預測上的有效性。
2 模型
2.1 問題建模
本工作旨在通過分析組織環境與員工之間的潛在關系,對人-組織匹配進行動態建模,并探討其在人才管理中的應用。給定一個組織樹,上面每個節點表示一個員工,節點的父節點表示員工的上司,我們定義了一個鄰接矩陣
來表示它的結構,其中,
指示節點i的父節點,如果其父節點為節點j,則
等于1,否則等于0。同時,組織中的每個員工都有一個特征向量,我們將組織的特征矩陣定義為
,其中
表示員工的特征向量,
是特征向量的維數。由于組織的結構和其中員工的特征將隨著時間的推移而改變,我們定義了兩個長度為
的序列數據,分別寫作
和
,其中
和
分別表示在時間t處的特征矩陣和鄰接矩陣。
到目前為止,我們可以將本研究的問題表述為從歷史數據
和
中學習一個模型來預測未來的人才管理結果。具體來說,訓練集中每個樣本在時間t上可以表示為
,其中
是目標員工的指示向量。模型的目標是預測分類標簽y,如是否離職。
2.2 數據驅動的人-組織匹配
一種傳統人-組織匹配
在組織行為學理論中,當員工及其組織的特征都很適合時,就產生了良好的人-組織匹配,早在1989年,組織行為學家就提出了使用人的特性和組織特性來進行比較以進行人-組織匹配的研究框架。工作首先通過問卷調查的方式收集數據,測量由專家手工設計的一些指標,表示人和組織的特性,然后使用統計方法來衡量這些特性之間的相似程度,獲得人-組織匹配的評估分數。然而這個過程需要大量人工操作,且每個設計的指標都需要提前進行大量的統計學研究,成本高昂且僅能覆蓋有限信息,很難將其應用到實際應用中,除此之外,這種方法評估得出的人-組織匹配得分僅能提供啟發式指導,而不能給出人才管理中的定量預測。
數據驅動的人-組織匹配
如果能夠從數據中自動提取人和組織的特征,并用機器學習方法自動學習人-組織匹配模型及相應的預測模型,那么將極大節省這個過程中的人力,并能提高預測的準確度,達到人才管理的高度自動化。因此,我們提出一種數據驅動的人-組織匹配模型,從員工的工作數據中提取員工特征和組織特征并進行人-組織匹配模型。具體來說,首先使用特征工程從員工的工作數據中提取一些特征,進行簡單的降維處理作為人物畫像。由于員工在組織中受局部組織結構(比如所處團隊)影響更大,而局部組織特征難以從工作數據中直接提取,我們不直接度量組織畫像,而是從含有員工特征的組織結構樹上提取組織特征。特別地,從員工的角度來看,他們所在的組織環境通常受到更親近的同事的影響,因此我們根據每個員工在組織樹上的位置,從周圍員工中為每個員工提取一個獨特的組織環境特征,因為如果一個組織中的兩個員工在組織樹上距離較遠,他們之間的相互影響可能很小。最后,我們用非線性模型來實現一個更復雜的映射以獲取人-組織匹配表征向量,而非使用簡單的統計方法來獲得人-組織匹配得分。使用分類或回歸模型,我們可以使用這個表征向量來預測人才管理的結果。由于這種方法可以建模人-組織匹配的更多潛在表征,且能定量建模復雜映射,因此可以獲得更好的預測性能。
2.3 人-組織匹配神經網絡(POFNN)
基于我們提出的數據驅動的人-組織匹配框架,我們提出一種神經網絡模型POFNN來進行人-組織匹配建模,由于人-組織匹配的動態特性,我們在每個時間段t,從特征矩陣
和組織樹的鄰接矩陣
中提取人-組織匹配表征向量,然后采用循環神經網絡結構進行序列數據的建模,網絡結構如圖所示。
人-組織匹配神經網絡示意圖
具體而言,首先使用全連接層對輸入特征向量進行降維,提取出員工們的畫像
,其中第i列可以表示為
,
和
是參數,
表示激活函數。然后我們提出一種組織結構感知的卷積神經網絡(OSCN),用于從組織結構和員工畫像中提取環境表征,寫作
,此時每個員工都獲得了各自的環境表征向量,因此
,OSCN的具體結構將在下一小節討論。此時我們獲得了整個組織所有員工的環境表征的個人表征,對于一個要預測的目標員工,我們用指示向量
選擇他的表征,分別寫作
和
。然后用由數個全連接層組成的深度神經網絡(DNN)對這兩個特征作非線性的映射,結合為人-組織匹配表征向量,寫作
,其中,
表示將兩個維度分別為d1和d2的向量連接起來形成一個維度d1+d2的向量。
在每個時間段,人-組織匹配網絡獲取了一個人-組織匹配的表征,最終形成一個序列
,使用長短期記憶網絡(LSTM)來處理這個序列。LSTM結合歷史信息和當前的人-組織匹配表征,得到每個時間段的狀態表征,寫作
。考慮到不同時間段對結果的影響程度不同,比如某個月內突然發生的組織變革可能會引發員工的不適應進而產生離職意向,我們使用注意機制來捕捉各個時間段的影響。
注意力層以最后一個時間段的狀態
作為查詢,其他時間段的狀態作為鍵,用他們計算每個歷史時間段的重要性,然后求得歷史狀態的加權平均值,即
其中
和
是參數。輸出
表示歷史人-組織匹配的整體狀態,我們將它與最后一個人-組織匹配狀態做連接,用一個全連接層映射后用sigmoid函數預測二分類結果,寫作
2.4 組織結構感知的卷積神經網絡(OSCN)
即使在同一組織內,組織樹上不同位置員工可能有著不同的組織環境。因此,我們提出一種網絡結構,從組織樹上局部的組織結構和員工特征中提取相應員工的組織環境信息。而由于員工們局部環境受彼此的影響存在一定模式,這啟發我們使用卷積網絡抽取環境信息。
局部結構變換示意圖
我們設計了組織結構感知的卷積神經網絡(OSCN)來提取員工的組織環境信息,在OSCN中,卷積可以將不同工作關系區別對待。與經典的卷積網絡相似,OSCN的主要思想是參數共享,每個節點在核函數中的參數取決于它與目標的關系。在本工作中,以一名員工為中心,我們假設他的上司、下屬和同事對他局部的組織環境產生直接影響,那么理想情況下,核函數可以表示為
其中
表示可訓練的參數,
表示對應關系同事的特征向量。然而,與傳統面向格子狀數據的卷積網絡不同,OSCN的核函數不能被簡單地構造成矩陣形式,因為組織樹相對圖像、文本等數據有著更不規則的結構。由于每個員工的下屬和同事數量可能不同,設計一種適用于組織樹上所有位置都適用的核函數成為OSCN最大的挑戰。為了解決這一問題,在對一個員工做卷積時,我們聚合所有與他有相同關系的員工。具體來說,OSCN假設一個員工的所有下屬對他都有類似的影響,然后通過計算他們的均值和方差來聚合他們。圖中給出了一個例子,其中節點A和節點B具有不同的局部組織結構,但是在聚合過程之后,它們被轉換為相同的結構,包含一個上司節點、一個聚合的下屬節點和一個聚合的同事節點,OSCN在這個結構上進行卷積操作。為了簡單起見,這里我們使用
表示OSCN層的輸入特征矩陣,使用
來表示鄰接矩陣。
具體來說,每個員工的下屬的均值可以計算為
每個員工同事的均值可以計算為
其中
和
都是所有元素為1的向量,1表示單位矩陣。
每個員工下屬的標準差可以計算為
每個員工同事的標準差可以計算為
其中
和
都是元素級操作。然后OSCN使用一個全連接層將標準差和均值聚合得到新的特征向量
然后我們應用卷積,得到輸出為
它的每一列為對應員工的環境特征向量。
最后,POFNN堆疊數個OSCN層,并使用前一層的輸出作為下一層的輸入。第一個輸出包含來自同事、下屬和上級的環境信息,而較深層的輸出則包含來自更廣泛范圍組織成員的信息,例如來自上級的上級、上級的同事等,我們拼接所有層的輸出作為環境特征向量,如圖所示。
OSCN連接示意圖
3 實驗
我們在實驗中關注人才管理的兩個關鍵問題:離職和績效。 在離職預測中,我們預測員工將來是否會離開公司。 在績效預測中,我們預測員工的全年績效評級。我們將每個月視為一個時間間隔,并在每個月提取每個員工的特征,例如職級、與上級的通信頻率等,同時我們從員工月末的匯報關系中提取組織樹。在離職預測中,我們在每個月篩選了接下來兩個月內離職的員工作為正樣本,其他一些員工則作為負樣本。由于數據分布極不平衡,我們按照正負樣本比例1:2進行采樣,并對每個員工使用十個月的觀測數據來預測未來兩個月的離職行為。在績效預測中,我們隨機選擇了一些參與了年度績效考核的員工,他們的績效可以分為三個級別:績優,正常和績劣。我們使用每個員工對應年份前10個月的數據來預測全年績效。具體來說,我們制定了兩個二元分類任務,分別為績優預測和績劣預測。
我們通過交叉熵和曲線下面積(AUC)評估模型性能。交叉熵可以評估預測與實際標簽之間的差距,交叉熵越低,表明預測的分布更接近整體分布,表示更高的預測能力。AUC則是在不同閾值下評估分類性能,AUC值越高,表明整體預測性能越好。特別地,我們使用兩種AUC來評估模型性能,分別是ROC曲線下面積(ROC-AUC)和準確-召回曲線下面積(PR-AUC)。
我們設置了如下幾種基線模型與POFNN作比較:
1.經典分類模型。包括決策樹(DT),邏輯回歸(LR),隨機森林(RF)和支持向量機(SVM)。由于這些方法本身無法處理序列數據,因此我們將特征向量序列拼接起來作為輸入。
2.隱馬爾科夫模型。這是一個統計模型,它假設序列數據遵循具有隱藏狀態的馬爾可夫過程。
3.循環神經網絡。與POFNN類似,我們用DNN處理員工每個時間的特征向量,然后用帶有注意力機制的循環神經網絡進行處理,不同的是在這里我們不提取組織特征,而是直接用員工的特征向量進行預測。
離職預測表現評估
4.經典圖卷積網絡。為了保證公平性,我們使用圖卷積網絡替換OSCN作為組織特征抽取結構,并保持網絡其他部分不變,以證明OSCN的有效性。
我們使用基線模型和我們的模型在三個任務上進行實驗,分別是離職預測、績優預測和績劣預測。在離職預測任務上,可以發現基于神經網絡(NN)的模型優于經典模型,因為它們可以實現更復雜的建模,其中POFNN有最好的表現。另外可以看到對組織特征進行建模的GCN和POFNN優于僅使用員工特征的其他模型,表明人-組織匹配框架在離職預測任務上的有效性,而POFNN在此任務中優于GCN,表明OSCN更擅長從組織樹中提取環境特征。
績優預測表現評估
在績效預測上,POFNN在所有指標上均優于其他模型,這與離職預測的結果一致,表明POFNN是一種適應的模型,可以應用于人才管理中的各種應用。與POFNN不同的是GCN的表現幾乎與僅使用員工個人特征的RNN相同,再次表明OSCN相比GCN更適合于在組織結構樹上的進行環境特征的提取。
績劣預測表現評估
魯棒性評估
為了進行模型魯棒性的評估,我們按照三種不同的設置對訓練集構成進行了調整,分別是:1. 調整觀測的時間長度 2. 調整預測的時間長度 3. 調整正負樣本比例。
魯棒性評估
實驗結果如圖所示,可以觀察到,基于神經網絡的模型在所有設置下優于經典模型,并且POFNN表現最佳。同時,隨著觀察時間的延長,基于神經網絡的模型在離職預測上表現更好,而經典模型則表現更差。這說明基于神經網絡的模型能夠更好地建模時序的工作數據。而在績效預測任務上,較短的觀測時間足以支持最終結果的預測,因此基本模型在這種情況下也表現良好。另外隨著想要預測的時間邊長,所有模型的AUC表現都有不同程度的下降,但POFNN有著較小的下降幅度,顯示出其在長期預測上的優越性。在實際應用場景中,預測長期結果比預測短期結果要困難得多,例如當員工已經下定決定要在近期離開公司時,她的行為很可能已經明顯反映出其離職意向,例如與同事的溝通減少等,在這種情況下,僅考慮員工特征的模型也可以做出良好的預測。但是,短期預測對人力資源部門幫助較小,當預測出員工將要離職時可能已來不及做出補救措施。幸運的是,POFNN可以發現可能導致未來很長一段時間內離職行為的人-組織匹配模式,這對人才管理具有重要價值。
人-組織匹配序列的可視化
在我們的模型中,注意力層為每個時間段計算一個表示重要程度的權值,權值越大,表明這個時間段對最終預測結果影響越大。以離職預測為例,權值較大的時間段可能發生過組織變動,因而導致了員工的離職意向。為了研究人-組織匹配的動態影響,我們隨機選擇3000個離職員工并將他們在注意力層中每個月的權值畫在一張熱力圖上。其中x軸表示員工,y軸表示時間,由于在注意力層中我們只計算歷史時間段的權值,所以最后一個觀測月被用作查詢,所以圖中展示除觀測月外的9個月的權值。可以看出,小于等于7個月的歷史觀測月權值較高,這說明對兩個月的離職預測受七個月之內的人-組織匹配程度影響,也說明人-組織匹配會對離職傾向產生半年以上的長期影響。
4 結論
本文提出一種數據驅動的神經網絡模型來動態建模人-組織匹配及其對人才管理中離職和績效的影響,具體地,我們首先設計出一種組織結構感知的卷積神經網絡來層級地抽取組織環境特征,為了捕捉人-組織匹配的動態特征,我們又設計了一種帶有注意力機制的卷積神經網絡來建模時序的組織結構和人才特征。最后我們進行了一系列的實驗,使用現實場景的人才數據來對模型進行評估,實驗表明我們的模型在離職預測和績效預測上的有效性。
留言 點贊 關注
我們一起分享AI學習與發展的干貨
如需轉載,請后臺留言,遵守轉載規范
總結
以上是生活随笔為你收集整理的带有下标的赋值维度不匹配_KDD 2019|?结构感知的神经网络对人才-组织匹配的影响...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 工信部:2023 年 1-2 月全国多晶
- 下一篇: 如何防止通过url攻击_什么是XSS攻击