lstm模型_基于LSTM模型的学生反馈文本学业情绪识别方法
| 全文共8155字,建議閱讀時長8分鐘 |
本文由《開放教育研究》授權發布
作者:馮翔?邱龍輝?郭曉然
摘要
分析學生學習過程產生的反饋文本,是發現其學業情緒的重要方式。傳統的學業情緒測量方法主要包括使用學業情緒測量問卷和訪談分析,但這兩種方法難以大規模地應用于在線教育環境。本研究旨在通過構建學業情緒自動預測模型,對大量學生反饋文本進行快速有效的學業情緒分類。研究首先利用詞向量訓練工具,將文本轉化為多維向量;然后基于深度學習網絡LSTM構建學業情緒預測模型,以文本的多維向量作為模型輸入;最后經過多輪訓練,優化模型參數。實驗顯示,上述模型可快速有效識別學生反饋文本中所包含的學業情緒,該模型在測試數據集上的學業情緒識別準確率可達89%。
關鍵詞:人工智能教育應用;學業情緒;LSTM;自然語言處理
在線學習平臺上記錄了大量基于文本的學生評論反饋,如何挖掘這些評論文本中隱含的有效信息,受到眾多研究者的關注。情緒分析是文本挖掘的重要研究方向,近年來已應用于眾多領域。與網絡輿論、商品評論等領域不同,學生評論中還隱藏了學業情緒,包含積極高喚醒、消極高喚醒、積極低喚醒、消極低喚醒四類學業情緒(Pekrun et al.,2011)。這些學業情緒影響著學生的身心健康、認知過程等(Ainley et al.,2005;Pekrun et al.,2002)。關注學生的學業情緒對學生的認知提升、身心健康的發展都有重要意義。傳統的學業情緒測量方法主要基于訪談和測量問卷,但由于規模限制,這種測量方法難以廣泛應用于實際教學。隨著人工智能技術的快速發展,采用機器學習的方法自動化、智能化地識別學業情緒是一種新的發展趨勢。本研究基于深度學習中的長短期記憶網絡(Long Short- Term Memory,簡稱LSTM)構建教育領域學業情緒識別模型,通過將LSTM模型與教育領域深度融合,快速發現學生反饋文本中的學業情緒類型,為自動化識別學業情緒提供一種新的手段和方法。
一、研究綜述
(一)學業情緒
學生在學習過程中能夠體會到不同的情緒,例如對一門課程或知識點掌握后的愉快感、考試過程中的焦慮感等。這些學習體驗與課堂教學、課外學習和學業成就有直接關系。2002年,德國心理學家佩克倫等(Pekrun et al.,2002)將學習過程所有環節中與學生學業學習活動體驗相關的各種情緒統稱為學業情緒。俞國良等人(2005)將學業情緒的范圍進一步擴大,認為它不僅包括學生在獲悉學業成功或失敗后所體驗到的各種情緒,還包括在課堂學習、日常完成作業過程中以及在考試期間的情緒體驗等。
學業情緒對學生成長的重要性不容忽視。美國教育研究聯合會在1998年召開了主題為“情緒在學生與學業成就中的關系”的年度學術會議,突出了情緒研究對學生與學業的重要性。佩克倫等(Pekrun et al.,2002)指出學業情緒與學業動機、興趣、意愿和努力等聯系密切。情感、情緒、態度等因素對問題解決能力也有重要影響(魏雪峰,2017)。諸多實證研究(王瑞紅,2009;俞國良,董妍,2005)表明,學業情緒在很大程度上能夠預測學生的學業成就。海亞特等人(Hayat et al.,2018)通過收集800名醫學院學生的學業情緒相關數據,發現積極的學業情緒(如希望、自豪等)與學業成績有顯著的正相關關系,享受、希望、驕傲和羞愧的學業情緒可以預測學生學業成績的差異。王瑞紅(2010)通過對398名高職院校的學生進行問卷調查和學業成績測量,發現學生學業情緒各量表分數與學業成績之間存在相關關系。
目前的研究大多關注學生面部表情所體現的學業情緒,如江波等(2018)基于在線教輔系統,提出種針對面部表情的困惑類學業情緒檢測方法,為智能教學系統中教學干預提供參考價值。然而,學業情緒不僅體現在面部表情,也體現在課程評論、交流討論文本等學習反饋文本中。對文本中學業情緒的挖掘,能夠為教師優化教學內容與課程設計提供指導方向,從而提高學生在線學習體驗,降低網絡學習的輟學率。
(二)學業情緒的分類
早期對學業情緒的研究主要集中在負面情緒,教師希望掌握學生在考試過程中所經歷的焦慮、學習過程中的學業倦怠。在學業情緒的分類上多數學者將其分為積極和消極兩個維度,如正性負性情緒自評量表(The Positive and Negative Affect Scale),但這種分類方法難以包含學生學習過程中經歷的所有情緒體驗。
佩克倫等(Pekrun et al.,2011)在學業情緒理論的基礎上,以愉悅度和喚醒水平為分類標準進行研究后發現,不同年齡段學生所經歷的學業情緒也會有細微差別。1993年,布萊恩·派崔克(Bian Patrick)及其研究團隊研究了兒童在學習活動中所經歷的學業情緒,發現積極情緒(興趣、高興、放松)、厭倦、痛苦和生氣四類情緒是學習活動中主要的情緒體驗(Patrick et al.,1993)。董妍等(2007)基于萊因哈德等人的研究,以青少年為研究對象,將學業情緒劃分為四個維度:積極高喚醒、積極低喚醒、消極高喚醒、消極低喚醒。其中,積極高喚醒包括自豪、高興、希望等情緒,積極低喚醒包括滿足、平靜、放松等情緒,消極高喚醒包括焦慮、羞愧、生氣等情緒,消極低喚醒包括厭倦、無助、沮喪、疲乏心煩等情緒。馬惠霞等(2010)也遵循佩克倫等人的學業情緒理論,將大學生學業情緒分為四個維度:積極高喚醒(興趣、愉快、希望)、積極低喚醒(自豪和放松)、消極高喚醒(羞愧、焦慮、氣憤)、消極低喚醒(失望和厭煩)。
筆者在構建學業情緒標注語料庫過程中,綜合青少年和大學生學業情緒的表現特點,將其分為四個維度,共15種學業情緒。其中,積極高喚醒學業情緒包含四種:高興、希望、興趣、自豪;積極低喚醒學業情緒包含三種:滿足、平靜、放松;消極高喚醒學業情緒包含三種:焦慮、羞愧、氣憤;消極低喚醒學業情緒包含五種:厭倦、無助、沮喪、疲乏、失望。后文構建學業情緒自動化分類的模型,也主要將學業情緒分為四個類別,即積極高喚醒、積極低喚醒、消極高喚醒、消極低喚醒。
(三)學業情緒的測量方法
早在2002年,佩克倫等編制了較完善的測量學業情緒的量表,該量表以九種基本學業情緒為測量目標。國內許多學者基于佩克倫等人的研究,針對不同學齡段,編制了不同的測量問卷。例如董妍等(2007)以中學生為主要群體編制了《青少年學業情緒問卷》,馬惠霞(2008)以大學生為主要對象編制了《大學生一般學業情緒量表》。戈瓦特和格雷戈爾(Govaerts & Gregoire,2008)在學生情緒問卷的基礎上編制了學業情緒量表。該量表包括26個條目,主要測量六種情緒:高興、希望、自豪、焦慮、羞愧和挫折。國內也有學者在英文版的學業情緒量表基礎上發布了大學生學業情緒量表的中文版(趙淑媛等,2012)。基于測量問卷和量表的學業情緒判斷方法需要耗費大量人力物力,難以大規模實施。隨著自然語言處理等技術的發展,自動化測量文本中的學業情緒成為可能。朱祖林等(2011)使用文本挖掘的方法,判斷文本中所包含的學業情緒。自動化識別方法能夠節省大量時間,為教師發現學生學業情緒并進行干預提供支持。
(四)情緒分析方法
情緒分析屬于情感分析的范疇,是對文本進行更細致的情緒分類,而不僅限于文本的情感傾向,如積極、消極或中性的情感。情緒自動化分類方法常用于Twitter微博、電影評論的分析(鄭嘯等,2018 Rajan,et al.,2014;Singh,et al.,2013)。情緒的自動化分析方法主要有基于情緒詞典資源和規則的分析方法及基于機器學習的方法。
1.基于情緒詞典的分析方法
情緒分析的無監督學習方法,主要包含基于詞典和基于規則的方法。這兩種方法基于語言學的思想,只需給定數據資源和設置語句的分析規則就能識別出句子的情緒。文本情緒集中體現于某些情緒詞中,如“這節課的知識點我已經掌握了,很開心”這句文本中,情緒主要體現在“開心”一詞中,使用基于詞典的方法能夠快速識別文本句子中所體現的情緒類別,且準確率非常高。有研究(Quan & Ren,2009)基于大量博客文本構建了情緒語料庫,語料庫中的詞匯包含八種情感類別:期望、喜悅、愛、驚喜、焦慮、悲傷、憤怒和憎恨。也有研究(Taboada et al.,2011)提出了一套更全面的算法和規則,將情感判斷對象從形容詞、副詞擴展到名詞、動詞等詞性,同時引入否定詞和強調詞等特征輔助判別文本的情感傾向,在眾多領域的情感分類語料上都取得較好的效果。
2.基于機器學習的分析方法
基于機器學習的方法,不依賴于情緒詞典的容量和質量,通過訓練情緒分類模型預測文本的情緒類別。支持向量機、貝葉斯網絡、K-最近鄰等機器學習算法常被用于自動檢測文本中的情緒。如李等人(Li,etal.,2014)使用支持向量機,識別出微博中的憤怒、厭惡、恐懼、快樂、悲傷和驚奇等情緒。
隨著深度學習的快速發展,越來越多的研究者基于多層感知機(Multiple Layer Perceptron)構造深度學習網絡,實現文本情緒分類任務。索赫等(Socher et al.,2013)使用遞歸神經網絡(Recursive Neutral Network,簡稱RNN)對文本中的情感信息進行建模,并取得了很好的分類效果。在以往的研究中(於雯,周武能,2018;鄭嘯等,2018),基于長短期記憶網絡的預測模型在其他領域取得了很好的效果,如微博短文本情感分析、電影評論分析、商品評論分析等。此外,卷積神經網絡(Convolutional Neural Network,簡稱CNN)近年來也應用于情感分析領域,有研究者(Santos & Gattit,2014)使用這一技術進行短文本情感分類,并取得顯著效果。
自動化識別文本中的學業情緒是未來發展趨勢,將情緒自動化識別方法應用于教育領域,能夠改善教育領域情緒識別方法的不足。
二、學業情緒自動化識別方法
(一)學業情緒自動識別框架
本文基于LSTM模型設計學業情緒自動化識別框架(見圖1)。這一框架包含數據的收集與處理、文本詞向量的訓練、LSTM模型的訓練、待判別的學生反饋文本的數據預處理、學業情緒判斷五個過程。
(二)數據的收集與處理
數據的收集與處理是后續過程的基礎。本文通過設計爬蟲程序獲取在線學習平臺中的學生反饋文本。數據的預處理階段主要有兩個步驟:第一,去除特殊字符與停用詞,減少實驗結果的影響;第二,構建標注語料庫。筆者通過設計語料標注系統對學生反饋文本所表達的學業情緒進行人工標注,每條已標注的學生反饋文本都以二元組的形式保存:。如標注文本‘今天聽了老師的課,有一種醍醐灌頂的感覺。把思路打開了,繼續好好練習,希望這次雅思考試能取得好成績。’的學業情緒為‘希望’,其保存形式為。
(三)訓練文本詞向量
神經網絡模型的輸入是一連串的多維特征。文本特征的表示方法有多種,其中比較著名的有獨熱碼(one-hot)表示方法,即將所有文本中的文字以一個高維度向量表示,向量的維度是文本詞表的大小,向量的絕大多數維度都是0,只有一個維度用1表示,這個用1表示的維度代表了當前詞。例如:
“教育”用獨熱碼(one-hot)方法表示為:
[000100···000]
但是使用獨熱碼(one-hot)的表示方法中,詞與詞之間是相互獨立的,難以判讀兩個詞匯之間是否具有上下文關系。
為了更好地利用詞向量表示上下文之間的關系,托馬斯·米科洛夫等(Mikoloy et al.,2013)提:出兩種詞向量訓練模型,連結詞袋模型(Continue Bag-of-worf,簡稱CBOW)和跳躍元語法模型(Skipg-ram)模型。
如圖2所示,兩種詞向量的訓練模型都包括三層:輸入層、隱藏層和輸出層。CBOW模型的主要工作是通過上下文預測當前詞出現的概率。Skipg-ram模型則相反,是利用當前詞預測上下文。熊富林等(2015)將Word2vec應用于中文處理,發現Skip-gram模型訓練的準確率明顯比CBOW模型高,且詞向量的維度在250維左右為佳。因此,本研究采用skip-gram模型對學生反饋文本進行詞向量訓練,維度設置為250維。
(四)LSTM模型
長短期記憶網絡(Long short- Term Memory,簡稱LSTM)是一種基于序列的鏈式網絡結構,LSTM模型解決了循環神經網絡中梯度爆炸和梯度消失問題(Kolen & Kremer,2001)。經過眾多研究者的優化(Graves,2012),LSTM模型在自然語言處理中取得了很好的效果,并得到了廣泛應用。LSTM模型將循環神經網絡中的神經元替換為擁有記憶能力的LSTM單元,根據輸入序列,所有的記憶單元被連接在一起。在本文中,每個記憶單元的輸入為學生反饋文本詞向量X,(見圖3)。記憶單元包含記憶細胞(Ct)、遺忘門(ft)、輸入門(it)、輸出門(ot),負責存儲歷史信息,通過一個狀態參數記錄和更新歷史信息;三個門結構則通過 Sigmoid函數[σ(*)決定信息的取舍,從而作用于記憶細胞。最后通過tanh函數[tanh(*)]對當前時刻的記憶細胞狀態進行計算,計算過程為公式(1)-公式(5)。
在時刻t,ht是隱藏狀態時,每個門結構會接收當前的輸入Xt,以及上一個記憶單元輸出的隱藏狀態h(t-1),并與其權重矩陣相乘,然后加上LSTM記憶單元中各自的偏置量。ωf、ωi、ωo、ωc分別為遺忘門、輸入門、輸出門、記憶單元的權重矩陣,bf、bi、bo、bc分別為遺忘門、輸入門、輸出門、記憶單元的偏置量。
(五)學業情緒的分類
為了得到文本的學業情緒分類結果,本研究將LSTM模型的輸出作為 softmax層(Softmax回歸模型)的輸入,通過 softmax函數,將輸入映射到(0,1)區間內,得到待分類數據歸屬各類別的概率,最后根據概率確定待分類文本的情緒預測類別。筆者將文本的4個學業情緒類別以形狀為1*4的矩陣表示,經過 softmax層之后,輸出結果矩陣得出每個類別的預測概率。預測結果的計算公式:
三、實驗
(一)數據集
騰訊課堂(https://ke.qq.com/)、網易云課堂(http://study.163.com/)等在線學習平臺吸引了眾多學習者。本文通過設計爬蟲程序,獲取了在線平臺中學生反饋文本10萬余條,總計超過1千萬中文字符。
實驗過程使用人工標注的方法,共隨機標注了8408條學生反饋文本,其中訓練文本為6658條,測試文本為1750條。訓練文本中各情感分布如圖4所示。
如圖4顯示,在學業情緒的訓練文本中,積極高喚醒和消極低喚醒的文本學業情緒占比97%。從學業情緒類別分布來看,大部分在線課程反饋文本中,學業情緒集中在積極高喚醒和消極低喚醒類別。
(二)詞向量訓練參數和LSTM實驗參數
教育領域詞向量的訓練過程經過多次參數的優化,通過迭代輸出訓練結果的方法,筆者選中了其中較優的參數結果。詞向量訓練過程中的具體參數設置為:向量長度 vector_size=250,窗口大小 window=7,神經網絡學習率 alpha=0.025,模型為Negative Sampling的Skip-gram模型,訓練的迭代次數為15。
本實驗使用雙層LSTM模型訓練學生評論文本,其模型參數的設置對實驗結果至關重要,經過多次實驗效果的對比,本實驗采用的參數設置為:學習率為learning_rate=0.005,LSTM的層數為2層,批處理條數batch_size=16,節點數num_nodes=128,訓練:的迭代次數 num_steps=5000輪。
(三)實驗結果與分析
本研究使用1750條人工標記的學業情緒文本對上述訓練模型進行測試。經過實驗,模型預測的準確率達到89%(見圖5)。
學業情緒預測結果歸一化后的混淆矩陣如圖6所示。在模型預測混淆矩陣中,積極高喚醒和消極低喚醒的預測準確度較高。這是由于該模型在訓練過程中,數據集中在積極高喚醒和消極低喚醒文本中,能夠較好識別此類文本所包含的學業情緒特征。經過人工標注數據顯示,文本集中在積極高喚醒情緒[‘興趣’,‘高興’]和消極低喚醒學業情緒[‘失望’]中,這兩類學業情緒文本數量在總標記數據中占97%,因此本實驗對積極和消極喚醒度的學業情緒識別準確率可達92.2%。
四、結論和未來工作
學業情緒檢測是分析學生學習狀況的重要方法。和人類的基本情緒一樣,學業情緒有多樣性和多維度性的特點,傳統方法難以很好地在文本中發現所隱含的學業情緒。本文基于深度學習的方法,使用LSTM網絡訓練模型對學業情緒進行預測。實驗表明,該模型識別文本中學業情緒的準確率達到89%。這種自動化的分類方法可以降低分析人員的工作強度,同時為優化課程教學設計、教學內容等提供重要參考維度。
本研究初步驗證了基于LSTM模型構建的學業情緒預測模型的效果,但本文所使用的數據集相對較小,且在實際學習環境中,在線學習平臺上的學業情緒分布差異較大,即使獲取數十萬條學生反饋文本,積極低喚醒和消極高喚醒兩類文本的占比仍然較低。后續研究首先需要擴大訓練的數據集,增加積極低喚醒和消極高喚醒兩類文本的數量,使用機器和人工相結合的在線學習方法快速收集和標注數據,以彌補教育訓練文本數據集的匱乏。其次,優化神經網絡參數可使學業情緒識別模型的準確率更高。不同領域的文本有著不同特點,在教育領域,訓練深度學習神經網絡的參數也會和其他領域(如商品評論等)有所不同。同時,神經網絡中有大量參數,如何優化這些參數得到更好的訓練模型是下步研究重點。再次,本研究只是對文本中的學業情緒做了總體的分類,并沒有對句子中的情緒實現更細粒度的文本分類,如自豪、滿足、焦慮、無助等。本研究后續將對學生反饋文本進行更細致的分類識別,更直觀地了解學生在學習過程中的學習情緒體驗。
基金項目:教育部在線教育研究中心2017年度在線教育研究基金(全通教育)課題“在線教育系統中學生反饋文本的情感分析技術與應用究”(2017YB126);中央高校基本科研業務費華東師范大學青年預研究項目“課堂環境中基于面部表情識別的師生情感模式及應用研究”(20l7ECNU-YYJ039)上海市科委科技攻關重大項目“上海教字化教育裝備工程技術研究中能力提升目”(17DZ2281800)。
作者簡介:馮翔(通訊作者),博士,副研究員,上海數字化教育裝備工程技術研究中心;邱龍輝,華東師范大學教育信息技術學系碩士研究生;郭曉然,華東師范大學教育信息技術學系碩士研究生。
轉載自:《開放教育研究》2019年 4月 第25卷 第2期
排版、插圖來自公眾號:MOOC(微信號:openonline)
新維空間站相關業務聯系:
劉老師 13901311878
劉老師 13810520758
鄧老師?17801126118
微信公眾號又雙叒叕改版啦
快把“MOOC”設為星標
不錯過每日好文?
喜歡我們就多一次點贊多一次分享吧~
有緣的人終會相聚,慕客君想了想,要是不分享出來,怕我們會擦肩而過~
《預約、體驗——新維空間站》
《【會員招募】“新維空間站”1年100場活動等你來加入》
《有緣的人總會相聚——MOOC公號招募長期合作者》
產權及免責聲明本文系“MOOC”公號轉載、編輯的文章,編輯后增加的插圖均來自于互聯網,對文中觀點保持中立,對所包含內容的準確性、可靠性或者完整性不提供任何明示或暗示的保證,不對文章觀點負責,僅作分享之用,文章版權及插圖屬于原作者。如果分享內容侵犯您的版權或者非授權發布,請及時與我們聯系,我們會及時內審核處理。了解在線教育,
把握MOOC國際發展前沿,請關注:微信公號:openonline公號昵稱:MOOC
?
總結
以上是生活随笔為你收集整理的lstm模型_基于LSTM模型的学生反馈文本学业情绪识别方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 获取当前北京时间API
- 下一篇: 数据仓库基础3-整明白粒度